当前位置:首页 > 报告详情

卞正达-OPEN-SORA高效低成本视频生成模型.pdf

上传人: 哆哆 编号:630934 2025-04-19 59页 10.42MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了卞正达,潞晨科技联合创始人、CTO,他师从新加坡国立大学尤洋教授,是全球超算领域的顶尖人才之一。他在高性能AI系统方面拥有7年的丰富经验,并作为核心开发者参与了Colossal-AI系统的研发。卞正达致力于推动高效能AI的技术进步,通过优化计算资源的使用来提升AI模型的训练和推理效率,在国际上具有深远影响。 卞正达介绍了OPEN-SORA高效低成本视频生成模型,这是一种开源的类SORA视频生成模型,可以将OpenAI的SORA模型引入社区。Open-SORA方案成本控制在7万元以内,可应用于电影制作、游戏和虚拟现实、艺术与创意探索、媒体制作、药物发现模拟、广告与营销、教育和培训等多个领域。 Open-SORA技术解析包括模型架构设计、类Sora训练方案、数据预处理和Colossal-AI的高效训练策略。模型训练步骤包括训练阶段和推理阶段。训练阶段利用预先训练的变分自动编码器(VAE)编码器进行视频数据压缩,使用潜在空间中的文本嵌入来训练STDiT模型。推理阶段从VAE的潜在空间中随机采样高斯噪声,输入噪声并提示嵌入到STDiT中进行去噪,将去噪后的特征传递到VAE解码器中以生成视频。 Open-SORA模型在视频生成效果展示中表现出色,可生成从短到长、从低到高分辨率、从低保真到高保真度的视频。卞正达还介绍了Open-SORA在潞晨云上的应用,用户可以方便地推理/微调专属视频大模型,实现从空白环境到网页部署应用的全流程。
"Open-Sora如何优化AI模型训练和推理效率?" "如何使用Open-Sora实现高效低成本视频生成?" "Open-Sora在视频生成模型领域有哪些创新和应用?"
客服
商务合作
小程序
服务号
折叠