2024大模型Sora解析及Sora加持下全球文生图&amp视频投资机会分析报告-三个皮匠报告

1、2023 年深度行业分析研究报告内容目录内容目录 1OpenAI 视频大模型 Sora：不止于视频，剑指世界模型，初步理解物理规律.4 1.1 Sora 问世：OpenAI 发布视频生成大模型，剑指物理世界通用模拟工具.4 1.2 技术路径：基于 Patches 视觉特征标记的 Diffusion Transformer 模型.4 1.3 算法实现：Patches 实现更灵活的采样+更优化的构图.5 1.4 功能解读：文生视频+视频编辑，确保“物理世界常识”始终在场的通用模拟工具.7 2.文生图/视频海外标杆：AI 应用端焦点，技术及产品迭代迅速.8 2.1 文生图/视频为当下 AI 应用焦

2、点：相关产品流量排序名列前茅.8 2.2 文生图-T2I（Text to Image）：Diffusion 模型奠定文生图商业化基石，新老玩家广泛入局.9 2.2.1 Adobe：老牌创意软件巨头向 AIG 出征，发布下一代 Firefly 支持多种文生图功能.10 2.2.2 Midjourney：文生图模型新锐，提升创意设计工作效率，广泛实现商业化落地.11 2.3 文生视频-T2V（Text to Video）：创意产业工作流变革前夜，MGC 时代大幕下的先行者.11 2.3.1 Pika：AI 初创公司发布 1.0 工具，支持一键生成 3 秒共计 72 帧视频.13 2.3.2 Run

3、way：拥有最早商业化的 T2V 模型之一-Runway Gen-2.14 3.文生图/视频国内映射：万兴、美图头部标杆，相继发布视觉大模型，订阅收入占比势能向上.14 3.1 万兴科技：发布“天幕”大模型整合 T2V/I 能力，AI 赋能订阅及续约率双增.14 3.2 美图公司：自研视觉大模型 MiracleVision 4.0，订阅业务收入占比逐年增长.18 QV0X1XFVTUEYTV7NdN8OnPqQtRsOkPnNmOiNqRwPbRnMrQwMsQoOuOtPrM 图表目录图表目录图表 1：OpenAI 发布文生视频大模型 Sora.4 图表 2：Sora 技术路径：基于 Pa

4、tches 视觉特征标记的 Diffusion Transformer 模型.5 图表 3：Why Patches？更灵活的采样+更优化的构图.6 图表 4：基于 DALL E 3 DCS 的描述性标题重述与基于 GPT 的标题扩写.7 图表 5：Sora 功能一览：文生视频+视频编辑，确保“物理世界常识”始终在场.8 图表 6：Midjourney 高居 AI 产品流量榜首.9 图表 7：AI 图片生成约占前十 AI 产品流量的 74%.9 图表 8：T2I 模型近年来加速迭代演进.9 图表 9：Diffusion 模型的前向阶段噪声化和逆向阶段去噪过程.10 图表 10：Adobe Fir

5、efly 目前能够支持的部分 AI 功能.10 图表 11：Midjourney 文生图创意作品已广泛商业化落地.11 图表 12：Latent Video Diffusion 模型基于文字描述与初始图像编辑视频.12 图表 13：以 Sora 为代表的 T2V 大模型有望深刻改变影视产业工作流.13 图表 14：Pika 1.0 工具主要功能.14 图表 15：Runway Gen-2 主要功能.14 图表 16：万兴大模型“天幕”宣传片中透露七大 AI 功能，涉及视频、图片、音频等多模态领域.15 图表 17：2023 年以来万兴 T2V/I 产品相继更新/发布.16 图表 18：万兴旗下

6、 T2V/I 多款拳头产品已进行 AI 功能更新，价格/月活/收入数据相对积极.17 图表 19：AI 赋能万兴订阅收入占比及订阅续约率双双逐年增长.17 图表 20：美图发布 MiracleVision 4.0 赋能多行业生产力工作流，开放 API 支持 T2I/I2I 功能.18 图表 21：2020 年以来美图订阅业务收入占比逐年增长.19 图表 22：推荐关注创意软件厂商万兴科技、美图公司；AI 技术龙头虹软科技、科大讯飞.19 1.1 Sora 问世问世：OpenAI 发布发布视频生成大模型视频生成大模型，剑指，剑指物理物理世界通用模拟世界通用模拟工具工具 2 月 15 日，Open

2024大模型Sora解析及Sora加持下全球文生图&视频投资机会分析报告（19页）.pdf

相关报告