《2024大模型Sora解析及Sora加持下全球文生图&视频投资机会分析报告(19页).pdf》由会员分享,可在线阅读,更多相关《2024大模型Sora解析及Sora加持下全球文生图&视频投资机会分析报告(19页).pdf(19页珍藏版)》请在三个皮匠报告上搜索。
1、2023 年深度行业分析研究报告 内容目录内容目录 1OpenAI 视频大模型 Sora:不止于视频,剑指世界模型,初步理解物理规律.4 1.1 Sora 问世:OpenAI 发布视频生成大模型,剑指物理世界通用模拟工具.4 1.2 技术路径:基于 Patches 视觉特征标记的 Diffusion Transformer 模型.4 1.3 算法实现:Patches 实现更灵活的采样+更优化的构图.5 1.4 功能解读:文生视频+视频编辑,确保“物理世界常识”始终在场的通用模拟工具.7 2.文生图/视频海外标杆:AI 应用端焦点,技术及产品迭代迅速.8 2.1 文生图/视频为当下 AI 应用焦
2、点:相关产品流量排序名列前茅.8 2.2 文生图-T2I(Text to Image):Diffusion 模型奠定文生图商业化基石,新老玩家广泛入局.9 2.2.1 Adobe:老牌创意软件巨头向 AIG 出征,发布下一代 Firefly 支持多种文生图功能.10 2.2.2 Midjourney:文生图模型新锐,提升创意设计工作效率,广泛实现商业化落地.11 2.3 文生视频-T2V(Text to Video):创意产业工作流变革前夜,MGC 时代大幕下的先行者.11 2.3.1 Pika:AI 初创公司发布 1.0 工具,支持一键生成 3 秒共计 72 帧视频.13 2.3.2 Run
3、way:拥有最早商业化的 T2V 模型之一-Runway Gen-2.14 3.文生图/视频国内映射:万兴、美图头部标杆,相继发布视觉大模型,订阅收入占比势能向上.14 3.1 万兴科技:发布“天幕”大模型整合 T2V/I 能力,AI 赋能订阅及续约率双增.14 3.2 美图公司:自研视觉大模型 MiracleVision 4.0,订阅业务收入占比逐年增长.18 QV0X1XFVTUEYTV7NdN8OnPqQtRsOkPnNmOiNqRwPbRnMrQwMsQoOuOtPrM 图表目录图表目录 图表 1:OpenAI 发布文生视频大模型 Sora.4 图表 2:Sora 技术路径:基于 Pa
4、tches 视觉特征标记的 Diffusion Transformer 模型.5 图表 3:Why Patches?更灵活的采样+更优化的构图.6 图表 4:基于 DALL E 3 DCS 的描述性标题重述与基于 GPT 的标题扩写.7 图表 5:Sora 功能一览:文生视频+视频编辑,确保“物理世界常识”始终在场.8 图表 6:Midjourney 高居 AI 产品流量榜首.9 图表 7:AI 图片生成约占前十 AI 产品流量的 74%.9 图表 8:T2I 模型近年来加速迭代演进.9 图表 9:Diffusion 模型的前向阶段噪声化和逆向阶段去噪过程.10 图表 10:Adobe Fir
5、efly 目前能够支持的部分 AI 功能.10 图表 11:Midjourney 文生图创意作品已广泛商业化落地.11 图表 12:Latent Video Diffusion 模型基于文字描述与初始图像编辑视频.12 图表 13:以 Sora 为代表的 T2V 大模型有望深刻改变影视产业工作流.13 图表 14:Pika 1.0 工具主要功能.14 图表 15:Runway Gen-2 主要功能.14 图表 16:万兴大模型“天幕”宣传片中透露七大 AI 功能,涉及视频、图片、音频等多模态领域.15 图表 17:2023 年以来万兴 T2V/I 产品相继更新/发布.16 图表 18:万兴旗下
6、 T2V/I 多款拳头产品已进行 AI 功能更新,价格/月活/收入数据相对积极.17 图表 19:AI 赋能万兴订阅收入占比及订阅续约率双双逐年增长.17 图表 20:美图发布 MiracleVision 4.0 赋能多行业生产力工作流,开放 API 支持 T2I/I2I 功能.18 图表 21:2020 年以来美图订阅业务收入占比逐年增长.19 图表 22:推荐关注创意软件厂商万兴科技、美图公司;AI 技术龙头虹软科技、科大讯飞.19 1.1 Sora 问世问世:OpenAI 发布发布视频生成大模型视频生成大模型,剑指,剑指物理物理世界通用模拟世界通用模拟工具工具 2 月 15 日,Open