《计算机行业专题:视频大模型奇点时刻加速到来-240820(26页).pdf》由会员分享,可在线阅读,更多相关《计算机行业专题:视频大模型奇点时刻加速到来-240820(26页).pdf(26页珍藏版)》请在三个皮匠报告上搜索。
1、0视频大模型奇点时刻加速到来证券研究报告|行业专题计算机行业投资评级|优于大市(维持)2024年8月20日证券分析师姓名:陈涵泊资格编号:S0120524040004邮箱:研究助理姓名:王思邮箱:1请务必阅读正文之后的信息披露及法律声明。视频大模型迎来视频大模型迎来SoraSora时刻,生产力工具蓄势待发。时刻,生产力工具蓄势待发。自自SoraSora发布以来,国内外已有十多家公司发布或更新视频生成模型。发布以来,国内外已有十多家公司发布或更新视频生成模型。客观对比:与Sora差距缩小,抢占用户或为未来主线。国内外之间的差距正在逐步缩小,视频时长、分辨率等基础功能具有复制性,未来竞争或向抢占用
2、户、提升粘性等方向迁移,从而需要保障生成质量更高的可用视频,使得视频一致性更高、文本指令遵循更准确、物理真实模拟能力更强。主观对比:视频质量提升显著,离物理世界模拟器仍有距离。文生视频领域,视频画面普遍清晰,而在动作幅度与物理还原度方面差异较大,我国Vidu、清影或已处于视频生成大模型第一梯队,生成时间相对其他模型倍数减少,且在动作幅度、物理还原度等复杂任务完成性较好;图生视频领域,整体效果优于文生视频,国内与国外差距进一步缩小。视频大模型具备商用潜力,下游应用正在储能。未来随着用户习惯的培育以及算力基础设施的完善,视频大模型的或者办公、广告、电影、游戏等多领域具有广阔的前景。算法、算力、数据
3、三要素,视频大模型通往算法、算力、数据三要素,视频大模型通往AGIAGI的必经之路。的必经之路。算法:视频生成模型算法主要由基于SD逐帧生成和基于时空Patches两种范式构成,是效率与效益的比拼。前者模型更容易训练,而视频内容一致性要差一些,长视频训练存在困难;后者训练成本更高,但是生成视频的长度与一致性更容易得到保障。算力:以Sora为例,一定条件下测算,Sora训练算力需求是GPT-4的4.5倍,而推理算力需求接近GPT-4的400倍。数据:高质量数据是模型能力的保障,而用户数量或为开启模型迭代“数据飞轮”的关键。投资建议:投资建议:建议关注(1)视频大模型厂商:科大讯飞、商汤、云从科技
4、、格灵深瞳、拓尔思、昆仑万维等。(2)算力:海光信息、寒武纪、景嘉微、中科曙光、浪潮信息、工业富联、神州数码、拓维信息、四川长虹等。(3)接入大模型的应用标的:金山办公、万兴科技、福昕软件、虹软科技、彩讯股份、焦点科技、润达医疗、金证股份、泛微网络、金蝶国际等。风险提示:风险提示:商业化落地不及预期;国内大模型在缺乏算力支持的情况下迭代速度放缓;国内大模型技术路线产生分歧。核心逻辑8X9WaYaYeZ9WeUcW6MbP6MsQqQpNsOkPmMxPeRoMmN6MoOvMMYqRmNwMpOoO2请务必阅读正文之后的信息披露及法律声明。01020304视频的大模型迎来Sora时刻,生产力工
5、具蓄势待发算法、算力、数据三要素,视频大模型通往AGI的必经之路投资建议风险提示目 录CONTENTS3请务必阅读正文之后的信息披露及法律声明。01视频大模型迎来Sora时刻,生产力工具蓄势待发1.1 国内外视频生成模型纷至沓来1.2 客观对比:与Sora差距缩小,抢占用户或为未来主线1.3 主观对比:视频质量提升显著,离物理世界模拟器仍有距离1.4 视频大模型具备商用潜力,下游应用正在储能4请务必阅读正文之后的信息披露及法律声明。资料来源:智象未来官网,爱诗科技Alsphere微信公众号,智谱清言官网等,德邦研究所1.1 国内外视频生成模型纷至沓来 根据APPSO微信公众号,自Sora发布以
6、来,国内外已有不少于十家公司不少于十家公司发布或更新视频生成模型。以7月为例:7月31日,Runway宣布GenGen-3 3可支持图生视频。用户可以使用任何图片作为视频生成的首帧,上传的图片既可以单独使用,也可以使用文本提示进行额外指导。7月26日,智谱智谱AIAI版版SoraSora清影清影发布发布,人人可用、半分钟快速创作视频的时代已来。清影理论上仅需30秒即可完成6秒1440960清晰度高精度视频的生成,展现出亮眼的推理速度,不仅具备高效的指令遵循能力,还具有内容的连贯性和调度灵活性。7月24日,爱诗科技将视频生成模型更新至爱诗科技将视频生成模型更新至PixVersePixVerse