《AIGC行业专题报告:从文生图到文生视频~技术框架与商业化-231102(73页).pdf》由会员分享,可在线阅读,更多相关《AIGC行业专题报告:从文生图到文生视频~技术框架与商业化-231102(73页).pdf(73页珍藏版)》请在三个皮匠报告上搜索。
1、证券研究报告国海证券海外SEALAND SECURITIES2023年11月2日AIGC专题报告:从文生图到文生视频技术框架与商业化评级:推荐(维持)尹芮(证券分析师)陈梦竹(证券分析师)S0350521090003S#page#尚国海证券相关报告最近一年走势从Roblox进化看AIGC游戏未来一Roblox(RBLX.N)深度复盘:二十年沉60%淀,四阶段演绎(增持)*海外*杨仁文,马川琪,陈梦竹,姚蕾-2023-50K09-24创新奇智(02121)动态研究报告:业绩维持高速增长,“AI+制造”赋能-2023-09-14长期发展(买入)*IT服务I*陈梦竹30%20%商汤-W(00020)
2、2023H1业绩点评:生成式AI有望成为业务新驱动,整体亏损收窄(增持)*IT服务l*陈梦竹-2023-09-08网易-S(9999.HK)公司动态研究:利润超预期,新游表现强劲,期待后续业绩释放(买入)*游戏*陈梦竹,尹芮2023-09-03焦点科技(002315)2023H1财报点评:业务调整拖累营收增速,利润端80-60-8ZOZ-图审网互(V)斗证话港股互联网指数恒生指数相对恒生指数表现(%)表现1M3M12M-8.6014.7950.09港股互联网-5.72-10.231.47恒生指数请务必阅读报告附注中的风险提示和免责声明#page#核心提要武国海证券ALANDSECURITIE1
3、、底层模型技术框架梳理文生图和文生视频的底层技术框架较为相似,主要包括GAN、自回归和扩散模型三大路径,其中扩散模型(Difusionmodel)为当前主流生成模型,多个指标对比下综合占优,能在较为可控的算力成本和较快的速度下生成具备多样性、高质量的图像:图像质量:扩散模型自回归模型GAN模型。FID值(FrechetInceptionDistancescore)是用于评估模型生成的图像质量的指标,是用来计算真实图像与生成图像的特征向量间距离的一种度量。FID值越小,可以认为图像质量在一定程度上越优。从不同模型的FID得分来看,扩散模型平三2+理日回“2+喜务面“I独森“士理确一再NVO在NV
4、O扩散模型自回归模型。生成速度与参数量级为负相关关系。4训练成本:自回归扩散模型GAN模型。由于参数量级较小,GAN模型训练成本小且开源模型多,仍具备一定优势。而自回归模型参数量级较大,整体训练成本更高。在单张A100GPU下,120亿参数的DALL-E需要18万小时,200亿参数的Parti更是需要超过100万小时,扩散模型参数量在十亿级别,整体训练成本较为适中。2、商业化模式及成本拆分文生图商业化模型:当前主要的商业化方式包括基于GPU时间/生成次数/API接口调用/个性化定价等方式。根据我们调研,以Midjourney为例,单张图片生成成本约0.03-0.04美金,单张收入约0.05美金
5、,毛利率约30%40%,净利率约20%。文生图领域整体创业门槛低于大语言模型:模型层看:图像生成领域已有生成质量较高的开源预训练模型StableDiffusion,且SD具有较为丰富的开发者生态,有许多插件供选择。创业公司可基于StableDiffusion基础版本进行进一步调优和个性化数据训练。2成本端看:从主流模型参数规模看,文生图参数量级多在1-10B之间,而通用大模型入门级门档达到了70B,文生图整体参数量级较小,成本远低于通用大模型。通过调研文生图初创公司:实际小团队利用开源模型,初期在用户不到1万情况下甚至无需购买A100,通过购买RTX30140系列、IBS3060(50001w
6、/张)也可以启动。我们对文生图推理算力需求也进行了测算,以10亿级参数量的模型、在100万DAU的用户量级为例,若想控制单次推理延退时间,需部署约143张A100,整体芯片算力需求低于大语言通用模型。文生图商业模式仍存疑问,长期竞争需要技术+产品+场景能力结合突破:1对于垂类AI应用:短期看头部应用通过技术/产品/成本/数据等优势突破,在C端率先开启变现,长期看针对垂类场景C端天花板相对明确,搭建工程化能力可技术输出到B端场景,探索更多变现可能。2对于现有应用叠加AI功能:短期通过AI功能引入提升产品体验和用户粘性;长期看基于现有高频场景,用户壁垒更强、不易流失,用户ARPU和付费率有望提升。