《甲子光年:2024AIGC视频生成:走向AI创生时代—视频生成的技术演进、范式重塑与商业化路径探索(49页).pdf》由会员分享,可在线阅读,更多相关《甲子光年:2024AIGC视频生成:走向AI创生时代—视频生成的技术演进、范式重塑与商业化路径探索(49页).pdf(49页珍藏版)》请在三个皮匠报告上搜索。
1、1甲子光年2024AIGC视频生成:走向AI创生时代视频生成的技术演进、范式重塑与商业化路径探索出品机构:甲子光年智库研究团队:张一甲、宋涛发布时间:2024.03#page#川用子光年一类人有一类人原力觉醒的方式物理学家想学习上帝;数学家想反抗上帝;哲学家认为自已就是上帝;生物学家想造上帝的反工程师说都不用,我们再造一个。甲小姐:站在两个世界之间甲子光年2017.10#page#Part 01AIGC视频生成的技术路线与产品演进趋势目录甲子Part 02AIGC视频生成推动世界走向“AI创生时代CONTENTSWPart 03“提示交互式”视频制作范式重塑视频产业链甲子光年04Part文娱领
2、域有望开启第二轮投资浪潮#page#甲子光年1.1Sora让文生视频迎来“GPT-3”时刻OpenAI发布文生视频模型Sora,堪称视频生成领域的“GPT-3”时刻“炸裂”视频效果成为讨论热点春节假期甚至还未结束,Sora已引发全民关注“Sora”一词在微信指数及百度指数的关注度快速上升效果逼真:普通人一时难以分辨lhi2月16日微快速上开微信指数百度关键给购处于高位时长感人:60秒高清视频生成2月14日指验目环530254.22%母东家日开来家“百万”剪辑:堪比专业的镜头语言多模态:文字、图片、视频皆可生成视频H了数据来源:百度指数、#page#甲子光年1.2Sora的展现效果Sora模型展
3、现自身超强视频生成及剪辑能力,超出其他竞品一个段位能力项Sora其他模型StableVideo模型Gen2pika1.0W.A.L.TEmu VideoDiffusiol60秒20秒以内视频时长Pika LabsStablityAMeta开发团队Runway基本其他固定尺寸比例,1920*1080之间视频2023年11月2023年11月2023年11月视频长宽比模型例如16:9,的任意尺寸9:16,1:1等4-184)2-499物3秒生成情况768*44部分upscale分辨率576*10245125125128961080p视频清晰度256014404096*2160后达到4k是否开源开源非
4、开源非开源非开源非开源路语言理解能力强Sora的语言理解能力更强,可将简短的用户提示转换为更长的详细描述多模支持文本生成视频我态生联被图片生成视频成Sora还可以生成图片,最高可达到2048*2048分辩率求视频生成视频报文本编辑视频支持学权Sora通过插额技术,实现完全不同主题和场景构图的视频之间的流畅自然的过漠效果视频扩展视频仅支持向后向前/向后扩展编辑视频的无缝连接支持不支持Sora可生成具有动态摄像机运动效果的视频,随着摄像机的移动和旋转,人和场景元素在三维空间中保持一致移动联韩车业维部3D一致性Sora可以对短期和长期依赖关系进行建模,保持各个主体的时空连贯性和一致性独特路远程相干性
5、和物体持久性网模拟Sora以简单的方式模拟影响世界状态的行为,比如一个人吃完汉堡可以在上面留下咬痕至器世界交互能力收不支持数字世界模拟数据来源:甲子光年智库梳理,2024年#page#甲子光年1.2Sora的展现效果大模型训练的“暴力美学”在视频生成领域再次涌现卓越特性OpenAI发现视频模型在大规模训练时表现出许多有趣的“涌现”能力,使Sora能够从物理世界中模拟人、动物和环境。值得一提的是OpenAI官网所说的“theyarepurelyphenomenaofscale一它们纯粹是“规模现象”,这再一次验证了“暴力美学文/图像/视频生视频的功能视频剪辑功能3D一致性:确保景别基于时空双维度
6、的视频扩展不同主题场景视频的无缝一键进行风格渣染连接模拟数字世界数据来源:公开资料,OpenAI技术文件,甲子光年整理,2024年#page#甲子光年1.3Sora的出现意味着AGI的又一个里程碑时刻Sora意味着scalinglaw(规模法则)再次验证,推动文生视频进入“GPT-3”时刻Scalinglaw(规模法则)的再次验证:虽然Sora并不十全十美,但它通过scalinglaw和原有模型拉开了差距,为视频生成领域提供了另一条可口以走通的路线,推动行业进入全新的阶段口文生视频的“GPT-3”时刻:从发展阶段类比,Sora更像文本模型的GPT-3时刻。ChatGPT让人类看到实现AGI的维
7、形,Sora让实现AGI的目标又进一步。智能新世代:Sora向AGI再进一步信能比+00信能比300-1d5信能比100PT-1赋能生产力跃迁GPT-2审线:时间最下方文本生成模型文生视频模型推动人类向AGi近过第一个里程碑推动人类向AGi运过又一个里程碑社会经济发展的先进性、创新性,可持续性。数据来源:甲学光年智库,2024年;#page#甲子光年1.4Sora开启“明牌游戏”,推动AIGC应用时间轴进一步被压缩历史反复表明,一旦先行者模式验证,后来者整体的应用进程时间表将加快先行者往往要花费大量时间精力试错,一旦模式跑通,“明牌游戏”就开启了。后来者会有更好的参考系和聚焦方向。ChatGP
8、T后续的文本生成模型进展就说明了这一点。过去一年,AI文本生成和图像生成相继走向成熟,Sora的发布意味着视频生成应用走向成熟的时间比原先预计的更早出现,AIGC已经加速迈入视频生成阶段。对此。甲子光年智库更新了生成式A技术的成熟应用进程时间表。2024年可实现根据文本提示生成初版短视频,2025年有望实现根据文本生成初版长视频,并在视频制作环节真实使用落地。图2:生成式AI技术的成熟应用进程时间表图1:AIGC用户偏好使用的大模型产品类型H 甲工龙气营成然应用大横型成熟难度:初级费试接近成熟2020年之前2020年2022年2023年2024年E2025年E2030年E领域类型文本生成类51
9、.9%许编垃圾信息垂直领域的文基础文案据写图像生成类、。37.6文本领域初将营问答回应科研文字生成类32.4本代码领域单行代码补足多行代码生成%922水平更高视频生成头经稿(海报设mco9代码生成类26.2%图像领域建筑等)语音生成类22.4%根据交本生成祝频/3D/游可账个人戏领选9戏与电影多模态生成类17.1%制作环节数据来源:红秒资木甲子光年智库,2024年#page#page#甲子光年1.6Sora的技术原理Patch(时空编码思路)+DiT(Diffusion和Transformer模型的结合)+ScalingLaw(规模效应)Sora模型将视频压缩到低维空间(latentspace
10、),并使用时空补丁(Spacetimelatentpatches)来表示视频。这个过程类似于将文本转换为Token表示,而视频则转换为patches表示。Sora模型主要在压缩的低维空间进行训练,并使用解码器将低维空间映射回像素空间,以生成视频。口Sora使用了diffusion模型,给定输入的噪声块+文本prompt,它被训练来预测原始的“干净”分块。口Sora是difusiontransformer,而transformer在各个领域都表现出显著的规模效应。图:业内推测出的Sora技术架构图Pixel Video SpaceLower-Dimensional Latent SpaceCon
11、ditioningCleanLatentZERH.W.T.LatentSpacetimePatchesGPT-4DenoisedlatentNoised LatentZERHwxTZERHDifusionPatchifyBlockImagesorvideoframes 甲工龙部ofLargeVisionModels,甲子光年智库梳理,2024年#page#甲子光年1.6Sora的技术原理Sora模型的实施路径可拆分为四个部分Sora模型的实施路径有四个核心部分:口Part1:使用文生图模型(DALLE3)把文本和图像对联系起来Part2:视频数据切分为Patches,通过编码器压缩成低维空间表
12、示,解决了时间和空间两个维度的注意力交互(patch化是训练生成式模型的一个非常scalable和高效的图像/视频表征形式)。 中工龙甲子光1甲子光气Part3:Diffusion TransformerDenoisingDifusionProbabilisticModels(DDPMs):通过逐步添加噪声来模拟数据分布,然后学习邀向过程去除噪声,以生成新的数据。DiT是DDPM在图像生成中的应用LatentDifusionModels(LDMs):使用变分自编码器将图像压缩到低维表示,然后在低维空间中训练DDPM,这样可以降低计算成本,并使DiT成为基于Transformer的DDPM的适用
13、框架。Part4:DiT生成的低维空间表示,可通过解码器恢复成像素级的视频数据WgTE图:业内推测的模型实施路径解析Lower-DimensionalLatentSpacePixelVideo SpaceConditioningCleanLatentZERW.Latent SpacetimePatchesGPT-4Part2Noised LatentDenoised latentZ8RZERHDifusionPatchifyPart3BlockImages orvideo frames数据来源:Sora#page#甲子光年1.7Sora的局限性Sora仍存在三大方面局限性,会短期制约其商业化、
14、规模化应用店铝普适制约性伦理合规性技术局限性经济账与成本问题物理现实主义的挑战数据合规性需要依赖高质量、大规模的视频数据版权风险时空连续性的姚战有分监进态医提界服发发号施算力瓶颈问题AI安全问题人机交互的限制数据来源:甲学头年智库梳理,2024年#page#甲子光年1.7Sora的局限性视频生成处于用户满意但不推荐象限,说明现有视频生成工具虽然惊艳,但尚无法支持实际工作甲子星空坐标系:用户对AIGC产品不同应用场景的满意度与NPS值Y满意度排残者星辰象限光年象限领导者74海概设计72文本摘要日纳70文作68良索引攀维力公文本改写/广写56智能客康64科研学术2新势力先行者星云象限星团象限60(
15、25)(15)(5)S5253545XNPS数据来源:甲学光年智2023年问卷调研#page#甲子光年1.8Sora引发的世界模型之争Sora被OpenAI定义为“世界模拟器”,由此引发了世界模型的实施路线之争正方:OpenAI把它定义为一个“世界模拟器反方:仅根据文字提示生成逼真的视频,并不代表模型理解了物理世界!(World Simulator)OpenAI,图灵奖获得者和Meta首席我们相信这种能力将成为实现AG1的重要里程牌。英伟达高级研究科学家mFan更是直接断言“Sora是一NVIDIA.或世界模型。据驱动的物理引,是一个可学习的模拟器、大模型、大算力”nAI是自回归生成式路线“大
16、数据、建的暴力美学路线。从Chatcp到5o,都是这一思路的代表性产物。VSCore valuesOpenA把Scale作为核心价值:我们相信规模们的模型、系统、自身、当有路问时,就扩大规模不光T世界模型”数据来源:“大争议:杨立昆狠批Sora2024年用子光年智库梳理#page#Part 01AIGC视频生成的技术路线与产品演进趋势目录Part 02AIGC视频生成推动世界走向“AI创生时代CONTENTSPart 03提示交互式”视频制作范式重塑视频产业链甲子光年04Part文娱领域有望开启第二轮投资浪潮C0m#page#甲子光年2.1走向AI创生时代,改变世界刚刚开始AIGC视频生成开启
17、AI创生时代,重塑视频产业链仅仅是第一步甲子甲子光年智库将AIGC视频生成对世界的影响分为如下四个阶段L1:AI生产时代/AI业时代。AIGC引发内容相关产业的生产力变革,视频产业将是首先被重塑的领域,AI驱动内容领域迎来“工业革命”,大幅提升内容生产效率,形成第二生产力口L2:AI原生时代。AIGC将进“词不达意”阶段,重塑人、内容、机器间的生产关系品莱Y二成不旅管养Y“工至因工与电“至关我6一与交互关系。在这一阶段,AI渗透率将无限逼近人类在数字世界的生产活动行为边界人在数字世界可以做的事情,A都可以做口L3:AI创生时代。A与到生产制造,从人形机器人到世界模型,AI将逐渐突破人类为主语的
18、创造范,世界模型将创造人类智慧之外的“第二智慧体系”L4:AI文明时代。AI推动人类认知重塑,开启AI文艺复兴。AI会深度参与人类的物理世界和心灵世界,人类智慧与AI将互相影响、共同进化,人类文明进入“双生时代”,形成“AI的归AI,人类的归人类”的有序分工和共生模式。图:AIGC视频生成改变世界的进程展望WW用甲子完技术成热度双生文明终极2第二智慧体系第二语言第二生产力AIGC视频生应作范式提示交互改变世界的进程L1:AI生产时代L2:AI原生时代L3:AI创生时代L4:Al文明时代数据来源:甲学光年智库,2024年;#page#川甲子光年互,“业-122基于AIGC视频生成工具的提示交互式
19、视频制作范式将重塑传统视频制作流程口AIGC视频生成工具可对视频生产流程进行重塑,由传统视频制作范式进化到“提示交互式”新范式。“提示交互式”新范式相比传统范式具有三方面的重塑生成视频,省去了很多紫现步骤,尤其可将摄影、素材收集、后期等环节取消或缩短果科果应通干气,向用中性修主每个镜头的无限可能,而且剪辑过程可以随时发生节省制作成本和时间:传统视频制作流程需要投入较多的人力、物力和时间,而提示交互式视频生成的流程成本和时间较少,可在提示交互的飞轮中选代生成最终满足需要的内容。传统视频制作执行流程基于AIGC工具的提示交互式视频生成制作流程1策划剧本或提纲,规划视频的情节和内容。用户定目标受众和
20、传达的信息。最终中提示生成也点、演员、道具等资源筹备定拍摄计划和时内容反馈设备和技术团队生成交宜!用户提供关于提示交互实际拍摄视频素材飞轮拍摄最终视或描述性频内容文本。个视频剪辑和编辑重新家加音效、音乐、特效等元素生成早了党气后期色调、字幕等。终星现和染视数据来源:甲字光年智库,2024年#page#一甲子光年2.2L1-AI生产时代:AIGC视频生成将“多点开花”,开源是下个关键节点伴随开源模型的出现,AI视频生成将迎来多元化的入局者甲了光年AI+视频创业公司文生视频领续追切需要如Llama2的模型8正在进行技SKPENA让更多应用层公司书省从0-1的成本Cmop6开源?数字人技术提供商81
21、024808C网小冰LUSTEMetaAI+影视公司OpenAl承家商BSA非开源Googc相关赛互联网科技企业中Bai公百康名快手运Sora国未公测,根据当下的视频效果,模Tencent讯0360飞轮型及对应的技术路线与其他公司已经拉开差距,但猜其模型可能仿照ChatGPTC端用户不提供开源模型8888888888特事粉未来人人都会成为导演,每个人都会润有个人平台。数据来源:甲学光年智库,2024年;#page#page#甲子光年2.3L2-AI原生时代:视频成为“第二语言视频成为人类的第二语言,人类语言告别“词不达意”阶段口伴随视频生产成本的无限降低,以及视频可交互、可编辑、可定制的灵活能
22、力,人人可驾驭视频表达的时代到来。视频将成为人类的第二语言,大量用户会进行行为迁移原本用文字表达的场景,将用视频直接表达。口视频具有连续性,视频表达将不受限于“词汇量”,比文字表达拥有更丰富、更沉浸的特征,可以表达更准确的场景、承载更丰富的情感、抵达更深刻的共情。口文本与视频的无缝切换,让人类语言告别词不达意”、“意在言外”的阶段。图:人类传递信息的内容载体形态演变历程视频成为第二语言吉代媒体时代网络时代数字时代阶段AI原生时代视频语言:视频语言指利用视频和图像等视觉元素进行交流表达的语言形式。视频语言的特点:媒体刊物海互视频平台投放渠道牌度元宇宙、虚拟世界视觉化表达:与文字语言相比,视频语言
23、主要通过视觉影像来表达信息,通过图像、颜色、动作等元素传达更加直观、生动、丰富的信息。离线等端在线,双向交互变迁在线,单向实时、沉漫多媒体结合:视频语言通常结合了图像、声音、文字等多种媒体形式,丰富了表达手段和效果高门的内容生高门超的内容生产、生产、消费、拥有角色变迁内容消费者内容生产者3.情感共鸭:视觉和声音的传达方式更容易引起情产、消费者消费者三位一感共吗。多样化形式:视频语言可以呈现为电影、电视、文字+图片可交互、可编辑文字视频内容形态文字+图片短视频、动画等多种形式,适应不同场景和需求数据来源:甲学光年智库,2024年;#page#甲子光年2.3L2-AI原生时代:AI渗透率无限逼近人
24、类在数字世界生产活动行为边界数字人与视频生成大模型的结合,推动数字人发展进入L5级数实人与AIGC的结合一真是重要发展方向。在Sora出现之前,主要是数字人与文本生成模型(如GPT系列)的结合,生成虚拟角色的对话和互动内容,主要应用于虚拟助手、客服机器人、虚拟主持人等基于文本的交互和对话场景。口AIGC视频生成技术的发展将会推动数字人进入全新阶段。数字人与视频生成大模型(如Sora)的结合,提升了数字人的通真度和互动性,其应用场景会进一步拓宽,涵盖虚拟演员、虚拟口未来,数字人还会探索与多模态大模型的融合发展,继续提升仿真度和互动性、拓展应用场景、探索人机交互的新可能,丰富人们感如和改变世界的方
25、式。口“硅基生命”将加速到来,无限遥近人类在数字世界的生产活动行为边界。图:AIGC视频生成技术与数字人的结合推动硅基生命的探索拟人化程度终极:硅基生命L5: Species数字人可自主理解世界L4:Agent完全实现智能交互的数字人L3: Copilot语音交互智能化,但在十L2: Chatbot依赖算法驱动肤体、3L1: Tool力抽设备采视频生成大模型成体、表情和口型信息文本生成大模型十主要依赖人工制作形象场量:个性化和动画效果多模态大模型?源步代表动生成等化身进行实时真人服务等场景:平面展示等场景;视频录指等智能化水平W38数据来源:甲学光年智库,2024年;#page#甲子光年2.3
26、L2-AI原生时代:元宇宙相关产业将加速到来应用层与交互层在B端C端都将带来无穷想象空间口由于视频和C端有天然的联系,AIGC视频生成技术的快速发展将推动应用层和交互层的快速发展。通过简单的操作用户即可快速生成高质量的视频内容,将大大提升用户体验和参与度,推动元宇宙生态的蓬勃发展口因此,在传统AI技术栈上,应用层和交互层将诞生丰富的创新机会,在B端和C端都迎来无穷的想象空间。图:AIGC视频生成将加速元宇宙世界的内容构建泛娱乐虚扣人金打活购物应用层虚办公社交未来发度迎和交豆层人机交工通用场景初频生成中间层算法层频生成基础层平台层算力层数据来源:甲学光年智库,2024年;#page#甲子光年2.
27、4L3-AI创生时代:重塑人与机器的交互视频成为机器理解物理世界的主要媒介,推动AI与物理世界进一步融合个机交互进入规频语言时代。与传统人机交互相比,视频语言在信息表达形式、感知方式、交互体验和个性化定制等方面都有较大差异点,为用户提供了更加丰富、口直观和个性化的交互体验。M园不党口视频等多模态内容的信息含量更大、更多元,让机器更容易理解物理世界,让机器人真正成为数字世界与物理世界的桥梁。口AIGC视频生成与具身智能、工业视觉、工业元宇宙等方向的结合,将会推动A突破数字世界,与物理世界进一步融合。视频等多模态传递信息为主的人机交互文本传递信息为主的人机交互甲了完气(DD2)文本8销人机器人/机
28、器B阳片一口好()机版物理世界信息数字世界物理世界信息文本常碳)数字世界+物理世界交互语言:声音、动作、表情、场景.都可以作为机器理解人的指令的输入、鼠标、触摸屏等图像、声音等肌器将会主动理解世界信息表达:信息含量大且多样信息表达:信息含量低。传统人机交互以文字、图像,声音等为主要表以视频为载体,可以包含文字、动和直观。感知能力:传统人机交互主要依款于计算机对文字、图像、声音等信息动力,能够识别、理解和分析视频中的内容和情境。交互体验:实时、沉浸式交互。视频语言时代的人机交互更加动态和生动,用入设备与计算机进行交互,交互过程相对年然和直观。数据来源:甲学光年智库,2024年;#page#甲子光
29、年2.4L3-AI创生时代:数字科研推动新一轮“科学革命”AIGC生成技术与数字李生、仿真等融合,可驱动科技研发进入全新范式AIGC生成技术与数字李生、仿真等技术的融合可以探索出一条基于虚拟世界仿真的科技研发模型。这种模型可以通过在虚拟世界中建立退真的数字李生模型和仿真环境进行科技研究和实验,大大提高科研的效率,解放科研工作者的人力,降低综合科研成本。甲子光年智库将这种基于虚拟世界仿真的科技研发模型称之为数字科研模型,将通过数字科研模型进行研发的模式称为“数字科研”。0当前,AI已经在药物研发、合成生物等基础科学研究中得到广泛应用。A的进一步发展,将推动数字科研加快实现。未来数字科研模型有望成
30、为科学研究的通用基础设施,在各个学科普及,这将催生新一轮科学范式革命。了光图2:数字科研的实施步骤图1:AIGC在基础科学研究中应用于众多领域第四步第五步第一步牛川装行AIGC生成虚拟世界内容进行科技研究和实验物理世界验证和实践构建新型科研范式建立数字李生模型和仿真环境码数据来源:甲学光年智库,2024年;#page#甲子光年2.4L3-AI创生时代:世界模型创造人类智慧之外的“第二智慧体系两种世界模型:预测式模型和生成式模型H中子形成认知阶段世界模型的不同思路,将催生不同技术路线。伴随AI创生时代到来,我们将迎来人类大箱智慧之外的“第二智慧体系”。8深度学习的救据驱动流派的核心思路是:通过大
31、量数据模拟世界所得到的结果可能会比一个解析解更能反映世界的真实物理,Sora等深度学习的数据驱动流派。ChatGPT、Sora能够遥过大量模拟世界学习到世界规律,因此,用一个物理公式概括现实世界的思路并不一定正确,深度学习的数据驱动流派开启的“第二智慧体系”也一把钥匙,而非追求解析解Meta的V-JEPA第一智慧体系:预测式模型对世界的理解逻辑图1:大脑理解世界的四个环节设感知前的预测阶段,大糖基于内部模型、先前经验医配井形预测期望,预测可能能发生的情况。将路经1对世界的旺解湿称对外界刺激的感知,接受外部刺激,形成感知信号,世界模睡代表:Meta的V-JEPA。感知并进行感知输入。第二智慧体系
32、:生成式模型对世界的理解逻辑OpenAI的Sora在预测与感知的匹配阶匹配/思考更新预测,以使其与感知一致。在意义建构和理解阶段,大脑解释、理解感知至形成认知世界模睡代表:OpanAl的Sora3数据来源:甲学光年智库,2024年;#page#甲子光年2.5L4-AI文明时代:AI驱动文艺复兴交互行为、角色、载体形态的变化推动人类认知重塑,并形成新文化圈层口视频作为一种生动、直观的传播媒介,能够更好地激发人们的情感,与文字、图片相比,视频更能引发观众的深度共鸣和参与,口信息载体的变化会重塑人类的认知与观念,并将具有相同认知观念的人群逐步集合到一起,形成新的文化圈层,推动文化的变迁,并进一步推动
33、AI版本的文艺复兴。图:AI驱动文艺复兴甲了龙气AI文化:基于AI的新文化圈层的形成,具有相似认知观念的人群可能会因为共享相似的视频内容和信息,逐步形成新的文化圈层,形成共享的文化认同和价值体系,带来AI文艺复兴。AI文化新形态的视频认知重塑:随着信息载体的变迁,人们的认知和观念也会发生重塑。通过视频内容的传播和互动交认知重塑流,人们可能会形成共享的认知观念,理念和价值观的统一性会得到加强。信息传递载体形态变化:视频形态从传统的不可编组的单向输出版式转变为更加交互、可编信息传递载体变化辑和可定制的形式,便得视频成为了更加灵活多样的信息传递载体。角色变迁:由内容消费者变为AI原生居民,是内容沉浸
34、生产者、拥有者和消费者,角色变迁集内容生产、内容消费、内容拥有于一体。行为变迁:AIGC视频生成技术若能在视频领域规模化应用,将首先打破视频生行为变迁产的固化流程,让视频实现一键生成,实现视频生产的流程归一,行为归一甲了元气数据来源:甲学光年智库,2024年;#page#甲子光年2.5L4-AI文明时代:重塑人类文明YEYIVEI我以,我并并1与我图Y我照望波普尔的世界三元组是哲学家卡尔波普尔提出的概念,用于描述对世界的基本认知,包括三个要素:物理世界、心灵世界和符号世界。AI从符号世界出发,参与物理世界的方式是逐渐建立通用的世界模型,参与心灵世界的方式是生成无限的创意和想象。口最终,AI会深
35、度参与人类的物理世界和心灵世界,人类智慧与AI将互相影响、共同进化,人类文明进入“双生时代”,形成“A的归Al,人类的归人类”的有序的分工。图2:人与AI共建共生的“双生时代图1:AI主导的世界及其两条影响路径AI符号路径路径Al文明世界世界模型波普尔波普尔世界三元组世界三元组人类文明物理心灵物理心灵世界世界世界世界银耳具舌身意舌身意H数据来源:甲字光年智库,2024年;#page#Part 01AIGC视频生成的技术路线与产品演进趋势目录甲子Part 02AIGC视频生成推动世界走向“AI创生时代CONTENTSPart 03“提示交互式”视频制作范式重塑视频产业链甲子光年04Part文娱领
36、域有望开启第二轮投资浪潮#page#甲子光年3.1视频内容的两大类型:短视频和长视频IP内容一衍生,是视频内容价值链的主要逻辑链条,长视频与短视频是两大核心类型上游中游下游IP类内容类衍生类长视频类短视频类文学衍生品电影广告电视剧新闻资讯游戏演出动画微短剧中H动漫渠道综艺节目竖屏剧体育生活记录音乐上游产业更加注重版权的再中游产业偏向内容展示为主,影像类居下游产业偏向以内容为基础开发,特别是可改编成内容多,可以按视频内容的长度划分为短视的再开发的版权频和长视频两大类型数据来源:甲学光年智库,2024年;#page#甲子光年3.2传统视频产业链:完整产业链视频产业链包含七个关键环节,制作环节是最核
37、心环节,也是AI视频生成工具现阶段主要服务环节图:传统视频产业链及关键核心角色策划/映后产品链投资制作播映IP宣发开发剧本主要职责IP评估与交易刷本开发与策划投资评估内容生产制作内容宣传发行内容报放行生品开发制作公司制作公司制作公司衍生品设计制作公司视频平台视频平台核心角色文学平台编副工作室投资公司经纪公司营销公司数字平台行生品开发出版社策划工作室商务公司后期公司发行公司传统电视台海外视频平台游戏公司票务平台院线视频制作工具得甲了光气数据来源:甲学生智库。,2024年;#page#甲子光年3.3传统视频产业链:长视频与短视频的核心产业链环节长视频需覆盖完整视频产业链,短视频则更注重分发和变现口
38、长视频与短视频在产业链中的各自侧重点有显著性差异。长视频需要完整覆盖视频产业链,并非常注重制作环节的投入。短视频则对上游IP、策划、投资等环节依赖度极低,通常关注中下游的制作、分发与变现环节。图:长视频与短视频的核心产业链环节映后策划/IP投资制作播映长视频宣发开发剧本甲子光等制作分发变现短视频数据来源:甲学头年智库,2024年#page#甲子光年3.4不同形态视频细分领域的应用进程短视频正在进入AI原生时代,长视频正在进入AI生产时代AIGC视频生成技术在不同形态的视频内容领域的应用进程各不相同。概括而言,长视频领域AIGC视频生成技术仍然处于L1阶段,由于现阶段AIGC视频生成技术的局限性
39、,导致一些具有高度专业性的领域仅仅将其作为生产工具,例如为电影、剧集等提供素材来源,尚无法带来颜覆性重塑但会压缩原有产业链。而对于新闻这类需要高度准确性的内容,则暂时只能满足情景复现等少量场景。短视频领域则会首先面临AIGC视频生成技术的颜覆,甲子光年智库判断短视频领域将会进入L2即AI原生时代,短视频产业链将不复存在,而会诞生AI原生的短视频模式和平台。图:AIGC视频生成对不同视频形态的应用进程情况技术成热度长视频处在L1阶段短视频已迈入L2阶段终极短视频社交长视频工业足AI改变世界的进程L1:AI生产时代L2:AI原生时代L3:AI创生时代L4:AI文明时代#page#甲子光年3.5短视
40、频重塑后的产业链短视频进入AI原生时代,产业链被压缩,催生AI原生模式的新型平台口PC互联网时代催生出了长视频平台,移动互联网催生出了短视频平台,虽然短视频平台已经在大幅度应用AI技术进行赋能,但仍然存在显著的短视频生产工作流和短视频制作的角色分工体系AIGC视频生成技术将会打破短视频的原有产业链,大幅度压缩简化生产制作流程和角色分工,实现一键生成的allinone原生模式。口数字时代短视频的工作流数字时代短视频的角色分工AI原生时代的短视频平台AI原生平台AllinOne,链条缩短环节融合无序、沉浸、实时、互动、聚联式平台工作流角色分工AI克隆音色数字人口播视频生成图文成片素材生成个人平台数
41、据来源:甲学光年智库,2024年;#page#甲子光年3.5短视频重塑后的产业链新型制播一体的AI原生内容平台,有望颜覆短视频平台格局,每个用户既是导演又是平台口在AIGC视频生成对视频产业链的技术变革下,有望孵化出新一代的集短视频制作、分发、变现为一体的全新形态的视频平台。口新型的制播一体的AI原生内容平台应该是融合AI创意工具+AI原生视频工具+变现平台三大环节的AI原生短视频平台。口在实现AI原生范式的转换后,过去短视频平台和内容创作者将会出现一些变革-短视频平台:将会向A创意工具+AI原生视频工具+变现平台的题合式的平台转变,提供AI原生视频工具和流量分发平台。用户平台:用户将不仅仅是
42、作为生产者和消费者,真正做到人人都是导演型的创作者,并且人人都是一个小型的平台。个人用户可以建立个人平台,企业用户可以建立企业平台,直播机构可以建立直播平台。内容创作者的价值将更注重创意能力、解决实际问题的能力、个人IP影响力等。图:新型制播一体的AI原生内容平台的业务模式十AI创意工具AI原生视频工具分发变现平台负责创意的生产提供,既可以是B端用户也可以负责视频的生成制作,以提问交互的方式进行视频负责生成视频的流量分发与内容变现,将会催生端用户自行产分发平台、外围的直播平台、用户平台。B端用户C端用户用户以导演的角色进行交互式生成B自媒体机构创MCN故事剪铝工具A克程音色工具数字人工具快消品
43、P家收图文生成工具道染工具素材生成工具AIGC视频生成大模型去中心化平台#page#1甲子光年3.6长视频重塑后的产业链制作环节难度下降,将会助推产业链上游的创意环节和下游宣发播映环节重要程度上升好故事、好脚本、好平台将成为视频产业的核心竞争力口AIGC视频生成工具会降低视频制作的准入门槛、抛弃对专业设备的依赖、降低生产成本、提升制作效率。口随着制作环节难度下降,好故事、好脚本等产业链上游的创意环节将成为视频产业的核心竞争力。口AI视频产量的大幅增加需要更符合AI视频特征的播映平台,产业链也将更为注重下游宣发播映平台渠道的建设更新。口原有产业链的投资环节主要针对内容制造环节,未来文娱和技术投资
44、将走向融合。图:AIGC视频生成简化传统视频产业链映后策划/制作播映产品链P投资宣发开发剧本新核心环节创意生成环节视频生成环节宣发播映环节视频制作环节难度下降,成注重向下游寻更注重向上游拓展本降低,将会找发行资源和优质IP和创意能力推动产业链上播映渠道游和下游发展数据来源:甲学光年智库,2024年;#page#甲子光年3.6长视频重塑后的产业链重塑后的视频产业链将整合简化为三大环节:创意生成一视频生成一宣发播映创意生成环节视频生成环节宣发播映环节细节说明视须生成应用层,创意生成活原IP、策划/副本和映后开发环节。主要以讲好故事、做好创意策划为长园+好以需要整合文本生成和图像生成模型。文本+小说
45、视频+剪辑视频+3D视频+元宇击人机交互视频生成视频生成图片+设计图片*美术视频+动作图片+海托图片+设计主要包括制作环节中间层主要负责将故事由文本变为视频内容。文本+创意原接+音频+配乐视频+道染音频+配乐视频+剪辑需要具备长视频生成和音频生成模型。宣发播映音频生感文本生成模型音频生成与播映环节。视频生成主要负责将生成视频为容进行宣传图片生成模型和播放。基础层具备短视频生成、音频生成和图片生成模型长视频生成模型短视频生成模型本的手划图甲了完气数据来源:甲学头洋智库,2024年#page#甲子光年3.6长视频重塑后的产业链重塑后的视频产业链将会变为基于三大模型体系的全新产业链,并带来全新的生产
46、方式口重塑后的视频产业链将基于三大环节产生三大产业体系:基于创意生成模型的产业体系、基于视频生成模型的产业体系、基于宣发播映模型的产业体系。门用甲子光图:AIGC视频生成整合重塑后的全新视频产业链创意生成模型产业体系视频生成模型产业体系宣发播映模型产业体系长视频平台制作公司编国工作室制作公司动画公司短视频平台文学平台策划工作室营销公司数字平台经纪公司教育培训视频生成应用层算法层出版社行生品设计发行公司传统电视台后期公司广告公司院线游戏公司衍生品开发视频制作工具传媒公司票务平台视频生成文本生成工具厂商音频生成工具厂商图片生成工具厂商图片生成工具厂商文本生成+图片生成的大模型厂商平台层数据平台文本
47、数据类公司现频数据类公司图片数据类公司算力层AI芯片公司AIDC智算中心#page#甲子光年3.6长视频重塑后的产业链机会:创意生成体系IP版权生产交易开发一体化的平台有望成为新的发展机遇传统的版权生产与交易模式IP版权生产交易开发一体化的平台口传统IP版权的生产非常依赖作家的能力,而在版权交易环节通常是由使用AIGC技术后,版权生成环节可以直接使用大模型来生成内容,并版权持有者直接与使用方(如出版商、电影制作公司等)之间进行的且可以是文本文章、图片、音频剪辑、视频片段等各种形式的内容可交易范围较窄。版权交易不再是人与人之间的交易,而是创作者与技术平台之间的交易。因此,IP版权生产和交易开发一
48、体化的新型平台有望迎来机遇。生产出版发行用户消费内容上传IP版权生产模式创作者VS技术平台获取授权再开发内容推广IP版权交易模式数据来源:甲学光年智库,2024年;#page#甲子光年3.6长视频重塑后的产业链机会:创意生成体系白金作家群体不再成为稀有资源,未来人人都是小说家,中小型文学平台将可能迎来春天现阶段的作家群体分布呈现金字塔状态人人都是小说家口在传统视频产业链中,上游的IP环节中更注重处于金字塔顶端的白金使用AIGC模型摆写小说可以帮助小说作家快速生成大量文本,并为创家群体的维护管理与产品设计,大型文学平台通过奎断平台和作家资源,可以显著降低撰写小说的门槛,未来小说构建核心竞争力。家
49、将不再是特点人群,而是人人都是小说家。口AIGC视频生成重塑后的产业链体系中,创意生成体系将会更为注重底层伴随内容供给的增加,传统募头星断型的文学平台有望被打破,中小型文学平台的发展将迎来春天。出者。整合AIGC技术、打通AIGC小说生成流程的中小型文学平台有望进来发展的春天,图1:作家群体分布国国2:AIGC生产小说的创作流程BAIGC模型,可以是一可以是经过特被,食用害成孩主所白金作家行业的代表性人物,数量极少行业的中坚力量,数量不多大神作家0.004%普通作家行业的基础力量,数量众多9.4%售不境答考体编及被保变录早了光气公众作家行业的主要样体,数量度大90.6%数据来源:甲学光年智库,
50、2024年,#page#甲子光年3.6长视频重塑后的产业链机会:宣发播映体系传统制播分离模式将被抛弃,沉浸式互动点播云影院将成新机遇甲子光传统的宣发模式是制播分离的沉浸式互动点播云影院有望成为第三大发行体系在长视频领域中国传统主流视频宣发模式仅仅聚焦影院发行和网络视频平台发行两种口传统视频宣发模式导致下游直发播映环节过于依赖影院等传统平台或长视频平台。一直是小众市场着AIGC视频生成对视频产业链的重型,过去基于定宜发流程的发行模式有望向互式点播模式转型,以AI平台为核心,让用户深度参与电影前期图1:传统专业长视频发行模式:以美国电影发行为例沉漫式互动点播云影院上线,满足不同用户对故事走向的不印
51、下光气图2:“院网”并行的发行模式与新型点播云影院发行体系爱行公司业务多仅限于前两项永久内容生产映后开发发行放映甲了光永久永久线下渠道销售传统厂牌制片院线为主12月/3-6次12月线上渠道带货视频平台12月/10次24月/3次24月/3次个性化设计生产点映模式在中国市场尚是小众市场互动平台数据来源:甲学头年智库植理,2024年#page#Part 01AIGC视频生成的技术路线与产品演进趋势目录Part 02AIGC视频生成推动世界走向“AI创生时代CONTENTSW03Part“提示交互式”视频制作范式重塑视频产业链甲子光年Part 04文娱领域有望开启第二轮投资浪潮#page#甲子光年4.
52、1当经济体处于下行周期时,文娱产业迎来发展视频是文娱产业的核心内容形态,将会受到大经济周期的影响,迎来新的发展机遇美国在经济调整期时增长最快的行业是文娱业美国经济体文娱业在调整期后反而成为投资高增长领域图1:美国经济调整期时的热点行业图2:文娱企业各细分行业投资规模走势图(十亿美元)一电视节目一其他一电影一书信一音乐308CoS金融危机前金融危机后25%42.8牛复合增长率提高幅度20%5%15.805%复业教育经业企业咨询嘉扩张-10%60203050708091012141517-50%100%150%200%0%50%250%300%350%收入规模提高比例甲了完气服务行业的企业盈利能力
53、情况对比分析电话数据来源:美国经济分析局,甲子光年智库梳理,2024年,#page#甲子光年4.2中国文娱领域第一轮投资浪潮:2011-2017年第一轮投资浪潮中,文娱产业投资聚焦内容生态本身,而忽视了底层技术领域口中国文娱市场在2011-2017年是投资高峰期,在第一轮投资浪潮中,影视、视频、游戏是重点投资方向,其次是体育、音乐、动漫、新媒体等领域。口在第一轮投资浪潮中,投资机构更多聚焦内容生产类,而忽视了为内容生产机构提供底层技术工具的厂商图:2011-2017年主流企业泛娱乐投资领域趋势分布H中子光35重点领域30影视平均投资规模252015试水领域10传姆在线电台5时尚服饰0美食影音网
54、给文学拓展领域艺人经纪面像处开555525354555了投资企业数量数据来源:公异资料,甲子光年智库梳理2024年#page#甲子光年4.2文娱领域第一轮投资浪潮:2011-2017年BAT在第一轮投资浪潮的主投资方向是内容制作和播映平台,对创意生成、技术领域缺乏关注视频内容制作是BAT投资文娱的聚焦方向创意生成类和底层图像处理技术类缺乏关注口BAT都是先从泛娱乐产业链中游的内容制作环节介入,即视频和影视,内容制作类企业是过往投资重点,但IP,则本策划类和衍生品类等创意生成展上游和下游布局体系下的企业是第一轮浪潮中关注度不足的领域。图1:2011-2017年BAT泛娱乐投资历程分布图图2:20
55、11-2017年BAT企业影视行业投资企业数量分布图2017视频制作和招2016投资重点201522%201420132012失环节20112010投临菜屋兴知策划/剧本内容制作发行放肤衍生品投资售票备注:BAT主流投资机构包括岗讯,阿里,百度等三家公司对泛娱乐领域投资企业分布情数据来源:甲子光年智库梳理,2024年#page#甲子光年4.3文娱领域有望开启第二轮投资浪潮经济周期调整与技术革命双重加持将推动以视频为核心内容形态的文娱产业迎来第二轮爆发期口文娱领域在经历第一波投资高峰期后,在2018年开始进入下行周期。在宏观经济周期与A技术革命的双重加持下,文娱领域有望开启第二轮投资浪潮。口在文
56、娱领域的第一轮投资浪潮中,投资机构主要聚焦视频产业链的制作和播映环节,标的企业以影视公司、视频播映平台、影视项目等为主。口在文娱领域的第二轮投资浪潮中,投资方向将会更多聚焦底层技术及与技术相融合的内容公司,标的企业将以AI视频工具、创意生成类企业、新型宣发播映平台等为主8甲子光图:以视频内容形态为核心的文娱领域投资周期曲线图投资规模第一波第二波文娱投资高峰期文娱投资高峰期AI视频工具内容生态创意生成产业播映发行宣发播映平台AI技术+内容型时间20112024E20172030E#page#甲子光年4.3文娱领域有望开启第二轮投资浪潮第二轮围绕视频内容为核心的投资热点领域,将以视频内容+技术的生
57、态型公司为主口在第一轮文娱领域的投资浪潮中,投资主流形式是以视频内容项目作为投资标的,如投资某一个电影或电视剧等,未来投资对象将会从投资内容项目为主变为投资企业股权为主,被投企业的业务范围将由内容生产为主变为AI技术与视频生成相结合。过去公司:单一内容型现在公司:内容生态型未来公司:AI技术+内容型未来视频领域的公司应该注重A技术+内容型的构筑。现在的主流视频内容公司则以多个子行业联动形式。过去传统视频等内容公司主营业务以某一个子行业/领试图以打造内容生态体系的方式开展主营业务。不能仅聚焦视频的应用层,而是视频生成应用层-域为主。中间层,基至结合视频生成基础层进行布局。文学中游影视视频生成应用
58、层游戏标生品文学文学短视频游戏影初广告影视算法层游戏行生品提频生成中间层影视提质生皮基社员)影规影视平台层数据平台算力层AI芯片公司AIDC智尊中心数据来源:甲学光年智库梳理,2024年;#page#甲子光年4.4AIGC视频生成技术的投资价值和方向大厂适合全都要,初创企业适合介入应用层/中间层,央国企适合从底层基础设施开始布局当尊号国“一回中出到号要不变限“业不以号中“线身首不的一每重口台层和基础层。日州 甲子龙气图:AIGC视频生成领域适合投资入局的技术方向生甲了光气创意生成应用视频生成应用宣发播块应用初创企应用层业适合甲了龙气入局应初频+3D文本+剧本文本+小说现频+剪相+元字由用层或视
59、频生成销送理图片+设计图片*美术视版+特效视频+动作图片+海报图片+设计中间层文本+策划首频+配乐视频+剪辑文本+创高机频+渔外音频+配乐算法层音频生成大模型厂商音频生成大模型厂商文本生成大模型厂商图片生成大模型厂商全产视频生成业销长视频生成大模型厂商短视频生成大模型厂商基础层央国企布局图片生成大模型厂商适合入的多模局算力层、平台层和平台层数据平台烟2基础层算力层AI芯片公司AIDC智算中心数据来源:甲学光年智库杭理,2024年;#page#甲子光年下一步研究计划甲子光年智库将推出2024中国AI+视频行业发展研究报告,征集案例合作,欢迎咨询口甲子光年智库将推出AIGC视频生成系列报告,下一步
60、要推出的报告为2024中国AI+视频行业发展研究报告,现开展典型案例征集合作,欢迎咨询报名。Part 1Part2-Part3-Part4-机遇:Sora模型爆火,带来AI+视频领域需求:内容行业迎来属于自己的“寒实践:中国本土企业具备成为全球一未来:视频信息可能成为更优质的信的新潜力武纪爆发流企业的潜力息载体3.1中国AI+视频全景图谱4.1趋势展望视频信息的生产成本迎来视频信息1.1AIGC领迎来巨变:DiT模型点燃行业补里2.1行业场景的深度分析:干行干面,泛内客行业里来生产方式巨发对“H+调频”的亮度关注正实现全世界文化与与交为容社区:大星玩法出明,行业爆款在师全方位推提中国Al+视张
61、企业人线更各大锈响低或之家品配务来须进rTech企业提快面优居的1.2变化中的机遇:文生视频,基至多模态视务迎来请多关注3.2中国AI+视频的优质实践者:用AI开启“人人发4.2挑战与风验:内容的监管面临巨大挑战,算力都是up主”的时代Sera与其他企业的技术差定分析Bl+规督可视化内区AI+阅绩行业先行企业价经大量垃技内2.2步步为营:多模态*多场景,产业呈现L1-实线企业的技术背题,商山L4的阶梯发各行业标杆性案例的展示1.3行业面对的新挑战:要么Allin,要么出清1会分机行业巨头路间离源多运数据来源:甲学光年智库,2024年;#page#1甲子光年THAIKG谢谢北京甲子光年科技服务有限公司是一家科技智库,包含智库、媒体、社群、企业服务版块,立足于中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,致力于推动人工智能、大数据、物联网、云计算、AR/VR交互技术、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地智库院长甲子光年创始人商业合作负责人313关注甲子光年公众号扫码联系商务合作#page#