《量子位智库:2024年度AI十大趋势报告(98页).pdf》由会员分享,可在线阅读,更多相关《量子位智库:2024年度AI十大趋势报告(98页).pdf(98页珍藏版)》请在三个皮匠报告上搜索。
1、序言从今年起,量位智库做了个改变在过往三年连续围绕整个前沿科技来提供年度科技趋势参考后,今年聚焦在了AI。过去,AI是前沿科技主轴上的核技术。现如今,AI正在吞噬整个世界、整个产业、全部赛道。没错,AI已经完全成为了科技发展主旋律。尽管有诸多类,如开始类互联命,到后来类电(第次业)命,再到现如今最宏的种说法是:第次地球明命。所以不论如何,可AI正在展开的冲击、带来的影响是如何全深刻,甚度被以科幻的式谈论它。AI当然不是科幻,AI先是科学,其次是项程,最后正在变成种业。这就意味着AI不仅可以观测、可以学习,还能预测或者更准确来说,我们就是站在新进展新信息的最前沿,站在产学研交汇地带,把正在从学术
2、研究进产业变程序的技术向,总结并举例说明呈现给所有。在今年,我们还通过更具规模的数据统计,在AI应的创新创业和投资,也提供了结论性参考,希望对整个产业提供第三视下的助益。总之,希望这份年度趋势报告,能够对你在岁末年初了解时代技术进展提供最直接的帮助。处技术航海时代,即便你未能出海探索,也希望你能感知到潮涌动的向。量位智库总裁科技合作伙伴*以上排名先后顺序目录2024年度AI趋势PART 1技术篇趋势 模型创新:架构优化加速涌现,融合迭代势所趋趋势 Scaling Law泛化:推理能成皇冠明珠,倒逼计算和数据变趋势三 AGI探索:视频成点燃世界模型,空间智能统虚拟和现实/02/10/16趋势四
3、AI应格局:第轮洗牌结束,聚焦20赛道5场景趋势五 AI应竞争:多领域竞速运营于技术,AI助兵家必争趋势六 AI应增:AI+X赋能类产品快上,原AI爆款难求趋势七 AI产品趋势:多模态上,Agent席卷切,度个性化呼之欲出PART 2产品篇/25/35/45/50结语趋势 AI智变千百业:左变产,右重塑业态趋势九 AI业渗透率:数据基础决定初速度,需求成为加速度趋势 AI创投:投融资太效应明显,国家队出频率提升千百业AI优秀落地案推荐PART 3业篇/54/75/78/8701TECHNOLOGY?1.架构层创新助解决算瓶颈现实问题2.创新混合架构挑战Transformer垄断技术原理1.路径
4、:循环神经络及其变种(以RWKV为代表)2.路径:状态空间模型(以Mamba为代表)3.路径三:层次化卷积模型(以UniRepLKNet为代表)4.路径四:多尺度保持机制模型(以RetNet为代表)5.路径五:液体神经络模型(以LFM为代表)?Scaling LawScaling Law?技术原理1.AI模型的性能强烈依赖于规模2.全新的Scaling Law?AGIAGI?技术原理1.视频成:从扩散模型出发2.世界模型:从动驾驶领域到整个世界3.具智能:回到现实世界,回到产业链4.空间智能:连结具智能与空间计算/02/02/03/05/06/07/08/10/13/16/19/20/22?0
5、21.架构层创新助解决算瓶颈现实问题Transformer架构是前应最泛的主流模型架构,注意机制(Self-Attention,SA)则是Transformer架构的核它允许模型进并计算,在序列中线性地直接捕捉任意两个位置之间的关联权重,幅提模型能上限。但另,这也使模型的算需求、计算复杂性和消耗资源成本都随参数增加呈指数级增,在规模任务中快速触达天花板。图:Transformer模型架构,歌、多伦多学2024年以来,随着模型参数量的速规模化以及训练与部署的深落地,Transformer架构的上述弊端愈发显著,成为助推全球性算紧缺的重要因素,也为模型的端侧落地提出了挑战。为寻求突破,对模型架构的
6、创新性探索逐渐成为不容忽视的趋势。2.创新混合架构挑战Transformer垄断2017年Attention Is All You Need出世提出Transformer架构以来,7年已过。AI业对Transformer的路径依赖引发了越来越多的“过时”争论,体现出渐迫切的架构创新需求。2023年以来,RWKV和Mamba引起热议,多种新架构加速涌现,世界范围内的学者从多个向努,试图在保留Transformer架构优势的基础上创新性引其他架构特点,解决算开销问题,Transformer的绝对统治地位得到挑战,兼采众家之的混合模型(Hybrid)已成未来趋势。模 型 创 新01若能突破Trans
7、former在算和数据需求的限制,新架构有望在然语处理和计算机视觉领域引发新轮技术新。明势创投Transformer架构、Next-Token Prediction和Scaling Law是当前模型的算法基,但这些领域也越来越需要新的突破,以构建强且效的新代基础模型。强意味着卓越的性能、泛化能和抵抗幻觉能;效则指低成本、效率和低能耗。只有具备这两特质,智能才能真正成为和电样的基础设施。微软亚洲研究院这些新兴模型架构不仅在性能上可以与Transformer模型竞争,还在内存效率和可扩展性上展现出优势。梅花创投杨颜媛表,部分新架构更易于进并计算,能够充分利现代硬件的并计算能,提训练和推理的速度。它
8、们的出现,为AI领域带来了新的活,也为未来的研究和应开辟了新的可能性。随着这些模型的不断发展和优化,我们有理由相信,模型创新架构将在AI未来发展中扮演越来越重要的。?031.路径:循环神经络及其变种(以RWKV为代表)循环神经络(RNN)通过循环式处理序列数据,能够对过去的输保留记忆,但存在难以并化的问题,Transformer架构的诞最早就是为弥补这缺陷。但仍有很多学者认为,RNN的潜还远未达到天花板,在Transformer架构越来越受到诟病的今天,RNN凭借其独特优势再度获得了越来越多学者的探索创新。模 型 创 新01Hyena Hierarchy2023.04Michael Poli,
9、Stefano Massaroli,Eric Nguyen,Daniel Y.Fu,Tri Dao,Stephen Baccus,Yoshua Bengio,Stefano Ermon,Christopher RStanford University,Mila and Universit de MontralRWKV2023.05Bo Peng,Eric Alcaide,Quentin Anthony等RWKV元始智能RetNet2023.07Yutao Sun,Li Dong,Shaohan Huang,Shuming Ma,Yuqing Xia,Jilong Xue,Jianyong Wa
10、ng,Furu Wei微软亚洲研究院KAN2024.04Ziming Liu,Yixuan Wang,Sachin Vaidya,Fabian Ruehle,James Halverson,Marin Soljacic,Thomas Y.Hou,Max TegmarkMIT,Caltech,Northeastern University,IAIFITimeMixer2024.05Shiyu Wang,Haixu Wu,Xiaoming Shi,Tengge Hu,Huakun Luo,Lintao Ma,James Y.Zhang,Jun Zhou蚂蚁集团,清华学Mamba-22024.05A
11、lbert Gu,Tri Dao普林斯顿、卡内基梅隆学Falcon Mamba2024.08Jingwei Zuo,Maksim Velikanov,Rhaiem,Ilyas Chahed,Younes Belkada,Guillaume Kunsch阿布扎Technology Innovation Institute(TII)LFM2024.09Ramin Hasani,Mathias Lechner,Alexander Amini,Daniela RusLiquid AI前这路径的架构创新主要使循环神经络(RNN)替代注意机制,通过循环式处理序列数据,使模型对过去的输保留记忆。04RWKV
12、联想记忆法区别于Transformer的Query-Key-Value参数,RWKV架构由四个重要参数组成:R、W、K、V,除了可训练的权重参数w(Weight),RWKV还使r(Receptance)参数来控制对信息的接受程度。RWKV与Transformer架构的本质区别在于背后的记忆机制,与Transofrmer的内存寻址机制相,RWKV更像是种联想记忆法。模 型 创 新01?我相信RNN是正确的,但现在的RNN远远没有做到它真正的平,它的上限其实是常的,现在我们还远远没有到那个地步,还有很多空间。因为RNN更接近脑和宇宙的运作式。例如,在物理上,宇宙的下状态只与上状态有关,这是所谓的l
13、ocality和causality,量场论遵循这原则。彭博,RWKV作者RWKV(Recurrent Weighted Key-Value)模型核思想是将RNN的循环结构与Transformer的并计算能相结合,在实现效推理、节省存储开销的同时保持模型的性能。这使得RWKV可以“像Transformer样”进并训练,同时在推理阶段可以以递归形式进解码,“像RNN样”推理。Token Shift:token shift在时间混合计算中,通过对当前和前输的线性组合进线性投影,成于时间混合的向量;在通道混合计算中,也采类似的法成通道混合输向量WKV运算符:WKV运算符利时间衰减因对权重进更新,使得每
14、个时间步的输出依赖于之前所有时间步的信息,从保留了RNN的记忆能,这种设计使得RWKV模型在保持较低计算复杂度的同时,能有效捕捉序列数据中的期依赖关系(1)RWKV核思想(2)RWKV的创新点Transformer=Addressing Memory 寻址记忆:RWKV=Associative Memory 联想记忆:05图:RWKV内部架构图,彭博等RWKV提出以来已经经历了多次版本迭代,最新版本RWKV-7预览版已在今年9正式发布。(3)RWKV的发展与应2023年12,Mamba架构次被提出,引了选择性状态空间模型,实现了对输数据的有选择性处理。这种选择机制使得模型能够根据当前输的tok
15、en决定哪些信息是重要的,忽略不相关的信息,提升模型处理序列的能和推理吞吐量,达到Transformer模型的五倍。2.路径:状态空间模型(以Mamba为代表)状态空间模型可以看作是循环神经络(RNN)和卷积神经络(CNN)的融合,由其发展来的结构化的状态空间序列模型(SSM)是另颇具潜的模型创新架构代表。这类模型利状态空间处理序列问题,通过循环或卷积运算实现效计算,使得计算开销与序列度呈线性或近线性关系,从显著降低计算成本。(1)Mamba次提出 模 型 创 新01输出控:RWKV通过在时间混合和通道混合块中使sigmoid函数对接收向量进控,控制信息的流动和记忆更新,确保在每个时间步只传递
16、和处理相关信息,从减少梯度消失和爆炸问题,增强了模型的稳定性和训练效率Mamba的核在于其硬件感知算法,利现代硬件(如GPU)的内存层次结构,通过扫描卷积计算模型,减少不同级别GPU内存间的IO访问,提计算效率。此外,Mamba简化了深度序列模型设计,需注意机制或多层感知器(MLP)块,使模型更加简洁。图:选择性状态空间模型(Selective State Space Model),卡内基梅隆、普林斯顿学(2)Mamba核思想硬件友好设计:Mamba-2的另个重要贡献是其对硬件友好的设计,允许使更的状态维度,提训练速度。在处理需要更状态容量的任务,如多查询关联回忆(MQAR)任务时,Mamba
17、-2显出Mamba-1显著的性能提升混合模型的探索:Mamba-2还探索了将注意层与SSM层结合的混合模型,发现适量的注意层可以进步提升模型性能(4)Mamba-2创新点06今年5,Mamba-2发布,提出了状态空间对偶(SSD)框架,揭了状态空间模型与结构化掩码注意之间的联系。Mamba-2的核层通过引新的SSD算法,在训练效率上提升了2-8倍,同时保持了与Transformer在语建模的相似平竞争。(3)Mamba-2核思想图:(结构化状态空间对偶性)结构化矩阵阐明状态空间模型和注意之间的关系,普林斯顿、卡内基梅隆学 模 型 创 新01UniRepLKNet采核CNN,能够处理多种模态数据
18、,如图像、频、时序预测等。该模型提出了“局部结构设计、重参数化、核选择和随深度拓展添加核”四条指导原则来设计核CNN架构,并采硬件感知的并算法,在图像识别任务中实现领先性能,并在频、视频、点云和时间序列等多模态任务中也取得了显著的结果。UniRepLKNet的优势在于充分利核卷积神经络的特点,通过创新的架构设计,有效地解决了感受野、特征抽象层次以及模型深度表能等核问题。3.路径三:层次化卷积模型(以UniRepLKNet为代表)层次化卷积模型,以UniRepLKNet为代表,是种卷积架构,其核在于使与输序列度相当或接近的滤波器(核)来捕捉序列数据中的距离依赖关系。这种设计使得模型在处理输时能够
19、考虑到更远的历史信息,有效处理序列问题。(1)UniRepLKNet创新点图:UniRepLKNet的架构设计,腾讯AI Lab、港中学07核卷积的独特优势在于不依赖深度堆叠即可获得感受野,避免了深度增加带来的边际递减问题。UniRepLKNet提出了种膨胀重参数块(Dilated Reparam Block),即通过使多个膨胀核卷积层来增强个核卷积层,从在不增加推理成本的情况下提性能,该块的公式如下:膨胀重参数块使膨胀的核卷积层来增强膨胀的核层。这样的膨胀层相当于具有更稀疏核的膨胀卷积层,因此整个块可以等效地转换为单个核卷积。(2)核卷积的优势图:扩张重参数块转化为转换为单个核卷积,腾讯AI
20、 Lab、港中学 模 型 创 新01图:Retnet突破不可能三,微软亚洲研究院4.路径四:多尺度保持机制模型(以RetNet为代表)多尺度保持机制模型(Retentive Network,Retnet)由微软亚洲研究院提出,克服传统Transformer架构在效率和性能上的局限性。RetNet的设计突破了所谓的“不可能三”,在保持训练并性的同时,实现了低成本部署以及良好性能。作为全新的神经络架构,RetNet同时实现了良好的扩展结果、并训练、低成本部署和效推理。这些特性将使RetNet有可能成为继Transformer之后语模型基础络架构的有继承者。福如,微软亚洲研究院全球研究合伙RetNe
21、t作为全新的神经络架构,使多尺度保持(Retention)机制替代了标准的注意机制。与标准注意机制相,保持机制有以下特点:引位置相关的指数衰减项取代softmax:这改进简化了计算过程,并使得前步信息以衰减的形式得以保留,从在降低计算复杂度的同时,保留了序列中的重要信息引复数空间表达位置信息:这法取代了传统的绝对或相对位置编码,使得模型更容易转换为递归形式,增强了模型对序列中元素之间相对位置的感知能(1)RetNet创新点08图:RetNet的双重表,微软亚洲研究院 模 型 创 新01使多尺度的衰减率:保持机制采了多尺度的衰减率,使RetNet能够更灵活地处理不同度的序列,提升了模型对序列数据
22、的适应性和表达能利GroupNorm的缩放不变性提Retention层的数值精度:这特性使得在GroupNorm中乘以个标量值不会影响输出和反向梯度,从在保持模型性能的同时,提了计算的稳定性和效率并:并表使RetNet可以像Transformer样效地利GPU进并训练递归:递归表征实现了O(1)1的推理复杂度,降低了内存占和延迟分块递归:即并表和递归表的混合形式,将输序列划分为块,在块内按照并表进计算,在块间遵循递归表。分块递归表征则能够效处理序列数据RetNet的实验结果表明,它在语建模任务上达到了与Transformer相当的性能,同时在推理速度和内存占显著优于Transformer。(2
23、)序列表形式5.路径五:液体神经络模型(以LFM为代表)液体神经络模型LFM,由MIT系初创公司Liquid AI团队发布,是基于液体神经络(Liquid Neural Networks,LNN)架构的新型神经络设计。受物神经系统启发,LNN通过使更少的神经元和创新的数学公式,实现了与传统深度学习模型相相同甚更优的性能。(1)LFM创新点效内存使:LFM的核优势在于其效的内存使和强的推理能,这使得它在处理量顺序数据时表现出。与传统的基于Transformer的模型相,LFM在处理输时内存使量显著减少,这是因为LFM能够更有效地利上下度,KV缓存不随序列度增加线性增多模态能:LFM模型能够处理包
24、括视频、频、本、时间序列和信号在内的多种类型的数据适应能:LFM还具有适应能,可以根据特定的硬件平台或参数要求进动优化1 O(N)表第N步的推理复杂度09这些加速涌现的创新架构多是在不同程度保留Transformer架构优势基础上,结合循环神经络(RNN)、状态空间序列模型(SSM)、卷积模型(CNN)以及液体神经络(LNN)等思想所做出的创新发展,这使得不同架构之间的界限越来越模糊,呈现出益明显的混合(Hybrid)趋势,更多性能领先的创新架构具备“博采众家之”的特点。同时,前多数创新架构虽然能够在些规模性能测试中实现与传统Tranformer架构同等甚更优越的性能,但在实际应层,仍然有待业
25、界通过多个超参数模型作进步验证。图:LFM在MMLU-pro的测试集成绩对,Liquid AI 模 型 创 新01结构化操作单元:这些单元是模型的基本组成部分,属于个全新的设计空间。LFM的设计允许模型在扩展、推理、对和模型分析进优化。?Scaling LawScaling Law?10Scaling Law泛化022020年,伴随着GPT-3问世,第代Scaling Law指引我们在参数量、数据集和计算量之间寻找模型性能的最优解;2024年,拥有强推理能的o1让我们对模型的要求从迅速成与训练结果,转向在推理过程中进更深度的思考。最初,我们对Scaling law的关注局限于对参数量的思考,甚
26、引发了对其失效的担忧;但全新的scaling law从狭窄具体的指代衍到宽泛的概念,并引发了我们对万卡集群、合成数据和计算资源最优分配的多重关注。我们对Scaling Law及其泛化在当前AI时代下的关注可被归纳为以下点:参数量与计算量膨胀下,带动万卡集群以及性能络的建设和发展。数据耗尽危机中,合理善合成数据成为较优选择。新时代的Scaling Law出现,模型的发展将追求更的推理能,资源向Post-training和推理算倾斜。?我们将从影响两个模型时代的两条Scaling Law出发来探讨这个问题:1.AI模型的性能强烈依赖于规模,主要和参数量N、数据集D和训练计算量C有关AI模型领域的S
27、caling Law正式被提出要追溯到2020年,OpenAI在论Scaling Laws for Neural Language Models中总结到,他们发现损失函数(loss)随着模型、数据集和训练使的计算量呈幂律变化。模型的性能在定范围内受其他超参数(如depth、width)的影响很少。图:损失函数与训练计算量、参数量和数据集的幂律关系,OpenAI在Transformer模型中,Scaling Law的数学表通常为:Performance:模型性能(误差率、准确率等)C:计算量N:模型规模(参数量、数据量等):标度指标(性能随规模变化的表现)(1)Parameters&Comput
28、e:万卡集群及性能络建设的必要性2020年惊艳亮相的GPT-3是个175B参数的模型,今天我们讨论的模型参数量已经是万亿级别。EPOCH AI维护11图:2010-2024前沿AI模型训练计算量年增,EPOCH AI横轴:Publication data纵轴:Training compute(FLOP)例如GPT-4需要使2.5万张英伟达A100 GPU,并训练100天的左右时间,在此期间要处理13万亿个token,并且涉及约1.76万亿个参数。可以预的是为了追求更极致的性能和解决更多问题,在参数量的增加和计算需求的增下,万卡集群及性能络的建设是必要的。万卡集群:由万张及以上的加速卡(如GPU
29、、TPU或其他专AI加速芯)组成的性能计算系统性能络:络需要持带宽、低延迟的数据传输,确保集群中的计算节点能够效地通信和协作中国联通研究院夏璠表,性能络基础设施对于持规模AI应关重要。随着数据量的增加和AI应的扩展,对络带宽和延迟的要求也越来越。这种集群将充分整合性能GPU计算、性能RDMA络、性能并件存储、智算平台等关键技术,将底层基础设施整合成为台超级计算机,以千亿级甚万亿级参数规模的模型训练。中国万卡集群进展:运营商中国电信天翼云上海临港国产万卡算池中国移动呼和浩特万卡智算中中国联通上海临港国际云数据中企业腾讯算集群HCC、性能络星脉字节跳动12288卡Ampere架构训练集群百度万卡A
30、I集群阿巴巴阿云10万卡量级集群商汤SenseCore商汤装置蚂蚁集团万卡异构算集群全球数据中络市场预计将在未来五年内以约 10%的年复合增率增。明势创投着个从20世纪50年代就开始监测AI和机器学习模型的数据库,他们发现从2010年到2024年5,于训练模型的计算量每年增4-5倍,过去10年间语模型的性能提升中约有三分之是由于模型规模的增加。Scaling Law泛化02(2)Dataset:合成数据是数据危机的解药吗?同样,在Scaling Law中数据集的规模和表现也会改变模型的性能。现有的开源模型在法、架构层开源的同时,乎很少涉及到训练数据集的公开。图:公开本和数据使量的预测,EPOC
31、H AI还值得我们关注的个问题是,数据的质量也许数量更为重要。例如Apple在研发模型时采了常规的3阶段预训练法,在核预训练后降低络爬取的低质量数据权重。国内在意识到质量数据集的重要性后,多次发布对建设有质量数据集的指导意。图:合成数据成法,Amazon合成数据(Synthetic data)则是我们从AI1.0时代就开始寻找的破解之道,在具智能和动驾驶等前沿领域得到过部分运,如今已被泛引模型的训练之中。合成数据是指通过算法或模型成的为数据,模拟真实数据的统计特性和分布,但不包含任何真实信息。实际训练中,我们通常会选择部分或全部地使合成数据。明势创投表,合成数据的应突破了传统的数据获取和使式,
32、为解决数据匮乏和隐私问题提供了创新思路,具有较的创新性和颠覆性。企业华为昇腾AI万卡集群科讯星号超万卡集群算平台尽管万卡集群必然会强调对加速卡的需求,我们在技术上关注的却应该是集群的互联。从千卡到万卡,单卡性能下降8%左右,前全球范围内已经有企业开始追求10万卡以上的集群规模,在万卡到10万卡的难关中,如何能保持集群的线性度、稳定性,同时保证调度的效率,是下步所有AI玩家将持续关注的重点。我们必须要意识到个问题,也许有天我们会耗尽现有的数据。有估计称现有类公开本存量约为300万亿个token。按照预测,语模型有可能在2026年-2032年之间耗尽这存量。如果过度训练,这时间点将会再度提前。Sc
33、aling Law泛化021213但合成数据是否是应对数据危机的最佳解药仍值得商榷。先,真实数据永远存在相当多的离群值和异常值,合成数据成算法很少能重现它们。其次,合成数据的引可能导致模型在训练过程中出现过拟合,从影响其在现实世界中的表现。2024年发表在Nature上的篇研究AI models collapse when trained on recursively generated data提到他们所完成的次实验,使合成数据9次迭代后就会让模型原地崩溃。更吸引眼球的结果来Dohmatob,Elvis等的实验结果Strong Model Collapse,他们发现即使合成数据仅仅占到总数据
34、集的最部分,甚是1%的例,仍然可能导致模型崩溃。前成和使合成数据的法在不同模型中都处在探索阶段,我们将持续关注这议题的最终结果。2.全新的Scaling Law,赋予模型的推理时间越多,模型的推理能越强来到2024年,OpenAI有关o1模型的论On The Planning Abilities of OpenAIs o1 Models:Feasibility,Optimality,and Generalizability提出了条全新的Scaling Law:你赋予模型的推理时间越多,模型的推理能就越强。尽管没有披露具体的训练法,但其原理是基于强化学习的内化思维链学习,通过思维链式的问题拆解,
35、使得模型可以不断验证和纠错。图:o1在新Scaling Law下的推理表现,OpenAI(1)语模型推理增强(思维链-思维树-思维图)这年,我们确实观测到规模的增加带来了基本的推理能,但这种推理的效果是相对有限的,o1所完成的,是让模型在作答前进“停下来思考”,这过程需要更多的计算资源,因此被称为“推理时计算”。停下来思考这状态的实现,正是我们直想教会模型的模式,即更直接地进推理。当AI拥有更强的推理能,不仅意味着在编码、搜索等任务上能够帮助解决更多问题,也会在数学、物、化学等基础科学领域,帮助实现突破性的发现。榕创投统计分布:分析真实数据以确定其潜在的统计分布,例如正态分布、指数分布或卡分布
36、。然后从这些已识别分布中成合成样本,以创建在统计学上与原始数据集相似的数据集基于模型:训练机器学习模型以理解和复制真实数据的特征深度学习:使深度学习的式成质量的合成数据集。这些法通常于更复杂的数据类型,例如图像或时间序列数据合成数据的成法:Scaling Law泛化0214语模型的推理能通常涉及到种不同的技术或概念,包括思维链(Chain of Thought,CoT)、思维树(Treeof Thought,ToT)和思维图(Map of Thought,MoT)。思维链(Chain of Thought,CoT):模仿了类解决问题时的思维过程,即先分析问题,然后逐步推理,最后得出结论思维树(
37、Tree of Thought,ToT):更为结构化的推理法,它将问题分解为多个分,每个分代表个可能的推理路径或假设思维图(Map of Thought,MoT):视觉化具,来表不同概念、事实和推理步骤之间的联系(2)后训练(Post-training)的转变从前的预训练遵循个已经被深刻理解的法则:你在预训练模型上投的计算资源和数据越多,它的表现就越好。但新的Scaling LawPost-training Scaling Law的出现已经引发业对于算分配、后训练能的重新思考。后训练通常包括微调(Fine-tuning)和对(Alignment)。新的模型想要提升能,除了在预训练阶段,还可以在
38、后训练阶段,通过提升强化学习(Reinforcement Learning)训练的探索时间和增加模型推理的思考时间来实现性能的提升。o1激发了当前时代的模型开发者对提升模型数学和推理能的兴趣,这很程度上就意味着扩后训练的规模。最近的研究使了不同的法把结果的奖励信号传递到模型的各个推理过程中:o1幅度增强了模型的逻辑推理能,使模型从系统1提升到系统2,幅度加速AI Agent落地可能性。王晟,英诺天使基合伙问答格式 Q&A format本阶段 Long-context stage继续预训练 Continued pre-training质量阶段 High-quality stage知识蒸馏 Kno
39、wledge distillation监督微调 Supervised finetuning(SFT)基于类反馈的强化学习 Reinforcement learning with human feedback(RLHF)直接偏好优化 Direct preference optimization(DPO)在线/离线(处理)Online/offline知识蒸馏 Knowledge distillation图:后训练的重增加数据集D Datasetataset预处理P Preprocessingreprocessing预训练P Prere-trainingtraining后训练P Postost-tr
40、ainingtraining优化O OptimizationptimizationScaling Law泛化02以o1为代表的Inference scaling law使得模型推理能幅提升,在GPQA这样的类专家benchmark上已经超过类PhD平。推理能幅提升可以显著减少幻觉,提Agent类物的能。戴森,真格基管理合伙15(3)推理算vs训练算?随着我们对模型推理能的更追求,和对后训练阶段的更多投,未来有可能推理端的算将会超过训练端。尽管当前推理算还没有超过训练算,但推理成本已经超过了训练成本。毕竟训练成本是次性成本,推理需求将随着模型复杂度、数量和每查询次数的增加继续增。明势创投表,在规
41、模部署AI服务的背景下,推理成本成为主要开来源,市场对降低推理成本的需求强烈。值得提的是,Scaling Law并是严格的然法则,是类基于经验观察得出的趋势性规律,它的价值往往在对未来提供向性的指导。新旧Scaling Law的应和泛化将调整我们对资源配置和技术重的看法,并创新出更为强的新代AI和模型。如今,我们意识到RLHF起的作远超已经IFT(Instruction Fine-Tuning),需要将更多的预算放在后训练阶段上。模仿学习+强化学习成为典型AI模型发展路径范式。本质上是数据的稀缺与否及质量低的问题,数据多就优先模仿学习,数据少就优先强化学习(可我产数据),最终是综合两种类型的算
42、法技术以产更强的能。陈,峰瑞资本合伙拒绝采样似乎已成为后训练阶段的常做法,但现阶段并没有在选择DPO或RLHF达成共识。然强化学习的思路贯穿始终,Meta仍为Llama的后训练开发了奖励模型。Llama 3.1Post-training:SFT+拒绝采样+DPOMeta AI认为RL算法(如带有PPO的RLHF)稳定性差、扩展难度,但他们在DPO后仍开发了奖励模型,并将模型平均技术在每轮训练中都作于奖励模型、SFT和DPOQwen22阶段后训练法:SFT,提模型在预设场景中的响应准确性;DPO,使模型与类偏好保持致(他们称这环节为RLHF)Qwen2的Alignment也分为2部分:DPO(离
43、线)+拒绝采样(在线)Scaling Law泛化02Apple Intelligence FoundationPost-training:SFT+RLHF其中,Apple为RLHF阶段引两种新法:与iTeC起进拒绝采样微调,的是训练、优化奖励模型;镜像下降与RLHF结合,这被认为是PPO(近端策略优化)更有效的法Gemma 2Post-training:SFT+RLHF其中,其中他们于RLHF的模型标模型倍,使WARP(Weight Averaging for Reward Prediction)对标模型进平均0316?AGIAGI?1.视频成:从扩散模型出发扩散模型前已经在图像成、图像超分辨
44、率和图像编辑等任务中取得了显著成果,并逐渐取代了基于成对抗络(GAN)和变分编码器(VAE)的法,在视频合成任务中展现出巨潜,成为前视频成的主流技术路径。扩散模型(Diffussion Model)是类概率成模型,主要通过学习逆向过程来成数据。图:A Survey on Video Diffusion Models,上海市智能视觉计算协同创新中、复旦学(1)DiT模型Sora的热激发了国内外许多模型在视频成领域的应,产出了在影视、营销等业具有可落地商业价值的AI应;“个视频模型”之争也引发了动驾驶领域基于优势,对世界模型的研究和探索;能够带来更好的动驾驶体验的世界模型,事实上也能够作于机器领域
45、;引发诸多讨论的空间智能概念,与我们直探索的空间计算、具智能密不可分在AI改变我们的活、真正触摸复杂世界的过程中,类也从未停对AGI的探索。本轮视频成热潮中,最受瞩的是将Transformer架构引到扩散模型中的DiT(Diffusion Transformer)模型,极强地提了图像成的质量。DiT的核思想是利Transformer的强建模能,替换传统扩散模型中常的U-Net结构,从在潜在空间上操作,成质量的图像。其图像成流程是基于种混合的法,使卷积VAEs和基于Transformer的DDPM(Denoising Diffusion Probabilistic Models),重点是训练图像
46、的DDPM,特别是图像的空间表。A G I 探 索17图:Scalable Diffusion Models with Transformers,UC Berkeley、New York UniversityDiT的技术原理基于以下个关键点:扩散模型DiT建在扩散模型的基础上,这是种成模型,通过模拟个从数据分布到噪声分布的逐步过程,学习逆向过程来成数据。在DiT中,这个逆向过程由Transformer来实现Transformer架构Transformer以其注意机制闻名,能够捕捉序列数据中的距离依赖关系。在DiT中,图像被分割成多个patches,这些补丁被嵌到个序列中,然后通过Transfo
47、rmer块进处理潜在补丁DiT不是直接在像素空间上操作,是在潜在空间上操作。这是通过将图像编码到个较低维度的潜在表来实现的,这个表被分割成多个补丁,每个补丁作为个序列元素输到Transformer中条件成DiT持条件成,这意味着它可以在成过程中使额外的信息,如类别标签。这些条件信息被嵌到Transformer的输序列中,以引导成过程可扩展性DiT的设计允许其通过增加模型的深度、宽度或输补丁的数量来扩展。这种可扩展性使得DiT能够通过增加计算资源来提成图像的质量训练效率DiT在训练过程中表现出了效率。由于Transformer的并化能,DiT可以利现代硬件(如TPU)进效训练03A G I 探
48、索18DiT的提出,不仅推动了成模型技术的发展,也为未来的研究提供了新的向。随着研究的深,DiT或其变体已经被应于视频成,以及艺术创作、游戏开发和虚拟现实等领域。随着模型规模的增加和训练技术的改进,DiT有望在未来实现更加惊的成效果。在视频成领域,除了DiT之外,还有其他种混合架构取得了显著的进展。这些架构结合了不同的模型特性,以提视频成的质量和效率。(2)其他混合架构模型创新Transformer+3D卷积络些研究作探索了将Transformer与3D卷积络结合的架构。3D卷积络擅捕捉视频的时空特征,Transformer能够处理距离依赖关系。这种混合架构能够同时利两者的优势,提视频成的连贯
49、性和真实感回归模型+Transformer回归模型如PixelRNN或PixelCNN在像素级别上成数据,Transformer则能够处理序列数据。将两者结合可以成质量的视频内容,同时保持对距离依赖的有效建模VAE+扩散模型在DiT的基础上,学者们进步探索了将变分编码器与扩散模型结合的架构。这种混合模型先使VAE将分辨率的视频编码到低维潜在空间,然后在潜在空间上应扩散模型进成,从在保持成质量的同时减少计算成本GAN+扩散模型GAN在图像成领域取得了巨成功,扩散模型则在样本质量上展现出了优势。将两者结合的混合架构旨在结合GAN的稳定性和扩散模型的质量样本成能TimeSformerTimeSfor
50、mer是种专为视频理解任务设计的Transformer架构,它通过将时间维度融到标准的Transformer架构中,有效地处理视频数据。这种架构可以于视频成任务,成具有时空致性的内容交叉注意机制在Transformer架构中引交叉注意机制,可以使模型在成视频时更好地利额外的上下信息,如本描述或对象标签,从成与这些上下信息更加致的视频内容这些混合架构的共同标是在保持视频成质量的同时,提模型的计算效率和灵活性。随着研究的不断深,我们可以预未来将会出现更多创新的混合架构。我们再次回到引爆视频成热潮的模型Sora。OpenAI在介绍中称Sora是“World Simulator”,在Sora上线的第时
51、间埃隆斯克即表,Tesla约在年前即能成符合物理学的有关真实世界的模型(Real-world video generation with accurate physics),这讨论将世界模型(World Model)的概念引众视线。03A G I 探 索图:世界模型的基本框架19Sora模拟真实世界物理状态OpenAIOpenAISora通过结合扩散模型与Transformer模型,能够模拟真实世界中的、动物和环境。这种能使其在本到视频(T2V)领域中独树帜,能够根据本提成逼真的视频内容。时间度与时序致性:Sora能够成达60秒的视频,且在维持视频内容的时间连续性和逻辑致性表现出,这在以往的视
52、频模型中是难以实现的。真实世界物理状态模拟:Sora展了系列引注的涌现能,这些为不是预设的规则,是模型通过学习量数据后然涌现的能。2.世界模型:从动驾驶领域到整个世界AI在现实世界的应正在从虚拟世界逐渐扩散物理世界。2024年谈到世界模型更多是在智能驾驶领域,本年度国内领先的量产智能驾驶玩家蔚来、理想等都提出了有关世界模型的设想和布局。论Recurrent World Models Facilitate Policy Evolution(David Ha,Jrgen Schmidhuber,2018)可以帮助我们理解什么是世界模型:(1)世界模型(World Model)图中的Vision M
53、odel(V)将维观测转为低维向量,Memory RNN(M)是序列预测下个时刻的表征,在这样基本的序列预测中增加个输action,让数据分布由变化。事实上,世界模型反映了久以来许多AI研究员对model-based RL作的奈和期待:模型不够准确,那么完全在模型训练的强化学习效果就不好;如果能获得准确的世界模型,就能在世界模型中反复试错,找到现实的最优决策。由此,我们可以从需求出发来定义世界模型:完全地理解这个世界就是世界模型要的事。任少卿,蔚来智能驾驶副总裁03A G I 探 索20正如为何特斯拉会在年前就开始布局有关真实世界模型的相关作,对数据中没有过的决策,使世界模型推理出决策成果这要
54、点,和动驾驶领域实现L5的标息息相关。当前,世界模型向上的作正泛地采动驾驶领域的数据和场景进实验。(2)前在世界模型向上的作RenderWorld仅持视觉的端到端动驾驶框架,它使基于监督斯的Img2Occ模块成3D占标签,然后通过AM-VAE对标签进编码,并使世界模型进预测和规划。RenderWorld采斯散射来表3D场景和渲染2D图像,与基于NeRF的法相,提了分割精度并降低了GPU内存消耗Drive OccWorld以视觉为中的4D预测世界模型应于动驾驶的端到端规划BEVWorld将多模态传感器输标记为统紧凑的瞰图(BEV)潜在空间以进环境建模的新法。世界模型由两部分组成:多模态标记器和潜
55、在BEV序列扩散模型LAW使LAtent World model,根据预测的为和当前框架的潜在特征来预测未来的潜在特征OccLLaMA类似VQVAE的场景标记器,增强了LLM,特别是LLaMA,以对统词汇表执下个token/场景预测,从完成动驾驶中的多项任务DriveDreamer-2它基于前作(DriveDreamer)的框架,结合了个型语模型来成定义的驾驶视频WorldDreamer培养对般世界物理和运动的全理解,从显著增强视频成的能;WorldDreamer从型语模型的成功中汲取灵感,将世界建模定义为监督的视觉序列建模挑战3.具智能:回到现实世界,回到产业链早期的世界模型很多出现在机器领
56、域,任少卿提到“动驾驶是泛机器领域/世界模型的框架也能做机器”。具智能是指种基于物理体进感知和动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现动,从产智能为和适应性。Sim2Real(simulation to reality)和在真实世界中采集具交互的数据并学习是研究具智能的两条思路。清华智能产业研究院(AIR)表:将真实环境数字化和仿真器模拟的为学习结合起来,形成Real2Sim2Real(RSR)的闭环连接,能更有效地利交互数据和真实环境的反馈,加速智能系统的实际部署与落地。与去年相,许多具智能玩家在2024年都推出了的款形机器,但更多玩家开始关注机器在具体产业链
57、03A G I 探 索21上能有什么样的位置和发展空间。这不仅意味着与过去年相,形机器的概念变得分可触及,同时也表明具智能这领域,正在转向对当前类来说更有价值的落地和应。项明显特征是,在完成了、避障等基本功能后,具智能玩家纷纷开始研发灵巧,逐个攻克具智能难题:腾讯Robotics X实验室公布了研机器灵巧TRX-Hand,拥有8个可独控制关节,重仅1.16千克,最持续指尖可达15星动纪元XHand灵巧具有12个主动由度,采全驱动案,能够实现多向的运动,从模仿类部的精细操作灵巧Linker Hand以其20个主动由度的合理配置,被业界专家泛认为是具智能研究的优选案,平衡了研究需求与成本效益银河通
58、拥有灵巧解耦关节和灵巧线性驱动式专利傲意科技灵巧ROHand具有11个运动关节和6个主动由度帕西尼感知科技开发了市场上款融合多维触觉与AI视觉双模态能的四指仿灵巧DexH13 GEN2,具有1956颗专业级ITPU多维触觉传感器和800万清AI眼相机智元机器推出了由度五指灵巧,包含19个由度,集成基于MEMS原理的触觉感知和视触觉感知技术视频成、世界模型与机器集群1X1XNEO:专为家庭使设计的双形机器,1X基于视频成和动驾驶世界模型领域的进展,训练出了个世界模型,作为其机器的虚拟模拟器。模型可以理解接触到的物理世界并成保真视频,使机器可以在的神经空间中执规划、评估和模拟操作。EVE:轮式机器
59、,2020 年即取得商业化进展,为美国商业场所提供安保服务。1X强调其机器集群协作,展了个通过简单的语命令指挥多个机器执系列动作的能。1X Technologies,2014年于挪威成,专注于开发和产能够模仿类为的机器,以增加全球的类劳动。03A G I 探 索224.空间智能:连结具智能与空间计算在经历了整年有关具智能概念、投融资的热潮后,与其相关不完全相似的空间智能概念被李提起。空间计算是项将物理世界与数字内容融合的技术体系,根据其涉及的不同层次,可以分为基础设施层、数据层和交互层:(1)空间计算基建层:持空间计算的硬件和络基础设备:苹果的Vision Pro提供了性能的AR显、光学传感器
60、以及精准的跟踪功能,配备先进摄像头和处理器络:速度、低延迟的5G和Wi-Fi 6E络正加速实时交互的实现,尤其适于移动设备和协作应;歌云等云服务商正在开发“边缘AI”基础设施,将AI模型更贴近,从减少延迟、提升空间计算应的实时能空间智能是指机器在三维空间和时间中感知、推理和动的能,帮助它理解事物在三维空间中的位置及交互式。李在彻底理解空间智能之前,我们可以回顾在2023年度报告中提及的重要科技趋势空间计算:Apple Vision Pro空间计算从概念到现实AppleApple然输式:Vision Pro 采了种称为“然输”的交互模型,这种模型使眼睛和的组合进输,只需看着标并点击指即可进交互。
61、空间操作系统 visionOS:Vision Pro 搭载了苹果款为空间计算所打造的操作系统 visionOS,它包括了全新的实时执引擎、动态注视点渲染管线以及对原空间体验的持。Apple Vision Pro作为苹果公司推出的款空间计算设备,实现了数字内容缝融现实世界,通过其命性的产品设计和技术创新,开启了空间计算的新时代。03A G I 探 索(2)操作系统:空间智能苹果发布的Vision Pro就是个典型的空间计算设备。李认为,与其不同的是,空间智能将成为增强现实和虚拟现实的操作系统。通过成完整可交互的三维世界,真正解锁机器在三维世界中的智能能。同时,具备三维感知、推理和动能的机器能彻底
62、改变我们与世界的交互式。毫疑问,空间智能的野正在于将空间计算操控虚拟世界的本领和具智能触达现实世界的能结合起来,这将涉及到量的数据处理、模型训练以及如何在现实场景有效地部署这些技术。最终,从视频成到世界模型、从具智能到空间智能,我们始终都在追寻个问题AGI,极致的AI,极致的通,虚拟与真实世界的合为。数据层:负责空间数据的收集、处理和管理空间映射和计算机视觉:实时映射和物理环境的解读,使应程序能够将虚拟物体置于物理空间中数字孪:通过集成物理模型、传感器更新、运历史等数据,在虚拟空间中完成映射交互层:直观地与虚拟和物理世界互动沉浸技术(XR):主要包括增强现实(AR)、虚拟现实(VR)和混合现实
63、(MR),他们前仍是空间计算概念落地的核技术,AR将数字元素叠加在现实世界中,VR创建完全虚拟的空间,MR则是两者的混合;前具体相关产品存在视频透视(VST)和光学透视(OST)两种技术路径触觉反馈和感官界:设备的触觉反馈增加了沉浸感,混合现实头戴设备和触感套能在虚拟环境中创造度真实的互动语和势识别:得益于AI的持,这些技术允许需动即可控制数字元素03A G I 探 索23RokidGlassesAI+AR缝融合现实世界RokidRokid2024年1118,Rokid联名暴眼镜推出消费级AI+AR眼镜Rokid Glasses。AI+AR全新交互式:Rokid Glasses基于衍射光波导成
64、像技术实现AR效果,同时深度整合阿巴巴旗下通义千问模型AI能,融合AI+AR技术,可以通过语和视觉交互实现物体识别、实时翻译、定位导航、购物付多种任务,缝融合现实世界。硬件“减负满配”:Rokid Glasses将主板、电池等核组件集成于框架之中,重量仅49g,提升舒适度及便携性。同时配备颗1200万像素专业级摄像头,搭载了第代骁AR1平台,配合2GB RAM+32GB ROM存储组合。02P R O D U C T?AIAI?2020?5 5?()20+细分赛道()五使场景?AIAI?AIAI?()APP端数据分析()Web端数据分析(三)量位智库AI100?AIAI?AI+XAI+X?AI
65、AI?()办公软件类AI+X产品()内容平台类AI+X产品?AIAI?AgentAgent?()多模态()Agent化(三)度个性化1.综合AI1002.原AI100/25/32/35/39/42/43/44/46/48/50/51/52AI?A IA I?办公提效-A I 写 作-A I P P T-A I 总 结-A I 图 彩云梦腾讯涌阿悉语笔杆论创意喵AI写作万能写作师创作星AI智能写FRIDAYGiiso写作机器星助句忧万彩AI多种草AI讯公智能写作讯绘VERSE红书智能创作状元AIPaperPass百度作家平台66论易撰5118SEO写作夸克CueMe媒帮派伪原创果写作蛙蛙写作co
66、pydoneAI写作树熊写作思助AI写作宝字游侠光速写作秘塔写作猫笔灵AI写作讯写作摆平AI论爱改写新华妙笔公写作AI新媒体章AiPPTiSlideChatPPT格PPT轻办公adAI万兴智演歌者PPT秒出PPTGaiPPT美图LivePPT博思AI PPT当秀Mindshow塔猫PPT彩漩PPTProcessOn 亿图脑图AIGitMind思乎TreeMind树图Mapify亿图图AI知犀AIAmyMindBibiGPT星档问答司阅SmartRead有道速读会记天壤万卷知我AI包阅AIFeelRead阅会读ReadFlowAI课代表ReportifyCuboxReadPaper讯听听脑-A
67、I 代 码快码CodeGeeX包MarsCode驭码Code Rider星码代码浣熊通义灵码CodeFuseAI XCoder创意成-A I 设 计-A I 图-A I 视 频-A I 图 像 编 辑-A I 频-A I 乐标智AI logo135 AI排版抖即创U钙即时AI京东羚珑创客贴易可图AI神采AI易设计坊百度云念Motiff妙多暗壳AIiMuse.ai优势智设阿班千图设计室万相营造AI LOGO灵图AI腾讯设计开放平台匠紫设计包装设计艾绘绘本设计奇布塔绘本设计千设计助造物云AI云图AI库AI云字体家Canva可画稿定AI墨AI莫设计AI摹客AIPixso AI美图设计室图怪兽标智客A
68、I logo美间AI阿堆友简拼界版图商汤秒画绘AITiamat海艺AI6penHiDream.aiMewX AIA1.art设画宇宙VoxCraft造梦记数画360鸿图StartAI意间AIAnyPaint万兴爱画AI闪绘链云版图摩笔良灵动限猫社区LibLib AI即梦AIMeshy限画格吐司AI绘画WHEE奇域AI通义万相触AI绘画TRIPO神采AIFotor你我当年照修复佐糖360智图像素蛋糕AI改图凡科AI改图象寄百度盘AI修图图可丽咻图AI美图云修花图像ProKnockOutPiczooReminiPhoto Retouch照修复炫图AI Touch Retouch开修图Sih.ai咔
69、哒FP Video画质2xInstasize AIPicHeroMorph StudioVega AI智谱清影快可灵Etna模视频炫变换脸FusionX引擎SkyReelsPixWeaver寻光HiDream.aiBoolvideo剪辑万兴喵影Clipfly帧妙创艺映AI巨禄腾讯智影度加创作具星绘镜MOKIFancyTech梦Q.AI极虎漫剪即梦AI6pen起剪知作Vidu开拍Pixverse闪剪AI视频DreamFace魔坊饼AI变声逗哥配录咖可智能讯智作蓝藻AI悦配剪芊芊妙猫头昆仑疯字节海绵乐腾讯TME Studio给BGM猫ACE Studio易天歌歌AI写歌Muse AI控和弦派创岛易
70、X Studio休闲娱乐-AI陪 伴X Eva星野我在AI叨叨猫箱WoW筑梦岛冒泡鸭 Cos Love 造梦次元 捏TA彩云梦 异世界回响 逗逗闪令预塔塔络希侃星球船顺唠唠蕉蝶境伙伴鸭纸机悬河AI扮演 有象冰岛AiU 虚拟友林间聊愈室DD星球独响Cos AIQuin聊会天喵悦流轻偶AI乌托邦Me.bot商量拟模型通义星尘模型百川模型AnyDoor毒霸姬-AI相 机脸猫灵动AI超能画布摹仙绘蛙WeShop唯象K电商图超会AI图应AIPhotoStudio AI绘创AIPaiE象剪同款星绘脸趣Faceplay秀脸美图证件照快剪辑最美证件照趣拍AI换脸秀美间AI创意商拍悦颜相机乐拍StyleArt相
71、机千颜妙鸭相机必拍常活-AI教 育包爱学 斑AI学 海豚AI学 快问 AITalk AI练语AI外教 有道PEF Hello Hi Echo-AI健 康天天跳绳胃之书讯晓医-其 他宝同花顺问财光综合类具-多 功 能 综 合 平 台-AI搜 索万知讯智WPS AI画桌灵办AI悟空妙办画板简单AIfabrie360AI浏览器effie博思板boardmix腾讯档橙篇360苏打办公百度库息流FlowUs夸克有道云笔记Notion AI印象笔记Monica AI-AI Ag ent扣Coze智能体平台斑头雁BetterYeah腾讯元器智谱清智能体中Gnomic百宝箱讯星智能体中Link.aiInsid
72、erXSkyAgents实在AgentMetaGPT-AI智 能 助 紫东太初AI BoxMChatAI聚天书AI畅问AI蓝千询包AI天AI智谱清讯星阿通义deepseek海螺AI 腾讯元宝百应跃问晓象Sensechat问百度AI助360 AI助创脑AI聊天Kimi智能助AI Mate Pro360智脑妙AILuca元象模型道海鲸AI灵助WPS灵犀万能in船流知我AI简单搜索得理法搜C知道博查AI搜索开搜AIAMinerMetaLaw流Brainstorm快找找问问宇宙MikuSeekAll.aiLepton SearchSuppr超能献寻隐懂法猫秘塔AI搜索纳搜索GensparkThinkA
73、nyFelo知乎直答Devv.ai-AI开 发 平 台Dify魔搭社区华为ModelArts腾讯AI开放平台智谱开放平台壁ChatDev讯开放平台CoLingo开搭QAnythingAI?-AI PC宏碁荣耀机械命华为联想华硕-AI 机VIVO华为荣耀魅族OPPO-AI 机包Ola FriendiFLYBUDSAIxFU(爱富)-AI眼 镜度AI眼镜Meta Lens Chat华为智能眼镜2界环AI频眼镜MIJIA智能频眼镜Rokid AR Lite-AI硬 件 新 物 种Rabbit R1统计截2024年1031虚拟男友ChatBird?AIAI?2020?5 5?25基于对全国现有AI产品
74、(包含Web端和APP端)的梳理总结,我们在国内共统计到了千余款产品。为了更好地从数据维度观察国内产品的现状,我们结合产品具体功能、使体验、运营状况和数据等因素,从中选取了四百余款具有代表意义的产品进进步统计研究。这400款产品全覆盖了20余个细分赛道和五场景,全渗透个产、休闲娱乐和常活等多维度。?20+20+?第梯队AI智能助(34款)、AI写作(34款)、AI图(33款)、AI视频(32款)AI设计(23款)、AI陪伴(23款)第梯队AI修图(22款)、综合类套件(21款)AI搜索(19款)、AI相机(19款)、AI乐/效(17款)、AI开发平台(15款)第三梯队AI Agent(12款)
75、、AI教育(10款)、AI总结(11款)AI PPT(8款)、AI图(7款)、AI代码(7款)、AI翻译(5款)具体包含AI智能助、AI陪伴、AI相机、AI写作、综合类套件、AI修图、AI视频、AI教育、AI乐/效、AI设计、AI图、AI搜索、AI图、AI总结和AI翻译共计20个赛道。根据产品数量可以分为三梯队。由于Web端和APP端适于不同场景,在两种使形态下的产品赛道数量分布有所差异。在APP端的166款产品中,产品数量最多的赛道依次为AI智能助、AI陪伴、AI相机、AI写作和综合类套件。在Web端的230款产品中,产品数量最多的赛道则依次为AI智能助、AI写作、AI视频和综合类套件。AI
76、智能助 15%共23款AI陪伴 12%共19款AI相机 10%共16款AI写作 9%共14款综合类套件 9%共13款AI修图 8%AI视频 6%AI教育 6%AI乐/效 6%AI设计 4%AI图 4%AI搜索 4%AI图 2%AI总结 2%AI翻译AI运动.?AI APPAI APP?注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计166款观测产品04A I 应 格 局261.AI智能助梯队明显划分,包断层领先AI智能助是前表现最突出的AI原类产品,也是国内模型研商技术实最直观的体现。前各产品间的功能差异较,普遍包含对话交互、AI搜索、AI写作、数据分析等功能。在收费,
77、尚未形成明确的收费模式和付费意愿。仅有明确进会员收费,Kimi智能助则是打赏式收费,智谱清和天AI分别针对视频及乐成功能进收费。从APP端来看,2024年5成为关键分岭,各家模型商的AI智能助登场完毕,产品间开始明显分化,形成了“1+1+6”的格局。第名包在规模、增、活跃、留存等各项数据上均断层式领先,今仍保持着全加速增,也在9成为国内个总下载过亿的原AI产品。24年10,包累计下载量超1.4亿,当新增下载量超2000万。Kimi智能助虽然位居次席,但市场领导地位同样明显。第三梯队的6则指:、智谱清、讯星、天AI、阿通义、腾讯元宝和海螺AI。在Web端,头部产品为Kimi智能助和,访问量均超过
78、2000万。包和阿通义访问量则超过1000万。从2024年5-10的规模数据来看,AI智能助在Web端已经出现了明显的梯队划分:以下是对各代表赛道的详细分析:?AIAI分?分?WebWeb?注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计230款观测产品AI智能助 11%共25款综合类套件 8%共19款AI设计 10%共22款AI图 13%共29款AI写作 11%共25款AI视频 10%共23款AI搜索 7%16款AI Agent 5%12款AI修图 5%AI乐/效 4%AI PPT 8款AI总结 8款AI代码 6款AI图 6款AI相机 3款AI开发平台AI陪伴AI翻译
79、AI数据快速增Kimi智能助 包 海螺AI 跃问平稳增阿通义 智谱清 腾讯元宝基本持平百应04A I 应 格 局27总体来看,我国的AI智能助与海外仍有相当距离,对标产品ChatGPT在Web端的访问量超36亿,Gemini访问量超2亿,Claude数据超8000万,差距超过5倍。2.AI搜索多渠道共同发国内头部产品为秘塔AI搜索和知乎直答,总访问量分别超过600万和300万,均推出了简洁、深、研究、专业等多种搜索模式,并持通过上传件构造个性化搜索引擎。此外,天AI等AI智能助也普遍提供AI搜索功能。国外典型对标产品Yandex访问量过亿,Perplexity访问量超9000万。04A I 应
80、 格 局图:Kimi智能助(左)和包(右)的Web端界图:(左)和阿通义(右)的Web端界图:秘塔AI搜索(左)和知乎直答(右)的Web端界28从具体产品定位上可以分为AI加强搜索、原类AI搜索和业务类AI搜索。3.AI陪伴增乏,Killer APP前景不明从功能来看,量位智库按照使者和AI智能体的交互强度,将AI陪伴产品分为轻交互、中交互和强交互产品。所有产品基本均有扮演的成分。轻交互产品以理疗愈和AI记软件为代表,如林间聊愈室和光。玩家在交流中起绝对主导作,时间和精投相对较少,AI智能体的回应不会出现过多“惊喜”中交互产品更类似于游戏,提供特定的游玩体验,主要对应互动说和智能体社区。玩家和
81、AI智能体共同影响剧情向,包括多智能体群聊对话和说展开两种形式。玩家会集中性投时间游玩,代表性产品包括冰岛、冒泡鸭、有象等强交互产品以虚拟恋为代表,玩家和AI智能体会持续频聊天,个别软件甚可以提供叫起床等常服务。此类产品是前活跃粘性最好的部分AI加强搜索在原有搜索引擎、浏览器等互联产品的基础上,叠加AI功能后衍出的新代产品。代表包括:纳搜索、夸克浏览器、简单搜索等原AI搜索以AI搜索为产品核的AI原产品。代表包括:秘塔AI搜索、ThinkAny、GenSpark、开搜AI等。也有MetaLaw、Devv.ai和C知道等针对特定领域的垂直AI搜索具业务AI搜索在内容平台类原有业务上,叠加AI搜索
82、功能的产品。代表包括:知乎直答、bilibli AI搜索助、红书的达芬奇/搜搜薯等。这种结合不仅增强了平台作为搜索引擎的功能性,也提升了在特定内容平台的使体验AI陪伴也是众多公司布局AI原应的重要选择。包含冰科技、线球科技、Minimax、阶跃星、有零科技在内的20家AIGC公司共推出了21款产品。由于AI陪伴产品在功能上和扮演游戏、剧、社交,乃理咨询等业务深度重合,许多垂直赛道玩家,例如顺科技、晓悟智能、阅集团、Soul、纪源等也纷纷进这领域。04A I 应 格 局图:星野、X Eva、彩云梦、光(从左到右)的APP界29国内产品在新增速度和活跃等数据上普遍下滑。全球范围内,Characte
83、r AI、Janitor AI、Crushon、Talkie的热度持续已超过年。其中,Character AI端MAU可上亿,APP端MAU则超过两千万,国内MAU最的星野在APP端数据仅约为其分之,这数据表现在国外勉强进前。经过和海外产品的深对,量位智库认为关键在于国内产品缺乏对深度情感链接的探索。Character AI、Replika等海外产品更注重个性化和深度情感交流,追求具有独格和复杂情感反应的AI形象。国内市场则更倾向于短期的趣味性互动或娱乐化的陪伴功能,产品满的需求过于浅层,同类产品间可替代性强,难以让深探索。5.AI+图像普遍得到需求验证AI+图像可以具体分为AI图、AI设计、
84、AI相机、AI修图四个细分领域,前在B、C两端普遍得到明确的需求验证。在Web端,AI视觉设计成为最受欢迎的细分赛道,AI绘画和AI修图紧随其后。在APP端,AI相机的数据压AI陪伴,成为2C AIGC产品中的热类。AI视觉设计类产品分为两类,类为平设计相关,具体包含海报、设计概念图等,代表产品包括稿定AI、美图设计室和图怪兽。另类则是进步功能细分的产品,包括主打图排版设计的135AI排版助和主打UI设计的即时AI。Logo设计表现突出,选产品包括标智logo、标智客AI Logo和U钙。4.AI写作成为标配AI功能在功能上,AI写作多提供“键式成+深度AI编辑”的综合式。在键成时,使者提供主
85、题或关键信息后,AI可以根据模板直接产出整段字。深度AI编辑功能则更类似Copilot,能够在成过程中提供本润、续写扩写、校阅勘误、格转化、灵感激发、降重伪原创等辅助功能。前,AI写作已经成为产类具的标配AI功能。百度库、WPS AI、博思Boardmix等综合类具均将AI写作结合作流。此外,AI助类具也均能满轻量级的常写作场景,例如撰写周报、起草发稿等。许多垂直赛道的产品,例如游戏+AI、营销+AI,甚特定赛道的综合性商,也会基于业务特和数据中台,提供相关的AI写作服务。04A I 应 格 局图:光速写作(左)和WPS AI(右)在Web端的AI写作界30AI图产品多结合了AI抠图、清晰度提
86、升等AI修图功能,站式提供可素材,前2D平图/多视图和3D成模型领域均有代表产品出现。代表产品包括Liblib AI、Meshy、即梦AI、限画、格、神采Prome AI、WHEE和奇域AI等。AI修图在Web端可分为素材处理和批量修图两类。利AI进抠图、提分辨率,进快速预处理素材已经成为业内技巧,代表产品有佐糖、Fotor和AI改图。批量修图在会议跟拍和像摄影中基本成为业标配。代表产品有像素蛋糕、百度盘AI修图、美图云秀。在APP端,画质提升和智能抠图成为主流功能。美图秀秀、醒图、Wink等头部修图产品均已规模深度植AI修图功能。AI相机在Web端和APP端呈现出了明显差异。Web端主要为电
87、商2B的AI商拍,具体包括虚拟模特和虚拟商品图。使者可以将底商品图或台图进上传,产品会根据所需的模特姿势、背景氛围等成可直接使的商品详情图。代表产品包括美间AI创意商拍、Weshop唯象妙境、绘蛙等。APP端以妙鸭相机类2C娱乐向的像摄影产品为代表。6.AI视频直接成视频仍待发受技术进步的影响,字/图直接成视频在技术和创业领域已经成为热,但由于产品落地具有定的滞后性,预计2025年将出现相对破圈的产品。前来看,AI视频产品在Web端可以分为以下种类型:直接基于提词成视频:包括可灵AI、PixVerse、智谱清影、即梦AI、Morph Studio、Video Studio等基于AI的视频编辑软
88、件:包括视频翻译、本剪视频、像智能修图、添加滤镜、画质修复等功能,代表产品有万兴喵影、开拍等04A I 应 格 局图:稿定AI、佐糖、LibLib AI 和超能画布的Web端使界动智能切:通过动成分镜、配图、配等,将视频变为切短视频,主要应在电商和影视领域拼接式视频智能成:由字成视频/图像后拼接为视频,在应上常于AI短剧在APP端则可以分为以下三类:AI相机:持对不同格的视频模版进换脸,包括快剪辑、美趣AI、AI换脸等内嵌有AI功能的视频编辑具:包括剪映、快影、Wink、度加剪辑、Videoleap等套壳类视频产品04A I 应 格 局31图:可灵模型(左)和即梦AI(右)的Web端使界?根据
89、使场景,所有产品可以划分为五类:全使场景、作提效、创意成、休闲娱乐和常活。各使场景对应的产品数量分别为65款、105款、125款、43款和24款,在Web端和APP端的具体分布如下:注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计166款观测产品?AI APPAI APP?全使场景共32款,23%办公提效共32款,23%休闲娱乐共38款,27%创意成共39款,27%常活共22款,13%.AI智能助、AI Agent、AI笔记等.AI陪伴、AI相机、AI K歌等.AI图、AI视频、AI设计、AI数字等.AI健康、AI教育等.AI写作、AI PPT、AI总结等?AIAI分?
90、分?WebWeb?注:量位智库出品并保有最终解释权。产品统计截2024.10,经筛选后共计230款观测产品全使场景共40款,17%办公提效共89款,39%休闲娱乐,共4款7%创意成共40款,17%AI浏览器、AI智能助、AI Agent、AI搜索等办公类套件、AI写作、AI PPT、AI总结等AI视频、AI图、AI视觉设计、AI乐等.3204A I 应 格 局.331.全使场景重在整体效率提升主要涵盖多功能综合平台、AI智能助和AI Agent。这类具通常度集成,普遍涵盖AI写作、AI总结等功能,能够为特定场景站式解决案。相对于专注单场景的其他产品,这类综合性产品能够实现不同功能和服务的缝对接
91、,更强调跨场景跨平台协同和任务串联带来的整体效率提升。未来演变向可能包含:基于特定任务的主决策能、平台间互通配合、Agent化2.办公提效整体数据表现最优具体包括AI搜索、AI PPT、AI 总结、AI写作、AI图、AI 代码、AI配、AI相机中商业拍摄部分。从数据来看,办公提效类产品整体的数据表现突出,量位智库认为,具体涉及以下原因:效率提升可量化、易平衡价值与服务成本、使场景泛且频,且产品在AI向的可扩展性强,升级空间。未来的发展重点包括:低成本提升输出内容的专业度:提词优化系统、结合垂直领域专家知识、加验证环节现有具与作流集成:提升常具集成度减少学习成本:尽可能做到即插即在五类场景中,由
92、于解决的需求更为明确和迫切,办公提效类具在商业变现、产品数量、功能效果和市场普及上均有更好的表现。以下是针对各使场景的具体分析:04A I 应 格 局Sonnet 3.5和OpenAI o1为代表的新代模型幅提了AI Coding能,在SWE-bench上可以获得50%的得分,预计在1-2年内可以获得90%以上的得分,意味着部分类的编程任务即将可以被AI解决。戴森,真格基管理合伙3.创意成2025年有望显著突破具体包括AI设计、AI图、AI图像编辑、AI视频、AI乐等赛道。随着技术的持续进步,内容成质量有望获得极为显著的提升。可以预,创意成类产品将成为2025年增最快的类产品,其中,AI视频成
93、以及AI设计领域中的3D和精细成潜巨。预计未来的发展重点包括:解决技术瓶颈:成质量与稳定性:质量内容的致性输出,需要对创作过程有细粒度控制创意表达的可控性:难以精确把控创意向训练数据的版权限制:优质训练素材获取受限成结果难以精细调整达到商变现地步解决变现瓶颈,寻求订阅制收费之外的变现式,基于成内容量收费或许是突破思路通过优化UI和作设计,降低学习和迁移成本34预计未来的发展重点包括:情感交互的深度与然度,如情感识别和共鸣能、多模态的情感表达的多样性个性化定制能,了解偏好,进场景感知隐私问题保护内容的丰富性和新鲜性,设计更为丰富和专业的底层机制5.常活多是在原有常软件的基础上通过要素识别和个性化
94、计划制定来提升体验。具体包含AI健康、AI教育、AI运动、AI记等。预估未来健康、运动和教育将成为重点发展赛道,原有相关互联产品,如Keep等,将结合场景经验普遍引AI功能。04A I 应 格 局4.休闲娱乐合规挑战突出指通过提供实时互动类内容和直接可消费内容等,提供情绪价值的产品。在赛道上主要对应2C侧的AI相机和AI陪伴。在产品中强调趣味性、情绪价值和社交属性,对技术上的情感计算能、个性化算法、实时交互性能提出了更要求,同时也对内容态在内的运营有更要求。前存在的问题是产品缺乏本质化差异,同时监管导致内容创作由度有限,易失去新鲜感。?AIAI?AIAI?35为了客观还原国内AI产品的现状,针
95、对筛选出的400款代表性产品,我们从规模、新增速度、活跃和粘性四度进了数据统计,横向对和进步分析。整体来看,APP端和Web端均尚未出现互联时代的破圈级产品,和海外的同类型产品相差距在5倍以上。,国内对模型的监管要求在定程度上限制了产品表现,导致最终使体验不佳。另,国内付费尚未形成闭环。缺乏差异化场景带来的同质化竞争进步降低了付费意愿,限制初创公司投与开发,形成了恶性闭环。?APPAPP?1.规模 2024年1-10累计下载截2024年10,共56款产品的新增下载量超过百万。TOP 100的2024年累计规模槛约27万。共两款产品数据过亿,分别为夸克(接近2.7亿)和包(接近1.4亿)。夸克此
96、前属于浏览器品类,2024年前开始强调的智能搜索功能,2024年中旬开始把AI搜索作为核功能,2024年10正式定位为AI全能智能助,前在AI主打AI搜索、AI写作和AI拍题三功能。在定位上,AI功能已优先于其早先盘+扫描+浏览器的主要业务。根据下载量变化来看,夸克在2023年中期开始下载量有所下降,但从次年3开始下载量有显著增,并在2024年中旬度达到峰值。结合其宣发来看,我们认为AI功能的全深度结合是夸克今年再增的核推动因素。包AI由字节跳动发布,从今年5开始在各指标上持续速增,前已经在AI智能助赛道形成断层式领先,并在9成为国内个下载量过亿的AI原应,是名副其实的国级AI应。共8款产品今
97、年累计新增下载量超过千万。依次为超过5000万的Kimi智能助和百度库。2000万量级的WPSOffice,以及1000万级别的天AI、星野、腾讯档和阿通义。此外,可画Canva的今年新增下载量已接近千万。总体来看,AI能正在全渗透APP端的各类场景和应,字节跳动的APP战略进展顺利。但杀级场景的缺乏依旧是我国AI APP的未解难题,前还没有产品能够拿出全维度的亮眼表现。由于在市场认知、使习惯、场景拓展等有先天优势,AI+X类产品的数据优势明显。AI原应由以包、Kimi智能助、和智谱清为代表的AI智能助领跑,随后为星野、猫箱等AI陪伴产品和包爱学、斑AI学等AI教育产品。曾被寄予厚望的AI陪伴
98、和AI搜索赛道整体不达预期。但由于APP端在使场景(活化的碎化场景)、可数据(机带的GPS数据、摄像头提供的图像数据等)、使时(全天候互动)相对于Web端和PC端有明显优势,我们依旧认为AI APP未来更有可能出现质变性的增。除机外,智能环、智能家居等其他物联设备也有望在AI APP端发挥重作。05A I 应 竞 争36图:夸克和包的APP界规模榜单2.新增 2024年10新增下载共有14款产品下载量超过百万,TOP 10的槛约140万。千万级以上梯队包含3款产品,分别为夸克(超2400万),包(超2200万)和Kimi智能助(超1400万)。百万到千万级梯队包含11款产品,依次为百度库(超5
99、00万),WPS AI(约270万),猫箱、腾讯档、均在140-200万区间,随后数据下滑120万。来美图公司主打AI视频编辑的开拍即将达到百万。值得注意的是,在新增速度超过百万级的14款产品中,来字节跳动的产品就占据了4款,分别是包、猫箱、星绘和包爱学,分别在AI智能助、AI陪伴、AI图和AI教育中成为了新增速度TOP 1。在后三个赛道中,字节跳动的代表产品在发布时间上均不占据先发优势。1夸克夸克综合类套件2包字节跳动AI智能助3Kimi智能助之暗AI智能助4百度库百度综合类套件5WPS OfficeWPS综合类套件6天AI昆仑万维AI智能助7星野MInimaxAI陪伴8百度AI智能助9腾讯
100、档腾讯综合类套件10通义阿巴巴AI智能助11Canva可画咖信息AI设计12X Eva冰公司AI陪伴13讯星科讯AI智能助14智谱清智谱华章AI智能助15斑AI学猿科技AI教育16猫箱字节跳动AI陪伴17天天跳绳微芒科技AI运动18星绘字节跳动AI图19脸猫闻有你科技AI相机20美图证件照美图AI相机?AI APPAI APP2亿1亿5000万2000万1000万700万500万05A I 应 竞 争373.活跃 2024年10DAU仅夸克1款产品平均活超千万,超过2600万。百万级梯队共4款,包括超760万的包AI、超330万的Kimi智能助、超170万的天天跳绳和超130万的。随后数据下跌
101、50万量级,10-50万共包含23款。TOP 10的数据槛约35万。平均活数据在30万以上的产品包括斑AI学、天AI、星野、X Eva、智谱清、有道云笔记、猫箱和阿通义。AI智能助和AI陪伴两个细分品类的头部产品有明显的整体数据优势。整体来看,AI相机的整体数据同样较为突出。活跃榜单1WPS OfficeWPS综合类套件2夸克夸克综合类套件3包字节跳动AI智能助4Kimi智能助之暗AI智能助5天天跳绳微芒科技AI运动6百度AI智能助7百度库百度综合类套件8斑AI学猿科技AI教育9天AI肯仑万维AI智能助10星野MInimaxAI陪伴11X Eva冰公司AI陪伴12智谱清智谱华章AI智能助13有
102、道云笔记易综合类套件14猫箱字节跳动AI陪伴15通义阿巴巴AI智能助16讯星科讯AI智能助17漫画相机Boniu TechAI相机18简单搜索百度AI搜索19腾讯元宝腾讯AI智能助20稿定设计稿定科技AI设计新增速度榜单1夸克夸克综合类套件2包字节跳动AI智能助3Kimi智能助之暗AI智能助4百度库百度综合类套件5WPS OfficeWPS综合类套件6猫箱字节跳动AI陪伴7腾讯档腾讯综合类套件8智谱清智谱华章AI智能助9百度AI智能助10天天跳绳微芒科技AI运动11Canva可画咖信息AI设计12星绘字节跳动AI图13包爱学字节跳动AI教育14星野MInimaxAI陪伴15开拍美图AI视频16
103、即梦AI字节跳动AI图17讯星科讯AI智能助18天AI肯仑万维AI智能助19通义阿巴巴AI智能助20腾讯元宝腾讯AI智能助2000万1000万500万200万100万70万3000万2000万700万300万100万50万30万20万05A I 应 竞 争384.粘性 2024年10三/七留存率第名夸克的三留存率超过40%,七留存率接近30%。第名是起源于AI语记账的AI陪伴产品叨叨,三留存率超过30%,七留存率接近20%。另外有13款产品的三留存率超过20%,包AI和Kimi智能助数据超过25%,其他产品数据差异,具体包括腾讯档、智谱清、包爱学、星野、斑AI学、天AI、腾讯元宝、通义、讯星和
104、猫箱。TOP 100的三留存率数据槛约10%,较不理想。仅35款产品的七新增留存率达到了10%,3款产品的数据约20%。粘性榜单05A I 应 竞 争1夸克夸克综合类套件2叨叨古红蓝AI陪伴3包字节跳动AI智能助4Kimi智能助之暗AI智能助5百度库百度综合类套件6腾讯档腾讯综合类套件7智谱清智谱华章AI智能助8百度AI智能助9包爱学字节跳动AI教育10星野MInimaxAI陪伴11斑AI学猿科技AI教育12天AI肯仑万维AI智能助40%30%25%22%13腾讯元宝腾讯AI智能助14通义阿巴巴AI智能助15讯星科讯AI智能助16猫箱字节跳动AI陪伴17光速写作好课帮助AI写作18天天跳绳微芒
105、科技AI运动19讯听科讯AI总结20Naver PapagoNaver CorpAI翻译20%18%按照Facebook提出的“40-20-10”法则,也即优秀产品需要达到次留存率40%,7留存率20%,30留存率10%来看,前我国AI APP的粘性仍显不。尽管需要结合应所在的具体业去考虑,但前可以看到即便在主打常频次交互的AI智能助、AI陪伴和AI教育领域,距离这标准也有较差异。39?WebWeb?在观察了各赛道头部产品2024年各访问量的变化后,量位智库遗憾地发现,除AI智能助赛道外,其他所有赛道均基本处于停滞状态,在AI搜索、AI写作、AI图等赛道中,甚出现了头部产品数据下滑、或是下滑后
106、仍未恢复峰值的情况,多款明星产品的数据和宣传度严重不符。值得关注的逆增产品包括:三款AI智能助Kimi智能助、包、海螺AI,AI搜索知乎直答、AI设计美图设计室和Pixso AI等产品原型设计产品、AI图/视频产品即梦Dreamina,3D模型成产品Meshy和Tripo AI。1.规模 2024年10总访问量千万级产品总共7款,包括3款多功能套件和4款AI智能助。全球访问量超过千万的Web端AI产品共67款,国内占约10%。定位为AI智能助的夸克总访问量超7000万,该数据平在全球范围内可进TOP 10。全球范围内第名ChatGPT的访问量超过35亿,Bing的访问量超过18亿。第、三名均为
107、办公类产品,分别是约3600万的腾讯档和约2800万的百度库。AI原产品中的第名为Kimi智能助,访问量同样约2800万,前定位为会推理解析,能深度思考的AI助,并推出了有更强复杂问题推理能的探索版本。后续三位同样为AI智能助,依次为,包和通义。总访问量超过百万的共计40款产品,TOP 10的槛约400万。TOP 100的槛约10万。全球AI产品Web端的TOP 100槛约600万,差距6倍。1夸克夸克综合类套件2腾讯档腾讯综合类套件3百度库百度综合类套件4Kimi智能助之暗AI智能助5百度AI智能助6包字节跳动AI智能助7通义阿巴巴AI智能助8Vidu数科技AI视频9秘塔AI搜索秘塔科技AI
108、搜索10海螺AIMInimaxAI智能助11FlowUs AI息流 云上绿洲 综合类套件12TME Studio腾讯AI乐13百度AI助百度AI智能助14有道云笔记易综合类套件15智谱清智谱华章AI智能助16知乎直答知乎AI搜索17AI新媒体章夸克AI写作18PixVerse爱诗科技AI视频19Canva可画咖信息AI设计20苏打办公360集合站?AI WebAI Web?分?分?规模榜单7000万3000万2000万1000万600万400万300万05A I 应 竞 争402.规模 2024年5-10总访问量共计21款产品过去半年总访问量超过千万。4款产品总访问量过亿,包括夸克3.7亿,百
109、度库约1.9亿,Kimi智能助约1.4亿,约1.1亿。超过千万的21款产品中,具体包括9款AI智能助(Kimi、包、通义、智谱清、天、讯星、百度AI助、海螺AI),4款多功能套件(夸克、百度库、腾讯档、Notion),2款AI搜索(秘塔搜索和知乎直答)。3.活跃 2024年10独访客数独访客数即当访问该站的数量,可视作该站当的MAU,于衡量产品的活跃程度。共三款产品的独访客数超过千万,分别是夸克、Notion和百度库。全球共计26款产品活超过千万,中国占约11%,活跃表现略逊于规模。夸克独访客数超2500万,Notion超1800万,百度库则超过1300万。总共19款产品的独访客数超过百万。其
110、中包括6款综合类套件,6款智能助和2款AI搜索占据和第9位和第11位。另外还有Pixverse、新媒体章、即时设计、可画Canva。TOP 100的数据槛是230万,全球AI产品TOP 100的数据槛超200万。根据使场景来看,创意成类产品的整体排位都较靠后。全使场景、作提效和娱乐场景则表现更优。4.粘性 平均访问次数共14款产品均每访问超过5次,第名是新代思维导图树图treemind,单访问超过8次。AI智能助阿通义和成原型图的摹客Mockplus数据超过7次。TOP 10基本为AI智能助和AI产品设计,TOP 50约均访问3次。1夸克夸克综合类套件2NotionNotion综合类套件3百度
111、库百度综合类套件4腾讯档腾讯综合类套件5Kimi智能助之暗AI智能助6百度AI智能助7包字节跳动AI智能助8TME Studio腾讯AI乐9Vidu数科技AI视频10知乎直答知乎AI搜索11百度AI助百度AI智能助12秘塔AI搜索秘塔科技AI搜索13PixVerse爱诗科技AI视频14海螺AIMInimaxAI智能助15FlowUs AI息流云上绿洲综合类套件16通义阿巴巴AI智能助17AI新媒体章夸克AI写作18Canva可画咖信息AI设计19有道云笔记易综合类套件20苏打办公360集合站活跃榜单2500万1500万1000万500万350万200万150万100万05A I 应 竞 争41
112、5.使深度单次使时13款产品平均访问时超过10分钟,AI图占据重较。前两名都和营销相关,平均访问时约20分种。第名可成商品图的绘AI平均访问时查过20分钟,第名AIGC营销平台绘蛙可以提供商品图和种草图。AI图中包括绘AI、WHEE(WHEE-专业设计师都在的AI图具)、悠船(企业级图桌具)、LibLib AI 和图怪兽。粘性榜单1Treemind树图 聚塔络AI图2通义阿巴巴AI智能助3摹客MockplusAI设计4莫设计创作美好AI设计5创脑词遇络AI智能助6DeepSeekDeepSeekAI智能助7Kimi智能助之暗AI智能助8墨AI万兴科技AI设计9百度作家平台百度AI写作10Fel
113、o.aiFeloAI搜索11腾讯档腾讯综合类套件12腾讯元宝腾讯AI智能助13百度AI智能助14字游侠铭锦轩科技AI写作15同花顺问财同花顺AI智能助16智谱清智谱华章AI智能助17devv.ai深宇识职能AI搜索18天AI肯仑万维AI智能助19GensparkMainfunkAI搜索20奇域AI红书AI图8次7次6次5次4.5次使深度榜单1绘AI绘科技AI图2绘蛙腾讯综合类套件35118 SEO写作百度综合类套件4百宝箱蚂蚁集团AI Agent5创脑词遇络AI智能助6WHEE美图AI图7通义星阿巴巴AI陪伴8莫设计创作美好AI设计9LibLib AI奇点星宇AI图10图怪兽遇图络AI设计11
114、摹客MockplusAI设计12度加创作具百度AI视频13NotionNotion综合类套件14扣Coze字节跳动AI Agent15GhostCut招鲤科技AI视频16Motiff妙多猿辅导AI设计17象寄AI象寄科技AI图像编辑18字游侠铭锦轩科技AI写作19BetterYeah斑头雁科技AI Agent20云界AI互联AI图20分钟18分钟15分钟13分钟10分钟9分钟8分钟05A I 应 竞 争42?AI 100AI 100AI 100是量位智库推出的AI产品和应流向标集合,旨在结合产品功能、落地数据、体验和未来潜,提供AI技术驱动下,产品创新和变的第三参考。量位智库将AI 100分为
115、综合类和原类,前者同时包含“AI+X”和“AI原”两类AI产品,旨在给出完整综合的产品能描述,后者则专注于AI原类应。AI 100的评测体系,涵盖了成能、变落地、体验、市场表现四级指标,包括超20个级指标,全涵盖了技术、商业等产品评价维度,同时包含不同区间的下载总量、新增下载、活跃数、留存率等定量数据,以及评价、底层技术、功能评测等定性评分,以真实数据为基础,结合体验和市场前景,全客观评估AI产品实。1.综合AI 100Web端产品TOP 100的总访问量槛约10万,MAU槛约8万,平均访问时不到2分钟,平均访问次数不到2次。APP端产品TOP 100新增下载槛约5万,活8000,三留存率不到
116、15%。综合AI 100的功能和场景分布分别如下图。按照产品性质分类,则包括71个AI原产品和29个AI+X产品。但AI+X产品整体的数据表现更加突出。?AI 100AI 100?AI 100AI 100?2.原AI 100原AI 100的不同功能占和综合AI 100出现了明显差异。AI智能助,AI搜索和AI陪伴是三个领跑赛道,分别有14款、6款和10款产品围,后两者的数据表现较为般。多功能套件和AI设计的产品数量锐减,证明这两个赛道前仍主要依托AI+X产品进落地。?AI 100AI 100?AI 100AI 100?05A I 应 竞 争43AI Agent扣Coze百度AgentBuild
117、erAI 陪伴猫箱星野X Eva筑梦岛冒泡鸭我在AIWoW叨叨AI 设计标智客AI LogoCanva可画摹客美图设计室墨AI稿定AIMasterGO AI 莫设计Pixso AI堆友D.DesignAI 智能助智谱清天AI腾讯元宝同花顺问财DeepSeek跃问百应海螺AI包Kimi智能助讯星阿通义宝AI 图格LilibAIMeshy即梦AITRIPO吐司AI绘画神采PromeAIWHEE奇域AIAI PPTAiPPTAI 教育包爱学斑AI学海豚AI学AI 视频开拍度加创作具闪剪快剪辑ViduPixVerse万兴喵影可灵AIMorphStudioAI 写作AI 修图AI 乐/效AI新媒体章光速
118、写作笔灵AI新华妙笔AI公写作你我当年AI照修复佐糖FotorAI乐学园给TME StudioAI 翻译AI 开发平台DifyNaver Papago-AI 翻译有道AI翻译AI 总结AI 运动天天跳绳讯听Readpaper包阅AI代码成包MarsCodeCodeGeeXAI 搜索知乎直答GenSparkFelo.aidevv.ai秘塔AI搜索AI 图ProcessOn亿图脑图AITreemind树图GitMind思乎多功能套件夸克百度库WPS Office腾讯档FlowUs AI 息流360AI浏览器博思板Boardmix橙篇讯智悟空AI 相机星绘超能画布 脸猫脸趣剪同款Faceplay秀脸
119、妙鸭相机?AI 100AI 10020242024?100100?AIGCAIGC分?分?05A I 应 竞 争44?AI 100AI 10020242024?100100?AIGCAIGC分?分?AI 翻译有道翻译彩云译AI Agent扣Coze百度AgentBuilder腾讯元器百宝箱AI PPTAiPPT博思AIPPTChatPPTAI 设计Dify堆友D.DesignAI 陪伴AI 图Tripo格吐司AI绘画神采PromeAI星绘Meshy即梦AI漫画相机LilibAIWHEE奇域AIAI 相机剪同款超能画布 脸猫脸趣Faceplay秀脸妙鸭相机绘蛙美影AI 视频Vidu可灵AI开拍M
120、orph Studio快剪辑PixVerse梦闪剪SkyreelsAI 搜索知乎直答GenSparkFelo.aidevv.ai秘塔AI搜索开搜AIAI 教育包爱学海豚AI学TalkAI练语智能语师AI 乐/效TME Studio给快歌易天魔坊AI 修图你我当年AI照修复佐糖像素蛋糕AI 智能助包DeepSeekKimi智能助同花顺问财智谱清跃问百应讯星海螺AI天AI宝阿通义万知腾讯元宝彩云梦AI 总结Readpaper包阅AIBibiGPT代码成包MarsCodeCodeGeeX快码多功能套件橙篇讯智悟空其他Lovekey键盘AI 写作AI新媒体章新华妙笔AI公写作笔灵AI腾讯涌effdit
121、写作讯写作05A I 应 竞 争冒泡鸭我在AI猫箱WoW星野叨叨X Eva逗逗游戏伙伴筑梦岛预塔塔ChatBird?AIAI?AI+XAI+X?AIAI?45按照产品属性,量位智库将AI产品划分为以AI为底层设计逻辑的AI原类产品、在原有互联产品上深度嵌AI功能的AI+X产品、基于外接API微创新的套壳类产品和将多个产品/模型API集中拼凑的集合站类产品。在AI+X产品中,AI体现为在已有产品上叠加AIGC能,在业务和变现上都不以AIGC为核,AIGC于优化核体验。前,各类的头部互联产品均在向该向靠拢,依靠成式AI进步提升的基础与价值。从数据来看,由于和业务流程融合的更为紧密、需求识别明确等原
122、因,此类产品前的整体数据表现显著优于AI原类产品。在围的400款产品观测中,尽管AI+X产品数量较少,但在各维度数据的头部梯队中均占据了前列,具体数据表现也和AI原类产品有断层式差距。在APP端,我们共统计到了34款AI+X类产品,占20%。其中5款产品进新增下载榜前10名,分别为夸克浏览器、百度库、WPS Office、腾讯档和天天跳绳,其中夸克的当下载量接近2500万,排名第。12款AI+X类APP产品进TOP 30,在排除AI智能助后,AI+X类产品占据绝对重。平均活和留存率,AI+X类产品的优势则更加明显。在7款活超百万的产品中,AI+X占据四位,超千万的两款产品均为AI+X产品,分别
123、为WPS Office和夸克。在Web端,我们共统计到55款AI+X产品,占约23%。总访问量前3名均为AI+X类产品,第名夸克全球访问量超7000万,第名腾讯档超3500万,第三名百度库超2800万,总和于TOP 10中其他7款AI原产品的总和。独访客数,也即活跃排名的前四名也均为AI+X类产品,分别为夸克、Notion、百度库和腾讯档。量位智库认为,办公软件和内容平台成为AI+X产品的重点布局领域。AI产品分类AI原类产品以AI为底层设计逻辑AI+X产品在原有互联产品上深度嵌AI功能套壳类产品基于外接API微创新集合站类产品将多个产品/模型API集中拼凑06A I 应 增 46?AI+XA
124、I+X分?分?对办公软件,续写、改写、命题写作等不同程度的AI写作功能,以及针对论、说等不同题材的AI总结功能基本成为标配。全球范围内的代表产品包括Grammarly和Notion AI。其中,主要业务为提供模板及参考内容的素材库类产品和编辑器形态的办公软件表现更为突出,代表产品为百度库和WPS AI。由于AI成效果会直接影响产品的核使体验,此类产品相对更强调具体功能的精准度。素材库性质由于能够在各类题材下提供各类参考档,其原定位更接近素材库,在引AI编辑功能后,新定位已经更新为“站式AI内容获取和创作平台”。具体提供的功能包含:?综合类编辑器性质此类应本属于内容创作具,般在交互和功能设计上更
125、加灵活,允许在编辑器上直接开启续写、改写等功能,以保证不打断创作过程。持的AI功能也会种类更加多样,会采取定的外接API。类似产品还包括腾讯档、有道云笔记、印象笔记等。WPS AIWPS AI06A I 应 增 AI写作和编辑档问答和档总结PPT成上传图成PPT成演讲稿思维导图成研究报告、漫画、说47多功能协作平台性质此类平台在侧重编辑器性质的同时,会更强调不同创作者之间的协同,同时在单个档同时持图表、图、数据、字等不同形式的内容。类似产品还包括妙办画板、画桌、Fabrie等。BoardmixBoardmix?集合站性质由于AI的成能尚法直接幅优化核作内容,此类软件更多提供周边的AI优化编辑功
126、能。稿定设计定位为聚焦商业设计的多场景在线设计平台,在站内会以单点的式提供AI图、AI写作、AI图像编辑等功能。?此外,类似钉钉和书的办公软件会在各类场景及作流内全引AI,强调AI功能的覆盖率和在不同产出间的协同。相对于其他类型的AI+X类办公产品,最价值在于能够结合报销、会议等具体场景,成特定场景下的数字员,或者和使者通过个知识库、使习惯等深度绑定,以个为单位形成AI智能助。在Boardmix博思板和FlowUs AI息流这类强调协作和全范围编辑的办公类产品中,AI功能的全则相对更重要,这类产品往往会全覆盖AI代码、AI表格、AI写作等多种功能,保证整体体验的智能化。全的理念同样出现在集合站
127、式的AI+X产品中。06A I 应 增 48在内容平台中,AIGC多从三个向共同发:基于平台内容的AI搜索、于带动UGC的AI成功能及模板,还有槛进步降低的内容创作具。通过帮助更快地寻找到所需内容,内容平台可以借助AI搜索幅优化体验,同时向搜索引擎进转型。除了抖、红书等将AI搜索融原平台的做法外,现在也已出现了将AI搜索单独剥离为产品的内容平台,如知乎直答和问问宇宙,是对原内容平台定位的次升级。?AI+XAI+X分?分?图:问问宇宙和知乎直答的Web使界图:红书的AI搜索界在促进UGC,妙鸭相机爆后,于成不同物写真的AI相机和类似的AI特效也已内嵌各内容平台和美图秀秀等修图软件。除了能够通过附
128、加功能提升产品体验,诸如猫唱歌、影视剧创等通过AI产出的新内容也往往会在平台上引发现象级传播,拉动整体活跃度。在编辑软件,前,包括字节剪映、快快剪、bilibili必剪、百度作家平台在内的多款创作具均已深度植基于AI的视频/图像/本成功能,万兴喵影等独编辑软件同样有深布局。国外的代表性对标产品是Adobe Firefly。图:抖创作中中的AI内容06A I 应 增 49量位智库认为,X+AI类应在数据表现更优的原因主要包括以下点:场景融合优势:在X+AI应中,AI功能能够缝集成到已有产品和作流程中,需迁移底层数据和逻辑,就可以在熟悉的平台上完成从档编辑到AI辅助的全流程操作。这种深度融合有效降
129、低了的认知和操作槛认知负担最化:在熟悉的界中然植AI功能,复已有的操作逻辑和交互式,避免引新的概念或术语,确保AI功能能辅助不打断作流。场景化的功能还能增强情景感知,进步优化体验付费模式顺畅:AI功能作为附加值提供给,不会额外增加付费环节,避免了AI作为核产品时的定价单性和场景理解基于此,量位智库对AI原产品有如下建议:场景融合:加强与现有具的集成API接与插件开发提供丰富的API接,或者开发跨平台插件,确保AI功能可以嵌的常作流程中跨平台持确保AI具能够在不同平台(如移动端、桌端)缝运,优化的多平台体验简化体验:降低认知负担品牌信任与推然嵌AI功能在熟悉的界中集成AI功能,复已有的操作逻辑智
130、能化功能根据操作上下,提供智能提或动触发AI功能,减少动操作。合作与联合推与知名品牌或平台合作,通过这些品牌的市场认可度提升的信任度06A I 应 增?AIAI?AgentAgent?50?多模态交互的核在于通过整合不同类型的输和输出(本、语、图像、视频、势等),为提供更丰富、然的交互体验。相单的本或语交互,多模态交互能够更好地适应不同的场景和需求,提升机交互的灵活性和体验。例如,在驾驶、运动、办公等不同环境下,可以通过语、势等然式与AI进交流,不仅限于打字或点击。此外,多模态交互可以让AI通过多个感官同时获取信息,从提升对意图的理解。例如,AI不仅可以通过语识别的指令,还能通过图像识别的表情
131、、势或周围环境。多模态信息的融合能够帮助AI更准确和全地理解的需求,减少误解或偏差,帮助AI更有效的处理复杂任务,例如同时通过字和图像来提对物体的识别精准度。在前国内的AI产品中,最为常的是语+字的多模态交互,多出现于AI智能助和AI陪伴中。随着Transformer架构使模型对图像和视频信息的处理能快速提升,预计25年将开始出现更为综合性的多模态交互,AI能够通过物联、特定信息等多种感知通道进协同。多模态输和输出将使AI交互性更强,交互频次更和适场景也更加丰富,带来AI产品整体平的显著提升。以NotebookLM为例,其NotebookLM的“频概览”功能能够将本件、视频、PPT、录甚数据集
132、转换成然、有趣的播客形式,这种多模态输的式在24年引发了波热潮,预计更多类似的热度产品将在25年出现。07A I 产 品 趋 势图:通义效率、包和星野中对多模态交互的持51?AgentAgent?随着技术的发展,对于机交互的需求也在不断进化。Agent作为融合感知、分析、决策和执能的智能体,能够根据历史为和偏好,主动提供建议、提醒和个性化执能,为提供度个性化的任务。其交互的主动性和动化远超出现有的软件。现有的2C产品主要分为内嵌在产品中的特定Agent,以及Agent搭建平台。前者的代表包括智谱清、阿通义、宝等。后者的代表产品包括字节跳动的扣Coze、百度的智能体平台、汇智智能Gnomic、腾
133、讯元器等。智谱华章、阿巴巴也开始在其AI智能助界中添加AI Agent的。同时,我们也统计到了多款企业级的2B Agent产品,以不同员职能为单位,如财会、采购等构建智能体,也就是“数字员”。代表包括逻辑智能的InsiderX智能员、意科技的Tyrion.ai平台、未来式智能的AutoAgents、澜码科技Ask XBOT和Laplace AI Lab等。蚂蚁集团也推出了2B的Agent搭建平台百宝箱。从技术和配套设施两的发展来看,AI Agent即将从2025年开始泛投使。技术上,模型模型性能有了显著进步。具调和多Agent调编排能的完善使Agent能够更好地跨越不同平台和服务。模型技术中推
134、理决策框架的成熟,例如多步骤推理能等,将进步加强AI Agent在推理和决策的核优势,帮助AI Agent能够更为灵活主地应对复杂任务。在配套设施,多个Agent开发平台正在快速发展。各智能硬件商也纷纷在底层操作系统中加强研AI Agent的布局,联想、荣耀等商前已有旗舰机型出现,荣耀已率先发布个跨应开放态AI智能体。搭载有研AI Agent的智能硬件预计将成为智能电设备近期的主潮。量位智库认为,AI Agent有望带来独属于AIGC时代的交互式、产品形态和商业模式。07A I 产 品 趋 势前,Copilot类产品先实现商业落地,Agent类产品尚待时间考验。陈,峰瑞资本图:Agent搭建平
135、台扣Coze和百宝箱交互式从GUI(Graphical User Interface,点击式的图形界交互)到VUI(以物联为代表的智能语交互,Voice User Interface),并最终进Agent UI,也即由Agent根据的意图主动提出建议,协调多平台多应完成任务产品形态相对于单点式被动服务的APP,AI Agent能够更好地满对复杂场景应的需求。结合AI硬件对AI Agent的深度植来看,未来APP的服务形式可能会直接被Agent替代。由于不会再直接和APP发交互,APP端对UI/UX的投将显著下降,转向对核功能研发及不同APP间协调逻辑的开发52从个性化推荐到直接成个性化内容,A
136、IGC能够使体验的个性化程度有明显提升,这将帮助产品进步完善体验,并通过提忠诚度和迁移成本实现差异化定价和进步的服务增值,对产品的差异化竞争有重意义。前,基于AIGC的度个性化已经在AI教育(个性化题库及教学安排)、AI陪伴(AI个助理及虚拟伙伴)、AI营销(商品个性化推荐、营销内容个性化成)领域有明显进展。在硬件端搭载的多款AI智能助已开始以度个性化的个助理作为宣传重点。实现式包括:构建多模态实时画像:融合为数据、偏好设置、历史交互等多种数据,并结合实际情境精准确定需求私有知识库构建及缝对接:持导个档、笔记和专业资料,由AI快速获取专属知识,并构建知识索引RAG优化:RAG(检索增强成)系统
137、应持同时从多个知识源进检索,包括的私有知识库、公共数据库、互联资源等;同时需要具备上下感知能,能够根据当前的需求、任务和对话上下,动筛选出最相关的知识知识适配机制:建个知识域和偏好的映射关系,帮助AI更好地理解的专业背景及对输出内容的偏好商品形式和产品形态的变化相关,由于Agent更强调期、持续性的服务,未来的单点服务形式可能会逐步被持续订阅取代,并出现定制化的动化流程、个性化的知识管理和独特的业解决案等差异化的增值服务?07A I 产 品 趋 势03I N D U S T R Y?AIAI?()AI:落地于千百业()AI落地业特点分析?AIAI?()AI业的变与渗透?AIAI?()我国AI业
138、投融资分析()科技合作伙伴观点精选(三)我国AI及AI落地政策分析千百业优秀AI落地案推荐/54/55/75/78/82/85/87?AIAI?542024年以来,量位智库推出了中国AIGC应全景报告、AI告营销业全景报告、AI视频成研究报告、AIGC教育业全景报告、AI乐应业报告、中国AI模型创业格局报告、中国具智能创投报告、AI游戏驱动产业研究报告等多篇深度报告,聚焦AI技术在产品和业层、在各个不同业的落地场景和发展潜。1.2个情境我们发现,站在当下的节点,尽管AI对千百业的产和态都有改变作,但由于业底不同、环境不同、资源配置重不同,受AI影响的业呈现出AI+和AI 原两情境。前两个章节中
139、,我们探讨了本年度最前沿、热度最的AI技术趋势及AI产品趋势,本章节中,我们将集中讨论AI在千百业的落地情况和呈现出的业特点。区分AI+业和AI原业的重要特征是AI在其组织架构的地位。例如智能驾驶、具智能等业,尽管可以在历史溯源中寻找到汽、机器等原始业,但其脱离AI后就失去了作为个业独关注和研究的意义。但AI+与AI原在业中并不是泾渭分明的关系,是动态发展的。我们认为,AI对业的变和渗透值得度关注。如同曾经的互联技术,在逐渐改变了第、第和第三产业后,慢慢发展成为个独的业。相似地,AI作为新质产,必将逐渐改变与类息息相关的各业,我们相信,千百业受AI变仅有先后、早晚、轻重程度之分,是否之争。基于
140、以上特点和量位智库在2024年度对整个AI及相关落地业的重点追踪和观察,我们以智能驾驶、具智能、智能硬件、游戏、影视、营销、教育、医疗为代表业进研究。AI+:在这情境中,AI多以产具的出现,能够在质量和效率上对业的各个环节进渗透AI 原:在这情境中,业涉及的系统、应和服务从开始就完全基于AI技术进设计和开发本章节中提到的量位智库所发表的报告,均可通过以上维码阅读并下载电版本?AIAI?08A I 智 变 千 百 业55作为本篇第个重点分析的业,智能驾驶业从诞之初即与AI的概念紧密相连。1956年,约翰卡锡在达特茅斯会议上次提出了智能这术语,标志着AI作为个独研究领域的诞;也正是1956年,通汽
141、推出了世界上第辆安装了动导航系统的概念Firebird II。从理念上来讲,智能驾驶领域所追求的驾驶,正是以完善的AI取代类驾驶员。?AIAI?1.智能驾驶:Robotaxi新时代,驾驶时刻来临?12023年,我们跟进了端到端模型在动驾驶领域的重要进展,BEV+Transfomer 技术从数据感知和架构层优化了整个动驾驶系统。2024年,我们关注到世界模型在动驾驶领域的应,世界模型将成未来场景和真实的未来时刻数据,进监督训练。同时在本报告的第章节对相关技术做了更深的探讨。图:2023年度前沿科技趋势报告(2)影响业演进的关键因素 关键配件成本的下降激光雷达量产规模的增加,带来成本进步下探,更有
142、利于规模上。L4技术供应商的局,带来技术持近年来越来越多的L4玩家推出适于乘的智能驾驶产品。动驾驶技术的释放可以让企更快装配技术等级的智能驾驶产品,缩短研周期。量产标准化案数据质量(传感器案是否致),也是智能驾驶能迭代的影响因素之。不同传感器案会使不同的数据格式和处理算法,从需要更多流程进数据转换和统。因此,相同规格的传感器案也能帮助智能驾驶能快速迭代。(1)智能驾驶业的特点当前智能驾驶业存在2业共识:顶天地:技术进阶路线明晰业内智能驾驶产品可被分为、泊两类,每类根据技术难度的增,存在不同的迭代路线。环境中,各玩家的产品迭代路线可分为:泊环境中,各类泊产品迭代路线为:铺天盖地:产品价格槛下探智
143、能驾驶不断向上迭代的同时,配有阶智能驾驶产品的型起售价在不断下降,智能驾驶产品售价也在4万元以下。城区NOA速NOA基础L2级主代客泊记忆泊全动泊半动泊1 对智能驾驶及Robotaxi的更多分析,可以扫码下载我们发布的Robotaxi2024年度格局报告和智能驾驶2024年度报告技术能突破可产品化临界点才可持泛的落地。清华智能产业研究院(AIR)08A I 智 变 千 百 业56 2024年将成为业兴起、商业化落地的关键节点业主要由动驾驶技术供应商、和出平台组成,前尚处于发展阶段,前期研发投。在落地上运营范围和队规模都尚未铺开,玩家出普遍于收。业头部预计将在2024年年底实现收平衡,2025年
144、实现盈利,向正反馈。技术驱动、政策持下的业规模的指数级增技术是Robotaxi的关键驱动,头部玩家已实现端到端模型的动驾驶,即AI模型解决动驾驶除控制外的部分任务;同时,业开始转向利世界模型训练动驾驶算法,世界模型使得动驾驶有望摆脱路测依赖,以更低成本收集到Corner Case,加快算法迭代。政策为技术在场景内的真正落地提供持,同时起到引导规范的作。2023年上海市发布细则对临港新区驾驶智能联汽的测试、应和商业化运营做出明确规定。随后在国内,重庆、深圳、州、武汉和北京等多地都开放试点区域持Robotaxi的测试和运营。两相促进之下,Robotaxi作为智能驾驶业的部分,在今年实现破亿元的市场
145、规模增,并在2030年对约整体市场达到45%以上的渗透率。(4)智能驾驶业市场规模分析2023年,我国L2级新乘渗透率达到47.3%;2024年1-8,国内市场L2及以上智能驾驶装机量累计达605.1万套。2024年,智能驾驶业能够继续创造3000亿以上币的规模;肯锡预计,到2030年中国动驾驶相关的新销售及出服务将创造超过5000亿美元的收。图:我国Robotaix市场规模测算,Robotaxi2024年度格局报告(3)Robotaxi起势如果说智能的落地意味着动驾驶阶段的开启,那Robotaxi的落地正意味着驾驶时代的到来。2024年,我们观察到在智能驾驶业,Robotaxi的兴起正带来业
146、新的增点和发展空间。Robotaxi,狭义是指动驾驶出租,义也可包括Robobus(巴)、驾驶下的其他共享出产品等。08A I 智 变 千 百 业57具智能这概念最早可以追溯到1950年,图灵在其经典论Computing Machinery and Intelligence中就曾提到,在这篇论结尾图灵展望了智能可能的两条发展道路:条路是聚焦抽象计算;另条则是为机器配备传感器使其与类交互学习。这两条道路逐渐演变成了具和具智能。近两年来,随着深度学习和虚拟环境技术的发展,具智能的研究进了全新的阶段。赛道极新:2023年,英伟达CEO仁勋表,智能的下个浪潮是具智能,彻底引爆业热点。前具智能赛道玩家的
147、平均成时间不超过3年,“年轻”是这个赛道的最特点增极速:2024年,随着具智能是AI继续向物理世界深度渗透的必要路径成为共识,赛道持续展现出强劲的增势头。随着技术突破的不断取得、应式的持续深探,预计未来年内,市场规模将持续快速增市场前景期待极:2024年下半年以来具智能赛道投融资事件较上半年增5倍,重押注显出资本市场对这赛道的度关注和极预期。具智能赛道前的头部创企之智元机器,成于2023年2,在年多时间内完成7轮融资,市场估值已光速跃过10亿美元槛源码资本执董事陈润泽表,在具智能领域,短期内技术还法满们对通机器的预期,但在些细分场景,产品化的机会已经逐渐出现。2.具智能:速成下的前景与挑战(1
148、)具智能业诞起即呈现鲜明特点(2)玩家格局中“国家队”“地队”成中坚量图:具智能“国家队”及“地队”20232024.022024.042024.052023.112024.032024.05中科院具智能实验室研发Casia Hand系列灵巧和类灵巧操作机器,获ICIRA 2023最佳学论奖东省具智能机器创新中汇聚东省具智能科研及产业资源,推动形成主可控具智能机器产业集群成都形机器创新中发布机器多模态模型RRMM及双臂协作系统RTACS、“贡嘎号”(Konka-1)超轻量级形机器整机产品北-银河通具智能联合实验室研发“模型耦合抓取”“药店商超场景动取货”“家居场景作”等多个场景下通机器北京具智
149、能机器创新中发布通机器平台“天1.0 LITE”、“天1.1 PRO”、“天1.2 MAX”和具智能服务机器“天轶”,启动“百台天计划”浙江形机器创新中发布全域研台形机器整机“领航者1号”及多由度灵巧发布“领航者2号NAVIAI”2023年年底以来,各地政府及科研机构纷纷牵头成具智能实验室或创新中。系列具智能“国家队”和“地队”前已成为业格局中创业玩家之外另股不可忽视的中坚量。08A I 智 变 千 百 业上海形机器创新中发布国内款全尺通形机器开源公版机“”当下具智能赛道中机器主流形态存在两个向的技术路线:未来趋势型:两加灵巧型机器阶段实型:轮式加抓夹型机器、四机器前者是前业共识中更先进、更未
150、来,也更接近类真实形态的技术路线,前成熟度尚处早期阶段。后者可以看作向前者演化过程中的阶段性形态,前技术更为成熟稳定,离落地更近。当下乎所有“国家队”、“地队”玩家以及部分年轻的创业玩家都会采取第类技术路线,向更未来的技术路径和产品形态发出冲击和挑战,不断在两进稳定性、速度、地形泛化运动能、灵巧泛化抓取等能上寻求突破。同时,也有不少创企尤其是成时间较久的机器企业在第类技术路线上积累更深厚,具备较为成熟的量产落地产品,后形态也距离BC端落地应、实现商业化更近。选择兼顾两条路线的企业也不在少数。58Sim2Real存在GAP从仿真环境到真实世界的迁移(sim2real)存在挑战,例如摩擦等学环境系
151、数模拟难度,迁移过程会造成性能下降问题泛化性挑战巨前具智能的泛化性挑战主要存在于感知能泛化、抓取能泛化、地形识别能泛化等,增强知识转移和在复杂环境中的泛化能是关重要的数据:现实世界数据获取存在瓶颈规模真实数据的采集成本昂,且难以全采集所有可能场景的数据。创建多样化的真实世界机器数据集需要各个机构之间紧密且泛的合作合成数据泛化能存疑合成数据虽能补充真实数据不,但与现实世界数据有差异,泛化能存疑,且单纯依靠模拟数据会加剧仿真到现实的GAP问题(3)技术路径共识形成,业落地向更清晰前限制具智能进步发展渗透的主要难点可以分为以下三:技术:(4)业临技术挑战、落地速度不及预期现有语模型和多模态模型的成功
152、先依赖互联上海量的本、视频数据;相较前具智能研究中海量具数据是相对稀缺的,收集成本也很多。清华智能产业研究院(AIR)08A I 智 变 千 百 业59图:具智能市场规模及预测,36氪、量位智库产业:供应链硬件同质化前市场上的具智能形机器硬件同质化严重,很多机器公司使的本体和其他组件都来同家上游供应商,这限制了形机器产品形态的多样化发展落地速度不及预期前具智能距离真正进BC端的、家庭等使场景为类创造真实价值少还需5-10年,当下应场景更多停留在科研和教育领域。这与市场理性的过预期产了定落差(5)前景阔,远来看有望实现颠覆性变2024年具智能业在技术进步、市场规模扩、应场景拓展等取得了显著成就,
153、同时也临着技术挑战和数据问题。随着技术的不断发展和产业链的完善,预计具智能将在更多领域实现商业化落地,为社会带来更多颠覆性的变。据2024年具智能产业发展研究报告显,中国具智能市场规模已达4186亿元,并有望在未来年内保持快速增态势,具智能市场前景阔。预计到2030年,中国市场规模可达8000亿元以上。具智能创业公司的期成功可能不取决于科研和技术实,是在于理解技术边界和定义产品的能。陈润泽,源码资本执董事02000400060008000100002021202220232024E2025E2026E2027E2028E2029E2030E市场规模(亿元)08A I 智 变 千 百 业毫疑问形
154、机器是承载我们的AI所有想象的最佳硬件载体,之前普遍认为这天的到来还很遥远。现在看来这天的到来要预计快的多。将创投603.智能硬件:PC、机、眼镜、机四硬件与其他业不同,智能硬件业中的产品多数在成式AI涌现以前,就作为智能设备融类的活:电脑、机、机与从前产品在计算能、功能性上的更新相,AI的加对这些设备的更新是命性、彻底性的,将完全改变类使相关电产品的场景、式和需求。峰瑞资本合伙陈表,搭配模型能的AI硬件产品正成为中国团队的优势领域。对于智能硬件业,我们可以从具体的产品变化中微知著:(1)AI PC:具备本地AI能的个电脑 与传统电脑相,AI PC的不同我们可以明确的是,AI PC最重要的特征
155、即具备在本地处理和运AI模型能,它通过集成专的硬件和软件,使AI技术的应更加泛和效。明势创投表:硬件已成为AI落地的原场景,Apple Intelligence,可能是第个活过亿的AI应。传统的个计算机注重的是计算能和硬件性能,AI PC引深度学习、然语处理、计算机视觉等AI技术,并在此基础上更加注重智能化应。(2)AI机:真正打造出个智能系统与AI PC相似,AI机也可被认为是集成了AI技术的智能机,它从体系结构出发,将AI深融机各个模块。对AI机来说,最值得被关注的功能应当是我学习、我优化,甚预需求,为提供更加精准化、智能化的服务。腾讯研究院表明,以Apple intelligence为代
156、表的端侧模型及其服务会加速商业化。更适配AI时代的硬件升级芯:如iPhone 16搭载了专为AI设计的A18芯,提供了强的处理能和能效,同时持Apple Intelligence。处理器与内存:AI机通常配备了更级别的处理器和更的运内存,以持复杂的AI算法和运算需求。传感器配置:配备了更多的传感器,以收集更多的数据和环境信息,为AI算法提供更丰富的输数据。软件智能化和体验的全升级 AI PC的显著优势从技术发展度来说,由于配备了NPU,AI PC相传统个电脑,在处理AI相关任务时效率更、准确性更强。此外,AI PC在实时响应能、低延迟、安全性等有所提升。从应场景度来说,AI PC新增的应场景将
157、包括AI聊天机器、AI PC助理、AI Office助、AI本地知识库、AI图像视频处理以及AI PC管理等,这些场景的落地将完全改变下代的电脑使习惯。AI PC的出现,标志着个电脑从传统的计算终端升级为个AI应中,它将更好地理解需求,提供更智能、个性化的服务。这必将改变PC的使习惯和场景,以前所未有的式推动PC产业的发展。关键技术:神经处理单元(NPU):NPU是为AI和机器学习任务设计的专硬件加速器,能够显著提语识别、图像处理和其他AI任务的效率。本地运AI模型和应:与传统的需要云端处理的AI服务不同,AI PC能够在没有络连接的情况下本地运AI模型和应,这提了隐私性和便捷性。08A I
158、智 变 千 百 业61操作系统:集成然语处理、图像识别等AI的操作系统,更好理解需求,实现更加智能的任务分配和资源管理。应程序:通过AI智能化升级应程序,同时提供智能助、语图像识别、AI摄影、智能档等功能。个性化:以的使习惯和需求作为数据输,进智能推荐和优化。2024年,Ray-Ban Meta眼镜发售销量突破100万台,成为个消费级爆款产品。AI眼镜成为当前智能硬件赛道最引关注的产品形态,充分验证消费者需求和市场接受度,也向商和资本展了巨潜。(3)AI眼镜:空间计算落地关键消费级硬件产品技术路线企业发布时间产品特点售价/元Apple Vision ProAR苹果2024.01.19混合现实头
159、显设备,M2芯,2300万像素屏幕,持眼球追踪和势操作29999OPPO Air Glass 3AIOPPO2024.02.26轻量级双全彩AR眼镜,集成OPPO的AndesGPT 语模型,树脂衍射光波导镜,显亮度达1000尼特,持触控势操作,可通过软件更新获得导航、提词器、快速健康、健信息预览等功能4999XREAL Air 2 UltraARXREAL2024.05.30提供达330英虚拟屏幕,重量仅72克,兼容多种设备,持部分新款机和游戏设备3999智能拍摄眼镜 A1AI闪极科技2024.05.31采紫光展锐旗舰级AI芯和索尼1600万像素背照式摄像头,持实时在线、听和视觉体验999界环
160、AI频眼镜AI北京蜂巢2024.08.08内置先进的AI芯与频模块,实现语命令控制乐播放、接听电话或获取导航信息等智能功能799度AI眼镜AI百度2024.11.12款搭载中模型的原AI眼镜,具备第视拍摄、边边问、识物百科等六功能-Rokid GlassesAI+ARRokid2024.11.18与BOLON眼镜合作,采衍射光波导成像技术,接通义千问模型,兼具AR眼镜、机、AI助和相机的多能,持物体识别、字翻译、数学题解答等功能2499作为当下类最法离开的智能设备,AI机的以上升级能够提机与的适配程度,并提升的产和作效率,使机成为个真正的个智能系统和活助。OpenBMB开源社区提到,像AI机类
161、的智能硬件运端侧模型能创造全新的场景和功,它将成为主流消费电新的竞争焦点。2024年迎来爆发,初步形成3路径前的AI眼镜主要侧重于通过AI提升语交互能,集成机、摄像机、导航、语助等功能。主要可分为AI、AR和AI+AR三种技术路径,分别以Ray-Ban Meta、Meta Orion和Rokid Glasses为代表。多类传统的穿戴类消费电,得益于端侧AI的发展,未来在信息提、通讯、导航等同样有很的想象空间,也是最可能出现爆品的产品向之。杨颜媛,梅花创投08A I 智 变 千 百 业62 体验尚需突破,产品天花板有待探索尽管市场增迅速,但当前AI眼镜在体验侧仍存在些问题。如软件内容和硬件性能不
162、、佩戴舒适性差和续航短等。为提供清、舒适、可持续佩戴的视觉体验是不同商持续进技术演进的标。前AI眼镜正处于快速发展和迭代的前期阶段。总体来看,从AI语眼镜迭代到AI+AR眼镜是当前智能眼镜的主要发展路径。这产品形态当前远未触及天花板,我们将持续关注技术及应开发者态的完善。机硬件因其便携性、轻量化和产品成熟度的特点,成为最早接AI能的智能硬件之。市场增明显AI机市场近年来呈现出显著的增势头。依据洛图科技数据,2024年8中国在线电商平台的AI机销量同增763.3%,销售额增近14.5倍,预计全年销量有望突破20万副,同增488.7%。3应场景前AI机的细分产品场景主要有活娱乐、办公助和质提升三种
163、:(4)AI机:便捷交互,延伸模型应场景场景产品企业发布时间产品特点售价/元活娱乐Ola Friend字节跳动2024.10Ola Friend接包模型,与包APP深度结合。可以通过语唤起包进对话,提供信息查询、旅游出、英语学习及情感交流等场景的帮助1199办公语iFLYBUDS Pro 2 科讯2024.05iFLYBUDS Pro 2能够动识别并转写会议内容,持32种语的同传翻译,内置智能会议助,能够动记录会议要点、成会议摘要,新增“语嘴替”功能,可模拟个性化语1399质提升ARC 3 弧开放式AI机Cleer2024.04ARC 3 弧是款开放式AI机,采不设计,持损或解析度频的效传输,
164、具备AI降噪、健康监测等功能,次在开放式机中实现了杜效和杜头部跟踪1399 潜在模型硬件态布局AI机已成智能硬件布局的重要切点,字节跳动、科讯等模型玩家纷纷进这领域布局。但主流产品尚未集成独的端侧AI模型,主要采云端路径唤醒模型,法脱离机应软件使。更的意义在于增加模型能调,并延伸其沉浸式使场景。将创投表,当前的硬件环境并不能承载我们对模型应的所有想象。前这赛道商竞争尚不充分,市场需求在早期阶段。我们可以看到,各AI终端品牌在积极准备,为明年上量做准备。建平,蓝驰创投投资合伙国内多家商纷纷推出AI眼镜,产品形态的爆。影、闪极、雷、等家预告将在年底和明年初发布相关产品,可以预AI眼镜的产品爆发远未
165、结束。08A I 智 变 千 百 业63作为最有价值的应场景之,AI技术在游戏业的应可以追溯到上个世纪80年代。最初,们只是使程序成简单的内容和随机元素;后来,AI开始辅助游戏设计,例如动化任务和基础的对话成;随着技术能的发展,成式AI技术在游戏中的应逐渐扩展,达到动态世界成的能;到今天,模型等关键技术的进步使AI能够成更复杂的游戏内容,如动态场景、智能NPC为等。AI在游戏业的渗透有以下点优势:游戏开发者天然亲近AI,并乐于使AI领域的各类技术实现设想中的游戏世界;同时,我们不断强调数据在当前时代AI发展,尤其是模型发展中的重要性,来游戏世界的数据幅减少了筛选、清洗的成本;此外,游戏还能成为
166、AI模型能的最佳试验场。4.AI+游戏:施展想象的最佳乐园 图:AI从5对游戏创作作流产积极影响,AI游戏产业驱动研究报告(1)AI新游戏创作先,AI对游戏的影响是业级的。每款游戏都萌芽于个充满灵性的想法,随后制作出模型、草图、故事梗概和游戏格。作流中的每个环节乎都需要位或组3D美术程师来完成,使3D成模型可以直接完成个可调整的3D粗模,提升效率。图:3D美术作流拆解,AI游戏产业驱动研究报告通过简化游戏创作的作流,我们可以把当前AI对游戏的影响归纳于以下5个:美术与格:2D美术与3D成在2D美术中,我们泛地使图像成技术。AI成图像领域中,成模型和神经络渲染是两个主要的技术分。2022年主流成
167、式图像应DALL-E 2.0、Stable Diffusion和Midjourney的诞,使图像成的精细化程度得到了有效的提升。提对图像成结果的控制能得到了提。在3D模型成中,AI主要完成了对3D模型成流程的“步到位”。图:AI BOT,超参数科技08A I 智 变 千 百 业64 测试与优化AI在游戏测试环节中存在3模拟场景,分别是AI玩家模拟、AI NPC和AI游戏模型测试。在优化环节往往承担改善动画、编程&加速、动化游戏测试等功能。通过成字、图、视频、乐来缩减时间和资源消耗,也能快速识别游戏开发过程中的基本问题,并提出改善法。故事情节与NPC游戏设计是整个游戏开发过程的核,AI在与故事成
168、、游戏机制创新等,依托最基础的然语成法。成式AI阶段,游戏开发者在决策式AI的基础上融合更多思维和法以训练智能NPC,通过针对性训练数据集,强化NPC模型的基础能,如知识、对话能、情节演绎和逻辑推理。前,型的智能NPC可以实现封包在游戏中本地运。乐与效2AI成乐的存在2种主流技术路线:基于乐理规则的符号成模型和基于频数据的频成模型。开发者正在使AI成乐来填充游戏过程与游戏UI中需要使到的各类效、不同游戏场景中以渲染氛围的各种乐。AI成乐作为乐资产在游戏制作和发环节使都是常可的,像MusicLM等模型已经持成多轨的作品。使AI成乐为原型、佐以专业制作的协调,将使AI乐更快进游戏制作与发的产线。玩
169、家体验与个性化AI能基于玩家游戏为评估玩家技能平和游戏格,同时动态调整游戏难度,增加或降低敌的数量和强度,改变游戏环境等;不断收集的玩家数据,还能使NPC和游戏系统更加适配玩家平。同时在游戏运营过程中,AI客服和AI分析也是提升玩家体验的重要环。(2)AI带来新的游戏我们关注到,许多充满灵感的开发者正在尝试将AI作为游戏玩法的环,这正是游戏业从AI+向AI原的表征之。2023年Genfun.ai和Meshy联合制作的游戏Soul Chronicle,在当时是款实时3D+AIGC+UGC的MMO游。最突破是先制作出了种与游戏完美融合的3D AIGC技术,在游戏中可以实时成肤。2024年Bitma
170、gic释出了他们推出的能直接创建“游戏世界”的平台Roleverse的最新成果,在平台内可以使提在游戏内定制,对进缩放、挤压和拉伸,也可以轻松地对游戏世界进编辑。(3)AI促进游戏产业变AI技术在游戏开发中的应逐渐落地,为游戏业提供了新的增空间。2023中国游戏产业报告表明2023年我国游戏市场实际销售收为3029.6亿币,同增13.95%;截2024年11,累计收已达2681.16亿元,市场回暖度加强。同时20222023年,中国游戏规模达到6.68亿,同增0.61%,也是2020年增率放缓以来的次进步。不能忽视的是,AI在游戏开发中的逐渐落地为游戏业提供了新的增空间,成本、效率和质量同步上
171、升的时代已来。2 对AI成乐的进步研究,可以阅读AI乐应产业报告08A I 智 变 千 百 业图:Soul Chronicle(左)和Roleverse(右)65影视业是指涉及电影、电视剧、综艺节等影像艺术创作与传播的产业领域。移动互联时代之后,这业的创作、分发和消费式已被深度重塑,为AI技术的落地创造了基础。明势创投表,在影视、游戏、虚拟现实等领域,对品质、实时成的视觉内容需求强烈,市场潜巨。前,AI技术的应已逐渐渗透到产业各环节,影视业在AIGC内容的冲击下,正经历着场内容产、分发和消费模式的深刻命。5.AI+影视:AIGC具掀起内容产命移动互联时代以来,数字化技术已经渗透到产业从拍摄到后
172、期的各个环节,互联内容平台的兴起则为内容产品的分发和消费提供了全新的形式,这些变都为AIGC技术的丝滑落地提供了先决条件。我们在AI视频成研究报告中提到,视频现已成为移动互联最的内容消费形式。2023年以来,以Sora为代表的批视频成产品陆续问世,短短年多时间,AI视频成具已经越来越深地推动着影视业供给侧技术变,随着AI技术能的不断突破,可以预这变将会加速深。降低产成本AIGC技术可在不同场景实现不同程度替代实际拍摄和物理特效,幅度降低制作成本提产效率在需要快速迭代和规模产的领域,如告、社交媒体内容等,AIGC具的优势更加明显个性化内容成AIGC技术能够根据需求成个性化内容,满不同观众的个性化
173、需求解放创作者劳动AIGC具完成量基础内容成作,让创作者可以将精集中在更具创造性的作上,提整体创作质量(1)内容创作、分发和消费式变创造AI落地壤梗图成视频、AI视频特效等弯道超具象化且具备传播性的视频具获得睐,降低了专业的使槛,易于使和接受。AI微短剧将是未来发展的趋势。杨锦洲、韩莹莹,中国联通研究院08A I 智 变 千 百 业短视频短剧/TVC产流程可实现AI具全替代:在短视频领域,短剧和TVC由于其特殊性,成为最早落地AIGC具并率先形成完整全AI作流解决案的内容产场景。(3)短视频场景均有应,渗透率分档明显66从技术发展度,前决定AIGC具在影视业应渗透率的关键因素有两个维度:推理成
174、能:具体包括成时、耗费时间、成清晰度、内容稳定性、丰富度、连续性、指令理解及遵从能、对成内容的控制能、对物理世界规律的深度理解等推理经济性:AI视频成成本与AI作流成本平并逐步发展到显著低于现有成本,持续降低推理成本数量级图:技术发展双维度决定应渗透率阶段(2)AIGC技术发展阶段决定业渗透率演化前渗透率演化阶段根据场景有所区分,主要卡点可以概括为:成内容的不可控性。具体包括形象不致、动作不流畅、表情不动、复杂提词难以完全实现,以及随着时增加逐渐出现明显不符合物理规律的动作发展的问题。时短剪辑节奏快短剧和TVC市场在分钟级和秒级,对视频成具单次成时、连续性、稳定性要求更低,可通过程段提升并衔接
175、以实现商效果内容质量要求相对低市场对短剧质量定位相对电视剧、电影等内容更低、更容易接受内容存在定的瑕疵市场包容性强短剧诞时间短、定位偏下沉市场、属于内容“快销品”,TVC则不属于观众需付费消费的内容产品,对告投放商来说实现商业露出效果即可,因此市场对这两类内容的包容性更强,更能接受技术创新早期造成的“颠簸”推理经济性推理成能TOOLCO-CREATORCREATOR08A I 智 变 千 百 业67视频电影/电视剧/动画开始渗透,AI辅助类进内容产:在视频领域,AI技术尚停留在具层,对作流实现部分替代、降低成本的效果,暂时法提供全流程全AI替代传统作式的解决案。我们在AI视频成研究报告中,对影
176、视业市场规模做了粗略估算。(4)市场前景阔,5年内有望达千亿级市场如图所,国内影视市场规模在2023年约可达3835亿元,若假设2027年AI影视市场可以获得上述国内总市场份额的10%,则国内AI影视总市场规模预计将达约380亿元以上;若假设2030年可以获得25%以上市场份额,则国内AI影视总市场规模将达千亿级别。总体,越接近于综合性思考、策划层,对于AI来讲就越难,越具体的作越容易被取代。陈宇,满江红编剧图:2023年海内外影视市场规模估计,AI视频成研究报告视频平台5亿MAU 4亿MAU3.4亿MAUN/A年营收320亿100亿+230亿550亿(本)短视频8亿+MAU7亿+MAU150
177、0亿1135亿电影08A I 智 变 千 百 业剧本创作与优化AI可以辅助成剧本草稿或提出情节改进案,甚预测剧本票房潜,帮助投资决策概念图分镜成可以快速、效、低成本批量成精准分镜头和质量视觉概念图特效动画制作AI在特效领域的应历史最久,能够成逼真的CGI效果、进数字绘景、动画制作等后期制作AI在剪辑、效设计和彩校正等后期制作中发挥重要作,能够动识别最佳剪辑点,智能拼接镜头,提升整体制作效率虚拟与数字演员AI技术能够创建逼真的虚拟,模拟演员的表演,拓展影视创作的可能性6820世纪80年代改开放以来,中国营销业经历了从传统到数字化再到智能化的变。最初,营销依赖电视、播和报纸等传统媒体。随着互联和社
178、交媒体的兴起,以SEO、内容营销、社交媒体营销、视频营销和直播营销等形式为主的数字营销逐渐成为新趋势。到了今天,AI不仅提营销内容成的效率和质量,也使得营销更加精准和动化,如通过机器学习分析消费者为,预测市场趋势,以及动化执营销任务等。前,营销业或成成式AI最早实现商业化落地的业之。未来,AI技术还将持续推动营销业的深刻变。6.AI+营销:AI让只为打造告成为可能告营销领域的作流程与环节涉及策略制定与画像洞察、告内容的制作、投放渠道的管理与效果分析等作,需要消耗量的时间,其中有较多的作都可以通过 AI代替的式实现效率的提升。(1)AI营销业呈现全新特点回归营销本质:告主营销需求和的需求能进直接
179、匹配,从与机器单向交互,回归到了与的交流流程扁平化:以往告营销全流程需要在内容、设计、定向出价等每步环节做优化,成式AI可以步到位进内容产与投放,减少信息损失从局部最优到全局最优:从传统的告推荐模型,变成以数据驱动的模型为核,实现全局最优的告分配,提升了系统投放的分配效率(2)AI技术变营销策略洞察及内容产投放式08A I 智 变 千 百 业图:营销业或成最快实现成式AI落地的领域,中国AIGC告营销产业全景报告69图:AI营销时代作流程实现深变,中国AIGC告营销产业全景报告创新告形式,带来全新交互体验,提升ROI告的内容形式以及触达消费者的形式均得到极的创新。随着AI成及分发技术的深发展,
180、预计未来将持续改变告业,升级各种类型告形式。提营销内容产效率,实现精准链接和效触达过往营销业受制于产天花板只能做到千,AI营销的新趋势是制投体,即所有的内容产都是根据投放触点及群对应成并进精准投放。的个性化需求与企业的品牌、产品通过AI模型能实现全局最优触达,做到千千。推动营销服务商商业模式新,优化企业作流营销服务商开始通过模型及AI成技术优化企业内部整个作流程,打通全链路数据,探索新的商业模式,提供新的产品、服务、场景,从降本增效,提升利率,给带来全新体验。(3)有效提升营销业产我国经济持续稳定发展,AI成为新增引擎,带来告内容的更新迭代和需求增多,企业为应对市场竞争,更好地满消费者需求和提
181、升的品牌,实施专业化营销策略的动得以增强。(4)AI引擎助告营销业加速成图:2018-2025年中国营销业市场规模统计及预测根据国家市场监督管理总局、中国国际公共关系协会等统计数据,经量位智库测算,我国告营销市场规模预计2030年将接近两万五千亿。如果假设5年后可以获得10%以上市场份额,则2030年国内AI营销总市场规模可达千亿级。0500010000150002000025000300002021202220232024E2025E2026E2027E2028E2029E2030E市场规模08A I 智 变 千 百 业70教育业因其内在需求与模型所擅的能度适配,已成为模型层公司、教育科技公
182、司、智能硬件公司等众玩家的AI落地向。7.AI+教育:因材施教的最佳实现式(1)AI在教育领域的价值我们需要特别提出的是:除了对产和效率的提升,AI在教育领域最重要的价值在于使教育界不变的理念因材施教,有了规模落地的可能。在教师侧,AI能够帮助教师成教学素材、动批改作业、个性化教学分析并提升教师个的专业平和素养;在学侧,AI能够帮助学规划学习路线、智能辅导并持续跟踪学习进度,反馈个性化的评估和调整结果;在市场侧,AI也助推了各教育硬件和学习类APP销量的激增;最终,通过加强AI智能体与教育的结合,AI也将推动教育普惠的实现。(2)AI+教育落地场景 AI学习机(更多向K12群体)3当前国内AI
183、教育玩家多数选择在学习机中搭载模型的式,完成AI与教育的融合。这类产品的出现为提供了增量价值,提了产品销量,同样也为学习机等硬件产品构建了新的竞争壁垒。语类学习App以软件切AI教育赛道的玩家,通常选择接通模型,加以积累的教育数据进微调训练。语合成等技术为语类学习App带来对话体验的全升级,使其成为前模型应于教育的产品中市场反馈最积极的品类 AI教育智能体技术与教育融合,对教育的两个核教师与学产了颠覆式的效果。AI教育智能体能够融到教师和学的常中,在提供教学帮助的基础上,改变者作和学习状态。充当陪伴式家教的AI智能体为学提供个性化教学主要体现在课后阶段,能够实现有效的对学习辅导。具体来说,AI
184、智能体能起到个性化分析指导和启发式互动的作,与传统的搜题软件相,使者将不再受提问形式的局限。在成式AI之前,教育领域采个性化学习是件成本极的事情。3 对学习机等教育硬件的进步研究,可以阅读AI教育硬件全景报告08A I 智 变 千 百 业图:AI教育业图谱,AIGC教育业全景报告71(3)AI+教育的严肃要求教育是个严肃领域,并且对学的价值观形成起到引导作。因此,教育领域的AI应对于AI成内容的准确性、安全性等有常严格的标准。教育业对AI模型的幻觉问题,必须保持零容忍的态度和不断降低幻觉问题出现的技术改进标。教育领域的模型,最关键的是确保模型回答的准确性以及价值导向。这些标准都对类介有结构上的
185、需求,这也为AI在教育业的落地增加了程上的难度,因此也阻了AI在教育场景的完全渗透。但也和多数AI+业的类似,教育是向类的事业,关乎类的存、发展和由。寻找更有效率的式使AI成为教育业的助,减少使和融合过程中的磨损,才是AI融该业的正确向。(4)未来的AI+教育业发展趋势跨学科理解构筑教育模型阶能,将成为模型层玩家核竞争;同时教育模型向多模态演进,落地产品趋于丰富;技术层可以进步关注AI教育智能体与具智能的融合概念,实现AI家教的实体化。此外,语家教也是AI教育智能体的落地场景。语对练既能避免LLM为学习带来的弊端,如照搬答案、弱化思考等,还能够以更便捷、成本更低的式提升语技能。充当助教降低了教
186、师的学习成本,为其提供乎零槛的使式。这在定程度上能够释放教师的产,将更多的精于提升学素养上,是从“解惑”到“育”的转变。在国内,易有道、学思、华东师范学等企业及校纷纷推出教育模型。学术界和企业界,都对AI与教育的结合充满信。全球范围内对AI技术潜在险和道德影响的益关注。随着AI系统变得越来越复杂和强,确保它们的安全性和符合伦理标准变得关重要。推动智能技术的发展,安全优先,同时保证智能性能期发展,未来强调安全与性能平衡发展,强技术驱动、全流程优化、多主体参与以及敏捷治理。韩莹莹,中国联通研究院08A I 智 变 千 百 业图:AI教育智能体成为陪伴式家教,AIGC教育业全景报告(2)诊断及治疗阶
187、段率先实现AI落地医疗业智慧化、数字化进程由来已久,但推进过程中存在些顽固卡点,如数据留存及共享难、药物研发成本、诊疗效率低、医疗资源配置不均衡等问题。成式AI技术实现进步突破之后,再次深度颠覆了这进程,给医疗业带来下阶段的全新底层技术驱动。72AI医疗指的是利智能技术,如机器学习、然语处理和深度学习等,对医疗流程进智能化管理和提升,提医疗服务效率和质量的过程。中国AI医疗的发展历史最早可以追溯到20世纪80年代初,经历年的发展后,在成式AI实现技术突破、国家政策持、龄化程度增加、市场对AI技术接受度提等多因素影响下,AI医疗迎来发展利好。现阶段AI技术对于传统医疗业的赋能主要体现在:数据收集
188、整合打通:过往医疗数据往往分散在不同的医疗机构数据池中,且数据的收集和存储结构各异,难以在保证数据安全前提下有效留存及共享数据;AI技术的推有助于解决数据互联互通和共享问题医疗业模型打造AI医:AI技术使医疗知识库能够快速积累结构化多模数据、垂直医疗模型持续学习医疗知识,逐步打造AI医,为后续科研成果涌现提供基础解放医护劳动:减轻医重复性作负担,同时借助AI量规避为错误;规范化、标准化医疗流程,降低为操作险;实现基层医疗机构远程会诊,提服务覆盖率全提升医疗科研、诊断和治疗效果:利AI分析患者的基因组学数据和活习惯,制定更加精准的治疗案;提升医疗影像、病理识别的准确性和效率,AI软硬件辅助疾病预
189、防、术、康复,提药物研发效率,降低成本8.AI+医疗:诊疗场景率先落地,助推医疗普惠前AI技术在医疗业在预防、诊断、治疗到康复的全流程多场景中均有渗透,产了许多全新的应场景,同时幅提升了许多既有场景的医疗效率和医疗效果。在上述场景中,以诊断阶段的AI医学影像、AI问诊、AI病理诊断,治疗阶段的AI制药成熟度最。图:AI医疗应场景环节场景1.0 预防2.0 诊断3.0 治疗4.0 康复公共卫体检AI问诊智慧病案医学影像辅助诊断病理诊断基因测序术机器理咨询医疗付药指导健康管理康复机器养AI制药(1)成式AI技术突破驱动智慧医疗深度命08A I 智 变 千 百 业73 诊断阶段AI医学影像:医学影像
190、数据与AI能天然匹配 医学影像场景最主要的产资料形式是视觉数据,这场景也是所有医疗场景中数据产出最丰富的,在所有临床数据中占达80%以上,使得医学影像数据成为最早实现全球标准化的医疗数据类型之。医学影像具备易获取、结构化、处理难度等特点,是AI技术率先实现突破的应场景。AI医学影像集中于病变检出、识别,以及良恶性判断等,前应已相对泛,主要优势体现在MR加速成像、XR质控及阅、DSA图像增强优化及辐射剂量减弱等。AI问诊:提升问诊效率与准确性中国AI问诊业在2013年起步,由于们对线下医疗的依赖性,整体发展规模较。随着经济环境的变化,为解决居法去线下就医的问题,国家励推进AI互联问诊。20172
191、022年中国AI络问诊市场规模由3.75亿元增85亿元,市场规模呈指数级攀升,中国AI问诊业进速发展时期。在这场景中,借助AI技术可以实现导诊、医疗问答、诊断建议、科普宣教等医疗服务,主要包括:然语处理(NLP)AI问诊系统通过然语处理技术理解和处理类语,识别患者的症状和描述,提取关键信息、识别理解,并给出合理的医疗建议机器学习机器学习算法使AI系统能够不断学习和优化的诊断能,通过深度学习等技术提诊断的准确性和效率知识图谱知识图谱帮助AI问诊系统构建医疗领域的知识库,将医学知识以结构化的式存储和表,便系统进查询和推理医疗模型医疗模型可以更机动灵活地跟患者对话,获取和整理患者的症状、基本信息、过
192、往药史等信息,并基于专业医学知识图谱和机器学习算法,调覆盖全科的预问诊模型能给出可能的诊断建议AI病理:促进计算病理学发展计算机视觉、分病理学、基因组学和物信息学的快速进步促进了计算病理学的加速发展。计算病理学通过量化癌症组织病理学提取量的物学和临床相关信息。AI算法提供了从量数据中提取信息的框架,因此持计算病理学有望改变未来癌症的诊断、研究和治疗式。08A I 智 变 千 百 业图:传统病理与AI病理对,中泰证券74治疗阶段AI制药:提创新药物研发转化率医药研发是整个医疗产业中的重要环,当前新药研制主要受到:成本(10 亿+)、研发周期(10-12 年)、低成功率(13.8%)三座限制作流程
193、。AI制药前主要将NLP、机器学习、深度学习、然语处理、计算机视觉、成模型等AI技术与传统制药环节做结合,通过数据交叉对、加速筛选、从头成等式,提升新药研发效率,拓展药物创新空间的技术应。主要应于药物研发中的药物发现、临床前阶段,与此同时,AI向临床开发阶段的渗透也正在加快。诊断法传统病理AI 病理观察具显微镜显屏观察空间显微镜下观察具有络以及显条件的空间即可远程病理物理切传输,耗时费数字切传输,实现远程诊疗保存介质蜡切,占库房等物理空间使络存储空间保存时间时间越久,切质量越差,档案管理复杂可永久保存,随时调,不会因为时间原因影响质量阅速度100-200/天500-600/天准确率较,与医从业
194、经验、疲劳度等有关AI技术在医疗领域的应不仅能够增强医疗服务的精准性和个性化,还能为医疗决策提供数据持,促进医疗业的创新进步。有助于优化医疗资源分配,提升诊疗的准确性,降低成本,并推动医疗服务的普及和便捷性。根据GMI统计,2032年AI医疗市场规模将达到700亿美元。图:AI制药流程AI赋能药物研发虚拟筛选与药物发现运机器学习,快速定位和筛选化合物分设计与优化运对抗络、深度学习,优化已知药物结构药物-靶点相互作预测利计算化学法、AI模型,预测药物与靶点结合情况疾病机制探索与新靶点发现挖掘疾病发的分机制,发现新靶点个性化医疗与精准药结合基因组学等数据,定制个性化治疗案临床试验设计优化分析历史临
195、床数据,优化临床试验的设计化合物合成路径规划辅助规划最短、最有效的化合物合成路径艺优化与智能制造优化产艺参数,提药物产效率和质量(3)AI医疗市场规模前景巨预测药物的吸收、分布、代谢、排泄和毒性ADMET 性质预测08A I 智 变 千 百 业75?AIAI?在本阶段,通过联系前对代表业的重点分析,我们思考并回答了两个问题:如何判断个业是否存在AI发展的空间?如何分析业受AI影响的程度?(1)模型因解释业与发展:数据:指业本及视觉数据的密集程度和结构化程度,数据资源越密集、结构化程度越的业接AI能的因业业与发展与需求安全与政策数据原指数需求迭代感知意愿态安全政策智能驾驶具智能智能硬件游戏影视营
196、销教育医疗强烈较中等较少微弱强烈中等较少在该图谱中,影响程度被分为以下个等级:图谱中,颜越深越有利于AI技术在该业的变和渗透;颜越深代表由于对安全因素的要求,AI技术在该业的变和渗透存在阻碍。1.AI业影响图谱?AIAI?09A I 业 渗 透 率76槛越低、速度越快原指数:指业发展与AI技术发展的伴关联性,具体考察两者关键诞、发展、转变的节点时间相关性强弱需求:供给侧需求,指业产品或服务供应商通过AI实现降本增效需求的迫切性,通常商业化平越、市场竞争越充分的业利新技术实现降本增效的经济回报越,需求越迫切迭代:业迭代,指业提供的产品及服务的迭代速度和频率,通常迭代速度越快、频率越的业越重视反馈
197、数据,对利AI技术实现实时、动化作流程,以更快了解产品及服务迭代向,取得相对竞争优势的动机越强与需求:感知:消费者感知,考察AI技术加后,消费者对业提供产品及服务带来增量体验的感知程度以及优化提升幅度意愿:涉及业内对AI进的接受意愿、对AI技术变需求的强烈程度及紧迫度。通常业主要群体互联基因强烈时,业对AI的接受意愿较态:考察AI在业内的需求场景创造能;提旧需求的效率仍然意味着蚕旧的市场,但创造新的需求往往能带来新的增量安全与政策:安全:涉及对AI成内容精准性、价值观对等的要求;前,技术伦理问题益凸显,数据隐私、算法偏、AI道德责任等问题,都要求我们协调技术发展与类福祉、社会环境之间紧张的伦理
198、关系;在更强调安全需求的业,AI进的程难度会显著提升政策:政策持对AI技术在业内的发展具有重要作;通过提供资持、税收优惠、市场准放宽等措施促进业的创新、发展和竞争提升;通过出台试点案、条例等规范业发展轨迹;政策因素对AI技术在业内渗透的促进和限制作同时存在2.AI业态位?智能驾驶智能驾驶具智能具智能智能硬件智能硬件游戏游戏影视影视营销营销教育教育医疗医疗AI业渗透AI业变09A I 业 渗 透 率77根据AI业影响图谱,我们将代表性AI业分为3个态位阶段:先,在智能驾驶与具智能业,源于对AI的紧密需求和强伴性,在业发展与需求的多项指标上都表现出强烈的关联。具智能业由于处在业发展的前期,未表现出
199、明显的供给侧需求和感知,但仍然是受AI变和渗透最强的业之。其次,在第态位的代表业中,营销业的产资料以互联数据为主,这特质使其AI技术接受能、落地速度快。搜索引擎竞价营销时代起,AI搜索算法、AI内容推荐算法已2次重塑营销业的产业链。极的商业化程度和充分的市场竞争属性决定在这类业,AI能有较的变和渗透度,潜在的经济回报驱动下,业拥有更强动机拥抱新技术。同时,数字等营销技术有效升级了体验,在以需求发掘、智能匹配、获客成交为的的业,审美并第要素,也使接受AI技术的意愿更。游戏和影视业同为消费型内容产业,主要市场为C端消费者。其中游戏业尽管诞时间更晚,但与AI技术的相关性却更强。在发展过程中,游戏和影
200、视业都利AI技术实现内容产的降本增效,同时重新归纳整理了原有的作流。值得提的是,游戏业对收集反馈数据并及时迭代的需求较影视业更强,因此会有更强的动机利AI技术实现动化作流程和即时产品迭代。在消费者对AI应效果的感知程度和接受度上,游戏业AI成数字资产、对话、NPC等AI落地场景提了游戏的沉浸感,反馈更积极;影视业对AI内容的落地集中在短视频,视频内容审美等级、技术难度,AI成内容容易受到更多负反馈。受制于AI技术能,以及这类业对内容产出的要求,前在绝多数场景下对的替代能有限,因此需求尚未到达爆发阶段。可以预是,智能硬件业的产品将会蚕原本业产品的市场份额,并倒逼业整体的升级。在该业,AI通过创新
201、应场景和改善体验,提供前所未有的竞争。但在当前,泛存在需求不的问题,这类业对新态的规划能否在实际使中得到实践,将完全改变现有的业格局和业态。最后,教育和医疗业作为国经济的基础业,在每个时代都积极吸纳当前时代最先进的技术,以改善业的发展。尽管这些业没有太多的互联基因,但由于其普惠性,在利和发展AI技术时往往会受到较的政策持。同时,业的特殊性也带来了对安全的要求,标准,造成了AI渗透业的程化障碍。因此,这类业将处在AI业变和渗透的第三态位。09A I 业 渗 透 率?AIAI?478在全球险投资持续低迷的2024年,AI业仍然展现出逆势增的能量。依据烯数据统计,2024年110,国内AI业发融资事
202、件908件,总融资额762.23亿元。相去年同期融资事件数量同减少19%,总额增加29%。这变化主要反映出业整体投资回归理性、机构出更加谨慎,险偏好总体更趋保守,使得资流向集中于热点赛道,也更偏好对规模较、已获得市场验证的头部创企进单笔更额加注。同时,由于AI业整体偏快的演化节奏、业成熟度的快速提升,部分明星项的额融资事件也在客观上助推了投资总额的涨船。榕创投表,今年AI投资整体幅攀升,全球范围内AI仍旧是最强吸赛道,AI团队剥离再创业等孕育新的投资标的。4 本部分投融资数据来源烯数据,数据统计截2024年10,仅统计国内(不包含港澳台)、不包含并购、IPO、IPO以后阶段的投资事件;融资额是
203、估算数值;投资参与投资额、FA服务额为该轮次的投资额。1.太效应明显,热点赛道、头部创企资引强从重点关注的8个AI垂类赛道的投融资情况来看,仅智能驾驶单赛道的投资事件数量达上百件,已超过其他全部赛道总和,总投资额达数百亿币,与其他赛道远不在同数量级。赛道成熟度最,仅达到C轮后融资轮次的企业就有14家。同时,这赛道的明星热点投资事件也最多,4份有桐乡国投、合股权投资、股权基50亿投资哪吒汽,8份还有塞斯115亿元股引望智能。仅仅10内就有远知纳斯达克敲钟,市值超50亿美元;滴滴动驾驶获由汽集团领投C轮2.98亿美元融资;地平线机器港股年内最IPO,市值超660亿港元。堪称今年智能驾驶赛投融资光时
204、段,为智能驾驶市场注了巨信与活。图:8类AI垂直业投资事件数量分布,烯数据图:2024年国内智能融资事件数量度折线图,烯数据02550751001251502024-012024-022024-032024-042024-052024-062024-072024-082024-092024-10投资事件图:2024年国内智能融资总额度折线图,烯数据0204060801001201402024-012024-022024-032024-042024-052024-062024-072024-082024-092024-10投资额(亿元)?AIAI?10A I 创 投79被投企业时间轮次额投资投后
205、估值10.28C+轮数亿元逐资本-10.25IPO4.4亿美元未披露约42.47亿美元10.24IPO51.42亿港元未披露超660亿港元10.22C轮2.98亿美元汽集团、滴滴出约40亿美元9.23Pre-B轮数千万元北汽产业投资领投、上海雀跟投-9.20C1轮数亿元衢州智盛产投、Prosperity7 Ventures、中泰仁和、华登国际-9.5C轮数亿元北汽产业投资、财通资本、浙江融控股、德清县产业发展投资基-6.28C轮未披露亦庄国投、招商资本-5.9Pre-B轮数亿元安徽省铁路发展基、博华资本、投资、海南天智、陕汽智能汽基、讯创投、德载厚资本-卡尔曼4.11C轮数亿元百联挚、创新场、
206、深投控、数字万融、微资本等-3.12C+轮3亿元兴杭国投、紫矿业、郑州新区产业发展引导基-AI原应已经涌现批5亿美以上估值甚独兽的公司,并且获得了PMF验证,达到了千万美以上的年收。联想创投10A I 创 投2024年国内智能驾驶C轮后投资事件80除此之外,具智能赛道也是今年智能领域另热赛道,投资事件余起,数据相去年同期基本翻倍,总额也在数亿币级。下半年以来具智能赛道投融资事件频发,其中逐际动、帕西尼感知科技都已完成A轮融资,知机器、宇树科技、云深处科技更是来到了BC轮次,体现出赛道投融资阶段逐渐成熟。仅家公司融资额上亿的企业包括星海图、星动纪元、宇树科技、逐际动等的融资总额就占到了具智能赛道
207、的半以上,体现出赛道内头部企业资引较强。被投企业时间轮次额投资投后估值10.16Pre-A轮3亿元清流资本、元璟资本、阿巴巴、策源资本、联想创投、世纪源、资本、泽资本、清控天诚20亿元币9.13C轮数亿元上海科创基、中信证券投资,中关村科学城、京国瑞基、红杉中国、琥珀资本 AmbrumCapital、美团珠、祥峰投资80亿元币穹彻智能9.6Pre-A轮数亿元Prosperity7 Ventures、发信德领投,泽资本、创新场、奇绩创坛、Plug and Play、MFund魔量资本等约70亿元8.23Pre-A/Pre-A+轮1亿元基资本、德联资本、英诺天使基、啟赋资本、南战新投、九合创投-8
208、.12天使轮2亿元弘晖基领投、达晨财智、千乘资本、顺为资本、绿洲资本、-7.15A轮数亿元阿巴巴(09988)、招商局创投、尚颀资本领投、峰瑞资本、绿洲资本、明势资本跟投-有机器5.31股权投资1亿元创新场、元璟资本、百度投等-1.29C+轮未披露渝富资本、世嘉闻华、旭辉投资跟投-1.10Pre-IPO1亿元北七星-1.5IPO9.85亿元未披露约190亿港元10A I 创 投2024国内具智能亿级投资事件AI+营销等在2023年更早实现TPF(Technology Product Fit)的赛道今年投资热度呈现下降趋势,投资总额相对减少。AI+教育、AI+游戏、AI+医疗等更晚达到TPF的赛
209、道在今年迎来投资总额增,其中AI+医疗的投资额达去年同期5倍以上,体现出业共识随AI技术及业成熟度的改变正发着快速变化,机构对技术难度更、壁垒更强的业赛道逐渐展现出更强的投资兴趣。在其余赛道中,超千万融资事件13起,其中包括3起超亿元融资事件阿巴巴2亿元币投资精准学,顺为资本、资本、领沨资本、溪资本数亿元币押注潞晨科技,蚂蚁集团1亿元领投爱诗科技。业整体投资热度持续上涨,重点业押注额相较去年存在不同程度提升。812.投资热度向更晚达到TPF的赛道转移被投企业时间轮次额投资投后估值9.30股权投资1亿元武汉市江夏科投超10亿美元8.22B+轮/B+轮4亿元南湖服,南湖国控集团,惠合资本,惠科创等
210、约15.5亿元币7.26B轮1亿元弘芯基,华腾普益,江西中寰-3.1IPO15.6亿元未披露-2024国内智能硬件亿级投资事件与具智能赛道类似的还有智能硬件,在李带热空间智能概念、加诸国内以字节Ola Friend、雷X2-Lite眼镜多个C端明星产品延续去年Apple Vision Pro和Ray-Ban Meta智能眼镜热度的共同助推下,智能硬件赛道今年迎来投资热。与去年同期相,这赛道投资总额增超六倍,主要归功于四起融资额过亿事件Rokid、影科技获亿元投资,雷创新获4亿元投资、旗科技获15.6亿元投资,合计投资额占总额已超九成。10A I 创 投1082最具代表性的AI技术如何从研发向泛
211、落地、创造实际价值?能提供想要的服务,能有当下企业能够承受的投产出。腾讯研究院3个关键要点:1)泛的数据基础:例如现有语模型和多模态模型的成功先依赖互联上海量的本、视频数据;相较前具智能研究中海量具数据是相对稀缺的,收集成本也很多。2)达到产品级能的底层AI技术:例如语模型强的本理解和成能,动驾驶系统在复杂路况下的安全驾驶,技术能突破可产品化临界点才可持泛的落地。3)可实现数据-模型优化-服务能提升的闭环产品形态:AI产品或平台在落地后,本可形成新数据采集-模型不断优化-服务能提升的闭环,例如ChatGPT可利海量的交互数据进步优化模型,提升能;Tesla通过收集海量驾驶数据,进步迭代其FSD
212、动驾驶系统,改善服务。形成闭环的产品形态对AI技术从研发向泛落地具有重要意义。清华智能产业研究院(AIR)1)端到端解决的实际问题,提供完整的解决案。2)产数据闭环,积累私有数据资产,从更了解。3)熟练使和微调最先进的模型,在数据和资都完备的情况下考虑训练有模型,构建早模型层的技术壁垒。联想创投我觉得关键的要点是做到技术为先、场景为重。先你要有深度技术认知和能,预判后续0.5-1年内AI的能边界和发展趋势,其次但更重要也是最难的是,要做出你的落地场景和产品定位的选择,既要跟模型保持安全距离,要避开跟该领域当前领先企业的正冲突,找到合适的细分市场迅速发展,最好可形成定有壁垒的先发优势。根据历史上
213、互联和移动互联的发展经验看,我们建议创业团队要优先选择共识的领域和场景,因为共识可以成为创业公司早期的保护伞,且坚持做正确容易的事情。陈,峰瑞资本投资合伙?A I 创 投0183最关键的点还是理解,理解他们的具体痛点,避免嗨型创业。陈润泽,源码资本执董事,模型的成本下降,会为AI产品和应的爆发进步奠定基础;其次,期待模型通“最后1公”,解决掉最后10%的难题,将真正解决深度的实际问题,在虚拟和现实世界都爆发更的潜。榕创投AI技术从研发到落地般会经过“技术创新-应探索-程化”的发展路径,AI技术落地的关键点是将通的AI技术与落地的场景进程化适配的过程。AI通过以下改进技术适应业领域特殊需求,解决
214、融合技术问题:是提数据可性,通过数据扩充、引先验知识(模型预训练与迁移学习)、络模型结构优化(弱监督/监督)解决样本问题。是提可解释性,基于特征可视化的法,通过得到特征与结果之间的因果/相关关系;基于逻辑/规则/知识的法,利决策树、业知识图谱等可解释的模型构建盒模型的局部/全局近似来实现解释。三是提实时性,聚焦业端侧推理的(半)定制化芯探索,当前基本集中在冯结构局部优化路径;或是利知识蒸馏、模型剪枝与量化等提模型效率。郭耀隆、夏璠,中国联通研究院最具代表性的AI技术如何从研发向泛落地、创造实际价值?A I 创 投核是找到当前技术能够带来明显价值的场景,做好产品。很多技术有进展,但还没有到可以解
215、锁场景的时机;另外有的技术已经够好,但还没有够好的产品形态。如说从GPT-3到ChatGPT,模型的尺并没有提太多,核创新点是把auto-complete的语模型对成了可以遵循类指令,进聊天对话的产品形态。戴森,真格基管理合伙泛落地靠,除了机和电脑,有没有新的落地硬件场景;创造实际价值靠垂直打通,不要本输本输出,要Prompt输解决案输出。明势创投0184最具代表性的AI技术如何从研发向泛落地、创造实际价值?A I 创 投出屏幕。AI技术要向泛落地,实现提效的初衷关键之是要出屏幕,实现与现实世界更紧密的融合与互动。AI技术的出屏幕仍然受制于多的限制,包括硬件层性能与能耗的平衡、AI芯、设备型化
216、、集成化等;软件层包括算法的优化、复杂情况的决策速度、软件的兼容性与更新;在部分场景对数据的质量与安全性也提出了更的要求。未来的AI技术在2C端定有更然的交互式,在2B端体现出卓越的提效与降本。在海量的数据中,们的信息获取更效,数据得到治理,效、垃圾信息更多,也是个具有实性的关键点。杨颜媛,梅花创投AI能提升、成本下降、效率提升,抓住关键场景未被满的需求。王晟,英诺天使基合伙态的丰富多样是AI发展的重要基础。将创投AI技术要落地、创造实际价值,有两个关键:个是底层撑AI技术的硬件,要向AI靠拢,定制化、深度融合,特别是Transformer架构的模型。模型要从线上的问答的Prompt,向普通的
217、正常活,向千百业,它最佳的落地形式,是AI硬件。需要持性能更强、多模态、更参数尺的Transformer模型。但硬件的瓶颈较明显,芯、内存,续航,发热等。是模型本的知识密度,在更的参数量上释放更强的能。端侧模型由常主消费电承载,不依赖络连接,频推理没有成本,端侧云侧离更近,AI最好的落地形式是端侧AI硬件。AI硬件要能真正向落地,创造实际价值,除了硬件能够撑模型流畅运,模型本轻量化性能是根本。多种模态端到端的交互、输出、AIGC内容成,模型的知识密度越,它能渗透的硬件种类就越多;从度和深度两个维度,AI覆盖的场景就越多,粘性和刚需也就越强。OpenBMB开源社区85对我国AI相关发展规划和路径
218、的研究,呈现了期以来我国对AI技术及落地的关注和重视。进到21世纪20年代,我们发现政策更多倾向AI在千百业的落地进展和各AI原业的发展。2020年国家互联信息办公室提出,要利智能技术提升社交平台的信息审核和管理能;2021年“四五”国家信息化规划中提到,要推进信息技术、智能技术与教育教学融合的教育教学变;2022年,北京出台了个数字产业专项持政策;2023年北京发布若措施持本市研发机构聚焦模型、类脑智能、具智能、价值与因果驱动的通智能体等向。资持、政策优惠、才培养和引进、技术创新和应推都将促进AI在各业的落地。?AIAI?AIAI?1.期关注AI在各业的落地,积极推进AI原业发展2.各城市依
219、托发展,优质政策吸引AI才与企业落地同时,北京等城市正在积极推动AI加速赋能千百业,推进模型技术创新与业的深度融合。北京发布的北京市推动“智能+”动计划(2024-2025年)提到,要依托都优势业资源和科技研发能,围绕机器、教育、医疗、化、交通等领域组织实施批综合型、标杆性重程,促进模型核理论与技术突破,增强智能程化能,提重点业的科技平和服务质量,构建跨业、跨领域协同创新组织模式,形成模型业应新态。上海在上海市教育领域推动规模设备更新专项动计划中强调教育硬件全升级时,特别提到在智能等关键技术领域的硬件建设。武汉在武汉市智能联汽发展促进条例(草案)中对智能联汽检验检测产业发展,建设智能联汽封闭测
220、试场、检验测试平台,构建智能联汽试验与测试评价体系等的意对Robotaxi等智能驾驶项在武汉市的发展起到关键的促进作。AI技术在迅猛发展之下,已成为推动经济社会进步的重要量。AI在千百业的落地也将吸引量AI才与企业落地,良性循环将促进整个产业的繁荣与发展。从整体性意指导和各地落实政策2个度来看,我国在AI及AI落地业的政策体系呈现出以下2特点:10A I 创 投86?AIAI?中国智能学会(CAAI)在沙成智能是新兴的科学,我们应该积极持20 世纪 70 年代末 80 年代前期,些智能相关项已被纳国家科研计划。中国智能联合会议 2004年共召开了8 次。此外,还曾经联合召开过6届中国机器学联合
221、会议。进 21 世纪后,更多的智能与智能系统研究课题获得国家然科学基重点和重项、国家技术研究发展计划(863 计划)和国家重点基础研究发展计划(973 计划)项、科技部科技攻关项、信部重项等各种国家基计划持,并与中国国经济和科技发展的重需求相结合,求为国家做出更贡献。智能计算机系统、智能机器和智能信息处理等重项列国家技术研究发展计划(863 计划)次召开了中国智能联合会议(CJCAI)中国智能学会智能机器分会成全国智能计算机及其系统学术讨论会届第五代计算机学术研讨会21世纪初代表性研究:视觉与听觉的认知计算、向Agent的智能计算机系统、中智能搜索引擎关键技术、智能化农业专家系统、虹膜识别、语
222、识别、理与情感、基于仿机器的机交互与合作、程建设中的智能辅助决策系统、未知环境中移动机器导航与控制等中国智能学会牵头组织,向国家学位委员会和国家教育部提出设置“智能科学与技术”学位授权级学科的建议在中国学位体系中增设智能科学与技术博和硕学位2016全球智能技术会业和信息化部、国家发展改委、财政部等三部委联合印发机器产业发展规划(20162020 年)国家发改委和科技部等 4 部联合印发“互联+”智能三年动实施案2015中国智能会中国智能书发表科技部关于持建设新代智能范应场景的通知国经济和社会发展第四个五年规划和2035年远景标纲要组建批国家实验室,推动智能和命健康领域的发展国务院学位委员会办公
223、室公了新增42个“智能科学与技术”硕学位授权点国家信办成式智能服务管理办法(征求意稿)国务院新代智能发展规划1981.91984-1985198619891993.7智能则国智 科技强则国强2009中国科学院第七次院会、中国程院第次院会开幕式上发表重要讲话由于数据、云计算、移动互联等新代信息技术同机器技术相互融合步伐加快,3D 打印、智能迅猛发展,制造机器的软硬件技术趋成熟,成本不断降低,性能不断提升,军机、动驾驶汽、家政服务机器已经成为现实,有的智能机器已具有相当程度的主思维和学习能。.我们要审时度势、全盘考虑、抓紧谋划、扎实推进。2014.62015.72016.42016.5201720
224、22.82023.42024强调到2020年智能产业成为新的重要经济增点,智能技术应成为改善的新途径该办法对成式AI技术、成内容、主体责任、数据源和数据处理等都做出了规定,旨在促进成式智能健康发展和规范应10A I 创 投投放AI后,案例DAU次增最达2%整体增率稳步提升,最可达10.2%每天服务全球60余个国家数亿客满意率业第,续约100%87AI Agent在游戏赛道的探索?超参数科技成于2019年,是家将AI与Game Agent深度融合的创新型科技公司。公司运前沿AI技术、通过游戏场景提升Agent的主性和互动性,打造Agent智能态,为全球提供独特的互娱体验。前,该公司旗下产品现已在
225、多款千万活的头部产品中持续稳定运营,不断推动AI与互娱产业的深度融合与发展。Game Agent作为 虚拟玩家(队友或对)参与游戏赋能开发者降本增效、提升游戏质量、增强玩家体验,提升游戏运营效率与效果;对游戏态的期规划和动态调控,实现游戏资源的有效管理和优化配置;前已为多款年流10亿+产品提供AI服务,覆盖MOBA、FPS、SLG、RPGs等多个游戏品类;Game Agent在游戏中扮演NPC根据策划的设定及AI的我发育,推动剧情发展、增强沉浸感、增加游戏的可探索性;通过AI成的动态场景与任务,以及 NPC 之间的动态社会关系模拟,衍出新剧情故事,提供多样化玩法。整体效果:现已在多款千万活的头
226、部产品中持续稳定运营Game Agent峰值在线数达153 万AI识破率低,99.5%概率认为AI识破率在(0,2%区间运前沿AI技术,通过游戏场景提升Agent的主性和互动性,打造Agent智能态,以Game Agent为载体,为塑造差异化、性化、个性化的产品体验。(2)优化玩家体验,互动量&满意度上升AI发起局间互动,中低段位玩家互动量提升50%以上,被点赞率提90%;AI接管掉线玩家,掉线玩家客诉率相对下降200%玩家类型互动量变化新玩家77%活跃玩家53%资深玩家46%135791%2.1%5.9%7.55%8.35%案例A DAU 度统计(1)有效提升 DAU 增率等关键指标产品与技
227、术创新:业务接离线训练在线服务模仿类为最化rewardAI模型AI服务器操作指令游戏状态AI服务器接收的状态、返回的游戏操作指令集,均与类玩家完全致游戏环境游戏对局数据数据清洗监督学习强化学习游戏对局环境样本成监督学习AI模型AI服务器强化学习操作指令游戏状态Game Agent技术案:Game Agent Produce Pipeline:均服务次数4000亿次累计服务数超过10亿累计服务时4.3万时落地效果:客反馈:ProducingTrainingFine-tuningDeployingProduct requirementMillions of users worldwideThous
228、ands of various gamesHuman interaction&feedbackGame Agent in originalUser behaviorGame Agent proficient in gamesGame Agent more personalized11优 秀 落 地 案88懂技术懂品牌懂平台的AI营销之道?奥创光年Mogic Al,国内领先的AI智能营销科技服务商。2021 年创,为企业客提供营销策略洞察、AI 内容制作、AI 智能投流内容管理等全链路营销解决案。2024年,该公司持续深耕市场营销赛道,专业且效地为提供了全升级的品牌传播解决案。短视频内容洞察使A
229、I甄别最优内容创作向:通过抽取全最优效果20%TOP内容,AI动打标;能够智能分析质内容、平台流量逻辑;输出内容策略,指导内容创作与投放运营。服务200+线品牌AI视频交付数量达200w+产品与技术创新:主要提供E2E短视频营销服务、AI内容制作、AI智能投流到DAM内容管理的全链路营销解决案。内容营销平台节庆群活动热点主题创意种草带货短视频AI批量快剪内容洞察达洞察内容洞察模块智能合成批量制作内容规模化产模块内容合规智能投放内容分发模块内容管理内容策略内容合成运营调优内容标签体系质内容知识抽取知识库构建CV/CG内容数据采集AI智能产品核能MOGIC Content AI Studio互动指
230、标提升转化指标提升业竞争策略品牌内容策略群/商品策略素材产策略短视频内容洞察短视频投放运营E2E短视频营销服务动态内容管理平台资产管理内容协作资产管理模块图、营销案AI成AI智能分镜与打标 短视频AI动混剪成基于AI技术的内容规模化制作:Guesswork转向Datawork的思路:采集解构业内容算法洞察内容趋势平台内容数据平台垂类业内容商品数据品牌内容数据输出洞察结构产出故事线脚本成内容落地效果:效果:跨平台内容洞察AI较全度提升3-10倍周期更新创意热点AI较速度提升80%效果稳定AI较效果数据提升2-5倍客反馈:视频创意投放提升G品牌 ROI+22%L品牌 ROI+68%达素材动化混剪K
231、品牌 ROI+10%CTR+30%素材平均消耗+20%G品牌 ROI+30%11优 秀 落 地 案3D游戏玩法及资产AIGC全新解决案VASTVASTVAST创于2023年3,是家致于通3D模型研发的AI公司,专注于打造众级别的3D内容创作具,建3D的UGC内容平台,在3D原、2D优化、多视成、编辑动态场景、物成等3D成向发布论110余篇,被引13359次。前已发布3D内容成具Tripo AI。Triplane Meets Gaussian Splatting:Fast and Generalizable Single-View 3D Reconstruction with Transform
232、ers结合三平和斯泼溅法,2秒实现质量图3D,个基于斯泼溅的图3D法PI3D:Efficient Text-to-3D Generation with Pseudo-Image Diffusion训练2D图模型成3D隐式表达,3秒实现3D3D原UniDream:Unifying Diffusion Priors for Relightable Text-to-3D Generation同时成解耦的法向和基础,输出质量PBR材质模型Text-to-3D with classifier score distillation次剖析了SDS损失函数的本质,并提出新的损失函数,成质量幅提升2D优化Won
233、der3D:Single Image to 3D using Cross-Domain Diffusion次提出成多视法向和RGB图,2分钟质量图3DEpiDiff:Enhancing Multi-View Synthesis via Localized Epipolar-Constrained Diffusion将轻量级极线注意模块插扩散模型,利极线约束实现跨视图交互,重建质量3D模型DreamComposer:Controllable 3D Object Generation via Multi-View Conditions通过将图3D模型的输从单图扩展到多图,可以通过控制新视图像来实现
234、3D可控成和多种编辑操作多视成技术创新:落地效果:客反馈:专为提升游戏开发效率和创意设计多模态成技术快速成静态/动态模型持动画绑定和主流引擎缝集成低槛功能强3D内容成具Text-to-3D基于简单字描述成质量3D模型Image-to-3D将上传的图像转化为模型Mixamo动画绑定结合骼动画成完整可的模型跨平台持兼容 Blender 和 Unreal Engine,游戏/影视多场景制作核功能产品创新:AI原游戏开发:两位开发者利Tripo在短短两周内完成了基于Prompt的3D怪物成乱游戏,玩家可以Prompt成拥有战能的3D怪兽,并与其他玩家的怪兽进匹配对战使模型进化。这案例充分体现Tripo
235、满型团队效快速开发需求的能。游戏资产效制作:通过Tripo快速完成JRPG 3D场景,结合MidJourney设计和Godot引擎,优化了建模到场景整合的作流。社区游戏TripoGo上线 7 天内吸引了超10万,在TikTok韩国Roblox主播间泛传播,分享率达50%Scenario使Tripo完善格化的游戏和资产成流程,效率提60%Yahaha推出恐怖游戏模板,在引擎内实现UGC游戏npc动化成游戏作室在Unity流线中快速完成demos和辅助资产制作,产时间减少70%型游戏开发者从本和图像成3D资产,快速创建原型并迭代游戏资产,成本降低30-50%游戏美术作室快速成多种材料和环境资产,交
236、付效率提60%11优 秀 落 地 案8911优 秀 落 地 案Rokid创于2014年,是家专注于新代机交互技术的产品平台公司。前致于AR眼镜等软硬件产品的研发及以YodaOS-XR操作系统为载体的态构建。公司通过语识别、然语处理、计算机视觉、光学显、芯平台、硬件设计等多领域研究,将前沿的Al和AR技术与业应相结合,为不同垂直领域的客提供全栈式解决案,Al、AR产品已在全球80余个国家和地区投使。90产品与技术创新:消费级AI+AR眼镜先者RokidRokid落地效果:客反馈:然、符合本能的交互式持头动接听,点头接听电话,摇头拒接电话接AI模型能可实现智拍照答题、多语翻译、AI快速回复消息、A
237、I实时导航刷新率、巨幅屏幕刷新率和巨幅屏幕创造沉浸式智能体验运动防抖功能适应更多场景通过逐帧追踪技术,确保在运动或颠簸环境中画保持稳定硬件设计实现舒适性突破智能瞳距调节、近视群友好、舒适软性镜腿、超轻空鼻托多屏展多任务处理可同时实现社交软件沟通、视频播放、办公软件使等功能操作系统和平台YodaOS-MASTER空间操作系统空间定位与交互多模态交互空间显与渲染运动模式消费级终端产品Rokid AR Lite空间计算套装OST光学透视技术多联屏持多任务协同颠簸环境运动模式分体式设计Rokid GlassesAI+AR智能眼镜衍射光波导技术深度整合通义千问模型9轴IMU传感器双超线性保真定向扬声器R
238、okid Max+StationAR娱乐套装BirdBath光学案清Micro OLED屏幕专利腔设计定向扬声器内容态扩展态伙伴海内外AR眼镜服务突破250+海内外AR眼镜购买破30万+使时2h45m+海内外AR注册开发者6200+海内外AR企业开发者2500+开发者海内外博市场占有率99%+载AR娱乐市占率70%场景11优 秀 落 地 案落地效果:客反馈:Reel Diffusion:站式AI短剧创作具Reel Diffusion叙事型视频的成能达到全球业领先准。从算法到训练数据及程实现都为短剧创作进专设计,尤为擅成激发情感共鸣的短,帮助创作者讲述引胜的故事。Reel.AI:全球款AI短剧应
239、Reel.AI于2024年次在海外发布,迅速登上娱乐应畅销榜,随着成式 AI 的速发展,AI 成内容在部分场景已经可以达到可消费级内容准,带来AIGC Super App巨机会。Reel.AI正是在这判断下,成功探索出的第款AI原应。其先提出并落地的AI短剧+AI互动融合的产品体验,完成了商业验证。剧本输设定分镜成成包装短剧发持成+理解体的多模态模型创作者意图遵循准确率提100%满业务场景要求内容致性和可控性为100分钟以上的优质故事型视频设计表演及剧情是优质故事型视频核引发情感共鸣是消费级内容创作关键创作可观看质量消费级AI短剧可与剧中互动丰富沉浸互动体验消费 2024年7,登上点点数据iO
240、S海外娱乐畅销榜 2024年11,根据短剧内报道iOS榜单跻第7位Absolutely obsessed cant wait to see whats the plan for tonight.乎察觉不到ai的息,这个路线感觉是可以最先商业化的画感挺然的,细节还算不上华丽。另外,故事不错。上海电影、filMarathon全球AI电影拉松赛井英科技与Jud Willmont导演合作AI短M.A.D获B站观众选择奖奖项榜单真实评论优 秀 落 地 案AI短剧创作及内容平台?产品与技术创新:CreativeFitting(井英科技)成于2021年,是家专注于视频成模型探索及AIGC娱乐应的公司,AI短
241、剧业领军者。发布研AI短剧站式创作具,为创作者打造了AI短剧创作新模式。发布全球款AI短剧App Reel.AI,致于成为全球最的AIGC内容平台。ACreativeFitting(井英科技)成于2021年,是家专注于视频成模型9111优 秀 落 地 案结语此,2024年度AI趋势已经全展现。2024年度AI趋势报告不仅是本年度我们对AI整体、系统的观察,也是量位智库的年度报告,是我们对量位智库整年以来作的总结。第,与量位起,我们依然发挥着前沿科技瞭望所的作。我们所谈论的技术,不论在成熟度、商业落地上的进展如何,都是最新、最重要、谈及AI绝对避不开也绕不开的。除了向前展望,我们还从GPT-3时
242、代起就坚持做科普向的短报告,求最短时间内减少信息差。第,2024年5起,我们期跟踪AI应在Web和APP两个端的各项表现,并以为单位发布分场景数据报告。不同的是,除了持续追踪最新的数据外,我们还会基于对技术和赛道的研究附上分析以供参考。第三,在业篇中我们也谈到,本年度量位智库发布了余篇各AI落地业及环节的研究报告。在业上涉及智能驾驶、具智能、教育、影视、游戏等各个赛道;在具体落地环节上综合对市场的特别观察,针对市场的投融资情况发布了创投类报告、针对市场的集中程度发布AI模型创业格局类报告。2025年,我们将持续关注以上议题的最新进展并且进步挖掘更为深度的内容。我们还规划了对2024全年AI应产品的整体分析、对模型落地和前沿趋势的探讨、以及更多向其他被AI改变的业的研究总之,在AI渗透的各个环节,我们都在关键的节点和位置做了相关研究。随着时间的推移和研究的深,最终我们希望路陪伴的读者能够以最清晰、有逻辑的式构建对AI及相关产业的体系化认知。同时,我们也正通过沙、对话、社群等式将学术界、产业界、投资界以及爱好者聚合起来。量位量位智库量位智库助(社群)?