《伽马数据:2024全球AI应用趋势年度报告(39页).pdf》由会员分享,可在线阅读,更多相关《伽马数据:2024全球AI应用趋势年度报告(39页).pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、全球AI应用趋势年度报告2025年1月2024全球AI应用趋势年度报告|在2024年,全球人工智能产业迎来了跨越式的发展。自2022年ChatGPT发布以来,生成式人工智能(AIGC)和大语言模型(LLM)技术持续取得突破,AI应用迅速渗透至社会生产和生活的各个领域。全球主要经济体纷纷出台AI发展战略和监管政策,产业投资持续升温,AI生态体系逐步完善。过去一年,AI的快速发展在各个层面上都带来了深刻变化。无论是行业从业人员还是普通用户,都深刻感受到人工智能的影响与变革。从产业链角度来看,基础层、技术层、应用层全面爆发;在垂直行业应用方面,AI技术已经广泛渗透到医疗、金融、制造、自动驾驶等关键行
2、业领域;在具体应用场景上,从助手类产品、图片生成、音乐创作到视频生成、陪伴类产品、搜索类产品等,均呈现出爆发式的增长,用户数量迅速攀升。全年AI领域的投资规模突破了4000亿元人民币,全球首部AI监管法案今年在欧盟也已生效。这一飞速发展的势头带来了巨大的市场机遇,同时也伴随而来的是一系列不确定性与挑战。在此背景下,伽马数据编制了2024全球AI应用趋势年度报告。作为一家专业的第三方研究机构,伽马数据旨在通过本报告回顾2024年人工智能行业的主要发展趋势和数据变化,深入分析全球AI监管政策和发展战略,研究AI领域的投融资规模与结构变化,探讨重点赛道的投资偏好与布局特征,细致剖析产业发展的关键赛道
3、与潜在机会,评估可能面临的挑战与风险,为行业发展提供客观、专业、前瞻的分析见解,助力AI产业实现高质量、可持续的发展。前言22024全球AI应用趋势年度报告|2024全球AI应用趋势年度报告|2024年全球AI行业十大最具影响力事件3在本报告的开篇,我们摒弃那些所谓的“新一轮工业革命”“重塑人类社会”的宏大叙事框架,也抛开那些“炸裂”“震惊”“颠覆”等等浮夸的修辞,以更为冷静、理性的视角,深入剖析过去一年,行业内究竟发生了哪些具有深远影响的大事件。AlphaFold2是由DeepMind开发的一种基于深度学习的蛋白质结构预测工具,成功预测了数百万种蛋白质的三维结构,而在今年DeepMind的创
4、始人DemisHassabis与JohnJumper因其在AlphaFold的研发中的关键贡献获得诺贝尔化学奖,这不仅仅是生物学领域的一次技术革新,它代表了AI技术与生命科学融合的巨大潜力。TOP 1AlphaFold2“获”2024诺贝尔化学奖谷歌推出的Willow的量子芯片,它解决了量子纠错领域近30年来一直试图攻克的“量子纠错阈值”难题,并且能够在5分钟内完成传统超级计算机需要约10的25次方年才能解决的计算任务,推动了量子计算从理论走向现实。TOP 2谷歌量子芯片WillowNeuralink公司成功将脑机接口芯片植入首位人类大脑,并取得了良好的恢复效果,这预示着未来在人机交互、神经疾
5、病治疗及增强人类认知能力等领域的广泛应用潜力,标志着脑机接口技术的一个重要里程碑。TOP 3Neuralink首度植入人类大脑这是WorldLabs推出的革命性的AI系统,能够将任何普通照片转换成一个可以交互的3D虚拟世界,该系统遵循基本的物理规则,展现出真实的深度感和空间感,这进一步降低了虚拟世界构建的门槛。TOP 4WorldLabs发布交互式3D世界AI系统o1模型采用了多种新技术和方法,通过结合强化学习与思维链技术,显著提高了多步骤推理任务的处理能力,尤其在数学、编程与科学问题解决等领域的表现超越了现有的AI模型,并在部分领域达到人类专家的水准,O1的发布带来了AI推理能力的新高峰,也
6、为大模型训练和发展方向带来了新的思路。TOP 5GPT-O1模型2024全球AI应用趋势年度报告|4由OpenAI推出的AI视频生成模型Sora,标志着视频创作领域的革命性突破,Sora能够根据简单的文本描述或静态图像,生成高质量的视频,涵盖丰富的场景、角色、动作和细节,其逼真程度接近电影级别,展现了人工智能在视频创作中的巨大潜力,尽管直到12月才正式开放使用,Sora的发布引发了全球范围内的技术热潮。TOP 6视频生成模型Sora2024年8月,欧盟人工智能法案开始实施,这是全球首部全面监管人工智能的法律框架,为全球人工智能发展与治理设定了法律标准,并为其他国家和地区的相关立法提供了参考和借
7、鉴,对全球AI技术发展及监管产生了深远影响。TOP 7欧盟人工智能法案正式通过特斯拉发布的新一代人形机器人,Optimus不仅具备高度自主性,能够在动态环境中完成复杂任务,还具有广泛的应用前景,涵盖工业、家庭和服务等多个领域,Optimus的推出标志着人形机器人技术的重大进步,是具身人工智能和自动化领域发展的一项重要里程碑。TOP 8新一代人形机器人:Optimus2024年3月,英伟达发布了最新的BlackwellGPU架构,其进一步提升了AI训练与推理的计算能力,为深度学习和AI模型提供了更强大的硬件支持,将对产业的发展起到非常直接的推动作用。TOP 9英伟达发布BlackwellGPU架
8、构,提升AI计算性能苹果公司推出的AppleIntelligence系统,深度整合了人工智能技术到iOS、iPadOS和macOS等操作系统中,标志着苹果生态系统的重大升级。随着超过20亿苹果活跃设备接入AI功能,这一举措将极大提升用户体验,推动AI在日常生活中的广泛应用。TOP 10苹果发布AppleIntelligence系统2024全球AI应用趋势年度报告|目录5前言2024年全球AI领域最具影响力的十大事件宏观趋势政策情况投资情况AI应用大盘分析全年访问量趋势分析各个分类流量情况分析垂直行业分析Chat助手赛道分析AI视频赛道分析AI陪伴赛道分析AI图像赛道分析020306070915
9、161718192429352024全球AI应用趋势年度报告|宏观趋势2024全球AI应用趋势年度报告|政策情况国内政策地区差异明显:广东、浙江、北京领跑人工智能政策发展基于各省发布的人工智能相关政策进行的统计分析显示,各地在AI发展政策的支持力度上存在明显差异。除国家层面的19项政策(占比12.4%)外,广东省以18项政策(占比11.8%)位居首位,其后是浙江省的16项政策(占比10.5%),北京市和江苏省并列第三,各自发布了12项政策(占比7.8%),其中,广东省凭借深圳等地的科技创新优势及完备的产业链条,展现出最为强劲的政策推动力度;浙江省依托其数字经济优势,紧随其后,推动AI政策快速发
10、展;而北京,也通过密集的政策部署,持续巩固其在AI领域的引领地位。这种政策分布态势反映出我国人工智能发展呈现出明显的区域梯度特征,也预示着未来AI产业有望在这些政策引领的区域率先突破,形成新的增长极。048121620国家级广东省浙江省北京市江苏省福建省上海市四川省山东省河南省重庆市中国各地区人工智能政策发布数量分布71政府政策数据来源:包括政府官方网站、政策文件和公告,以及权威的新闻媒体报道2024全球AI应用趋势年度报告|算力建设成全年政策重点:44%的政策涵盖算力中心建设2024全年出台的人工智能相关政策中,涉及算力建设的内容占比高达44%,成为地方政府推动AI产业发展的关键举措。随着大
11、模型和大数据等技术的快速发展,算力需求呈现爆发式增长,算力中心的建设、绿色化和智能化也逐渐成为各地政府关注的重点。在区域布局方面,北京、广东、江苏、四川等地的算力建设目标尤为突出。北京以45 EFLOPS(百亿亿次浮点运算)的智算目标领先,且强调算力基础设施的自主可控与绿色低碳发展;广东计划到2025年突破40 EFLOPS,智能算力占比达到60%以上,并推动算力服务产业应用;四川则计划到2027年算力规模达到40 EFLOPS,力求降低数据中心PUE至1.3以下,推进绿色算力发展;其他如江苏、深圳等地也设定了明确的算力目标,推动区域竞争不断加剧。同时,多地推出了“算力券”等政策,降低中小企业
12、的使用门槛,北京每年发放1亿元算力券,提供最高30%的费用抵扣,深圳、成都等地也有类似政策,支持中小企业创新发展。82024年各地区算力建设目标省份政策文件目标北京市北京市算力基础设施建设实施方案(20242027年)2025年,智算供给规模达到45EFLOPS广东省广东省关于人工智能赋能千行百业若干措施2025年,算力规模超过40EFLOPS上海市上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025年)2025年,智能算力规模超过30EFlops甘肃省甘肃算力基础设施高质量发展三年行动计划(20242026年)2026年,算力规模超过30EFLOPS山西省山西省算
13、力基础设施高质量发展实施方案到2025年,算力规模超过9EFLOPS江苏省江苏省算力基础设施发展专项规划2025年,在用总算力突破24百亿亿次山东省山东省算力基础设施高质量发展行动方案2025年,总算力达到12.5EFLOPS天津市天津市算力产业发展实施方案(20242026年)2026年,智能算力规模达到10EFLOPS以上贵州省贵州省“千兆黔省、万兆筑城”行动计划(20242025年)2025年,算力基础设施算力规模达200EFLOPS以上湖南省湖南省人工智能产业发展三年行动计划(2024-2026年)2026年,湖南省智能算力达到3600PFlops重庆市重庆市算力高质量发展三年行动计划
14、2026年,算力规模达到14EFLOPS河南省河南省算力基础设施发展规划(20242026年)2026年底,算力规模超过120EFlops四川省四川省人工智能产业链总体工作方案(2024-2027年)2027年,算力总规模突破40000P河北省关于进一步优化算力布局推动人工智能产业创新发展的意见到2025年,全省算力规模达到35EFlops以上福建省福建省推进算力基础设施高质量发展的实施意见(征求意见稿)到2026年底,全省算力规模达到10EFlops以上内蒙古自治区内蒙古自治区促进通用人工智能发展若干措施2025年底,总算力规模将达到84000P政府政策数据来源:包括政府官方网站、政策文件和
15、公告,以及权威的新闻媒体报道2024全球AI应用趋势年度报告|监管趋严:政策指导走向精细化与系统化2024年,中国人工智能行业的政策呈现出监管逐步完善、指导政策精细化和系统化的趋势。国家在推动行业发展的同时,也加强了监管和合规要求。例如生成式人工智能服务管理暂行办法要求服务提供者进行备案和安全评估,明确了生成式AI的合规框架;人工智能生成合成内容标识办法(征求意见稿)则要求为生成内容加标识,防范虚假信息传播;此外,人工智能安全治理框架从算法开发到应用部署建立了全面的安全治理机制。在指导政策方面,政府开始推动标准化体系建设,提出到2026年制定50项国家标准,并参与国际标准制定,增强中国在全球人
16、工智能规则中的话语权;同时,鼓励人工智能与实体经济深度融合,提出了大模型、算力中心和数据集建设的明确规划,通过这些政策,中国正加速构建完整的AI生态体系。9国际情况2024年:全球人工智能迈入规则化治理元年在今年,各国政府都陆续出台了一些具有里程碑意义的监管法规,全面覆盖技术安全、伦理治理、透明性和数据保护等关键领域,在此背景下,人工智能相关的法律实践和立法取得了多项突破,例如,中国广州互联网法院审理了全球首例AIGC(生成式人工智能)侵权案,美国知名作家起诉OpenAI的案件,引发了关于生成式AI版权保护的广泛讨论,推动全球人工智能治理框架的加速形成。2024年3月21日,联合国通过了首个关
17、于人工智能的全球决议,明确提出推动AI安全发展、伦理规范和国际合作的原则,为各国协调制定AI监管政策提供了统一指导;8月1日,欧盟正式生效了全球首部全面监管AI的法律人工智能法案,为AI的分级管理、风险评估和数据透明性等设定了明确标准,树立了国际监管的标杆;7月11日,美国国会通过了内容来源保护和完整性法案,重点加强了对生成式AI滥用、深度伪造(deepfake)等现象的管控。此外,亚洲的多个国家,包括新加坡、韩国和日本等,纷纷出台了本国的人工智能法规,针对AI安全、数据隐私、算法透明性等领域建立了本地化的监管框架。2政府政策数据来源:包括政府官方网站、政策文件和公告,以及权威的新闻媒体报道2
18、024全球AI应用趋势年度报告|102024年全球人工智能监管概况国家/地区政策文件详情欧盟人工智能法案全球首部全面监管人工智能的法规,适用于整个欧盟。设定了AI使用的保护措施,并限制了执法机构的采用,规定了严格的AI风险管理要求、透明度和运营义务以及低风险AI系统的免费使用权美国关于人工智能国家安全备忘录该备忘录指示五角大楼和其他美国国家安全机构以安全、负责任且加快的方式增加对人工智能技术的采用日本AI业务指南旨在为所有AI开发者、提供者和使用者提供统一的治理原则,以确保AI的安全使用和促进创新韩国人工智能基本法该法案通过设立专门机构、推动产业发展和强调安全伦理,力求在促进AI技术进步的同时
19、,最大限度地降低潜在风险,增强公众对AI的信任东盟东盟人工智能(AI)治理与道德指南第四届东盟数码部长会议上发布了东盟人工智能(AI)治理与道德指南,旨在授权东盟的组织和政府负责地设计、开发和部署人工智能系统,并增加用户对人工智能的信任美国、英国和欧盟人工智能、人权、民主和法治框架公约全球首个法律约束力的国际人工智能公约,确保人工智能系统生命周期内的活动完全符合人权、民主和法治,同时支持技术进步和创新欧盟通用人工智能业务守则(初稿)为通用人工智能模型的提供者提供了明确的指导和规范,通过规定提供者的义务和责任,守则有助于建立一个更加透明和可预测的法律环境,促进人工智能技术的健康发展美国、英国和欧
20、盟内容来源保护和防止编辑和深度伪造媒体完整性法案美国国会通过了该法案,旨在解决人工智能生成内容(如“深度伪造”)的滥用问题,正在等待总统签署生效新加坡人工智能安全指南及配套指南该指南涵盖了网络安全风险,包括对抗性攻击和供应链威胁。同时强调通过设计和默认设置来确保人工智能的安全性卡塔尔人工智能指南该指南要求获许可实体制定明确的AI战略,确保董事会问责制,并管理AI风险,实体必须维护更新的AI系统登记册,并获得QCB对某些AI活动的批准新加坡生成式人工智能治理框架(框架)该框架提出了指导公司在开发或部署生成式人工智能时的建议,并基于安全、透明度和安全等关键主题。阿联酋人工智能发展和应用宪章宪章着重
21、于为人工智能应用创造一个安全的环境。它规定了安全公平的人工智能发展原则,旨在加强人机关系,提高人工智能意识,并遵守相关法律联合国通过首个关于人工智能的全球决议该决议支持一项旨在确保人工智能造福所有国家、尊重人权且安全、可靠的国际努力政府政策数据来源:包括政府官方网站、政策文件和公告,以及权威的新闻媒体报道2024全球AI应用趋势年度报告|投资情况2024年全球人工智能产业融资金额超4000亿元,同比增长超77%投资规模分析:2024年投资金额达到历史新高,为4,829亿元,较2023年增长77.2%。投资数量变化:2024年投资数量降至624笔,降幅达52.4%,这反映出投资市场正在经历结构性
22、调整,投资更趋理性和精准。投资质量提升:平均单笔投资金额从2019年的1,529万元上升到2024年的7,723万元,增长超过4倍,这表明投资者更注重项目质量,愿意对优质项目进行更大规模的投入。这些数据和趋势表明,AI行业正在经历从量变到质变的转折点,投资逻辑更趋成熟,市场对项目的要求也更加严格,建议投资者和创业者更加关注技术创新和商业落地的结合,在细分领域寻找差异化竞争优势。11020040060080010001200140001000200030004000500060002019年2020年2021年2022年2023年2024年过去六年人工智能行业投融资数量与金额概览金额(亿人民币)
23、数量(起)数据来源:IT桔子,公开新闻等资料,伽马数据整理。投资金额:美元按汇率6.5转换为人民币,以确保数据的统一性与可比性。2024全球AI应用趋势年度报告|融资企业业务分析:通用模型融资金额超50%,融资金额与数量均领跑通用模型在融资金额和数量上都占据绝对领先地位,融资金额近2650亿元,投资案例约50起,显示了资本市场对基础AI能力的强烈信心,基础设施(包括算力和云计算)位列第二,融资金额约700亿元,表明AI基础设施建设仍是重要投资方向。头部集中:前三个领域(通用模型、基础设施、智能驾驶)的融资金额占比超过80%,呈现明显的马太效应。中尾部分散:生物医疗、AI安全、数据隐私等垂直领域
24、融资规模相对较小,但案例数量不少,说明这些领域仍处于市场培育期。120100020003000通用模型基础设施智能驾驶芯片研发AI编程生物医疗机器人AI安全数据平台技术框架服务2024年融资金额TOP10业务方向金额(亿元)0204060通用模型生物医疗芯片研发基础设施企业智能化工业制造企业服务智能营销AI编程机器人2024年融资数量TOP10业务方向投资数量数据来源:IT桔子,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|C端应用企业仅获不到10%融资ToB市场已展现出相对成熟的商业模式优势,一方面,企业客户具有明确的支付意愿和预算能力,另一方面,在数字化转型浪潮下,大型企业
25、对AI解决方案的需求十分迫切,这为ToB领域的AI企业提供了清晰可行的变现路径。相较而言,ToC市场的商业模式仍处于探索阶段,用户付费意愿普遍较低,商业模式尚不明朗,这也直接影响了资本市场的投资热情。139.87%90.13%C端应用与非C端业务融资金额对比TOCTOB A轮融资最多(189起),表明大量AI企业已渡过初创期,进入快速发展阶段 种子轮和天使轮接近(分别为90起和101起),显示市场对早期项目关注依旧较高 B轮后数量急剧下降,反映出AI企业在规模化过程中面临的挑战 战略投资金额最高(约2420亿),反映出大型企业和资本深度布局AI领域;C轮融资金额居第二(约980亿),表明快速扩
26、张期的企业获得资本重点支持;融资金额分布数据揭示了AI行业从“野蛮生长”向“理性发展”转变,投资者更加注重企业的实际价值和可持续发展潜力。融资事件数量分析融资金额分布分析数据来源:IT桔子,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|14基于全球AI投资分布数据,我们可以观察到几个关键现象和深层趋势:投资规模的地域分化全球各国家/地区投资情况分析:0501001502000100020003000融资轮次资金分布概况金额(亿)数量(起)从投资总额来看,美国以3752亿元遥遥领先,主要集中在基础技术研发和前沿突破;中国投资610亿元,侧重应用层面和商业化,且投资数量众多但单笔金
27、额较小;欧洲投资约178亿元。从投资效率方面来看,美国的单笔投资金额最高(约21.7亿元),倾向于支持大型创新项目;中国单笔金额较低(约1.7亿元),呈现出“多点布局、快速试错”的策略。3651734335各国投资数量分布中国美国欧洲其他各国投资金额分布中国美国欧洲其他数据来源:IT桔子,公开新闻等资料,伽马数据整理AI应用分析2024全球AI应用趋势年度报告|全年访问量趋势分析整体趋势分析2024年AI应用的访问量呈现持续增长态势,从1月份的36亿次访问量增长到12月份的76亿次访问量,年度访问量增幅达111%。这表明AI应用在全球范围内的用户接受度和使用频率都在稳步提升。161020406
28、0801月2月3月4月5月6月7月8月9月10月11月12月2024年全球AI应用访问量趋势访问量(亿)62.93%7.18%6.17%4.34%3.45%3.32%2.50%1.92%1.47%1.46%1.27%1.18%0.87%0.39%垂直赛道流量数据Chat助手图像设计虚拟聊天文字写作效率工具视频工具搜索引擎营销工具音频工具商业服务编程开发教育学习个人助理安全检测3D生成数据说明:访问量指Web端数据,来自于Similarweb,相关产品来自于伽马统计的两万+款AI产品2024全球AI应用趋势年度报告|各垂直行业流量分析Chat助手类产品超400亿的访问量遥遥领先,占据绝对主导地位
29、。相比2023年增长了211亿访问量,增长率达到116%。这表明AI对话助手仍然是用户最关注的AI应用场景。17虚拟聊天和视频工具表现出极强的增长势头。虚拟聊天增长了260亿访问量(144%增长率),视频工具增长了14亿访问量(141%增长率),这反映出市场对视频内容生成的需求正在快速上升。这些数据表明,AI应用市场正在经历快速增长期,用户对AI工具的接受度和使用频率都在显著提升。增长情况分析101002003004005003D生成安全检测个人助理教育学习编程开发音频工具商业服务营销工具搜索引擎效率工具视频工具文字写作虚拟聊天图像设计Chat助手x 100000000各分类访问量对比2024
30、年2023年数据说明:访问量指Web端数据,来自于Similarweb,相关产品来自于伽马统计的两万+款AI产品垂直赛道分析2024全球AI应用趋势年度报告|Chat助手赛道分析用户规模变化从图表可以看出,全球Chat助手类产品的访问量,从2023年的约180亿次增长到2024年的约440亿次,增长率达到144.41%。这种爆发式增长表明AI助手市场正处于快速扩张期。19144.41%0%50%100%150%200%01002003004005002023年2024年2024年全球Chat助手类产品增长情况访问量(亿次)增长率产品数量分析从产品数量数据来看,Chat助手类产品数量在过去一年间
31、也实现了显著增长,从2023年的100个增长至2024年的250个,增幅高达150%。0501001502002503002023年2024年全球Chat助手类产品数量12数据说明:访问量指Web端数据,来自于Similarweb,相关产品来自于伽马统计的两万+款AI产品2024全球AI应用趋势年度报告|头部玩家分析ChatGPT以378亿访问量占据绝对领先地位,其访问量超过前十名总和的80%,体现了显著的马太效应。第二梯队由Gemini和Claude构成,分别获得35亿和7.7亿访问量。值得关注的是,中国企业在这一赛道快速崛起,Kimi、文心一言、豆包和通义千问成功跻身全球前十,这显示出中国
32、AI企业的技术突围和市场渗透能力。从时间维度看,2022年底至2023年是该赛道的爆发期,超过60%的头部产品在此期间面世,市场呈现出快速迭代和激烈竞争的特征。参与主体方面,传统科技巨头(如Google、阿里巴巴)、专业AI公司(如OpenAI、Anthropic)和新兴创业力量(如月之暗面)共同构成了多元化的竞争格局。20排名名称访问量所属国家上线时间所属公司1ChatGPT37802700000美国2022年11月OpenAI2Gemini3500013300美国2023年3月Google3Claude776532000美国2022年5月Anthropic4Poe441569832美国20
33、22年12月Quora5Kimi248807784中国2023年10月月之暗面6文心一言202479750中国2023年3月百度7DeepAI139397257美国2017年Google8豆包124157714中国2023年8月字节跳动9You97000000美国2022年12月SuSea Inc.10通义千问95474500中国2023年9月阿里巴巴3访问量数据说明:指Web端的流量数据,来源于Similarweb,统计周期为2024全年2024全球AI应用趋势年度报告|Chat助手类产品发展分析21 2024年发展方向分析 2025年发展预测多模态能力全面升级长文本处理能力的提升成突破智能
34、体平台化2024年是Chat助手多模态能力大爆发的一年,从年初开始,各大产品相继推出或增强了图像识别、视频生成、语音交互等多模态能力。ChatGPT推出了GPT-4o系列模型,支持多模态 推 理;Claude 发 布 了Claude3系列增强视觉能力,文心一言和天工AI等产品也都在多模态方面有重要突破,这表明AI助手正从单一的文本交互向全方位的感知理解方向发展。2024年3月,KIMI凭借其支持处理200万汉字且无损保留上下文的技术优势,迅速在市场上崭露头角,获得了广泛关注,这 促使其他主流智能助手纷纷跟进,陆续推出了类似的长文本处理功能,行业竞争格局由此发生了重要变化。2024年另一个显著趋
35、势是Chat助手纷纷转向平台化发展,ChatGPT、Claude、文心一言、智谱清言等都推出了智能体平台,支持用户自定义和调用各类专业化智能体,这反映出AI助手正在从通用对话工具向专业化、场景化方向演进。产品形态将从对话方向向平台化演变多模态协同能力飞跃,视频生成能力成标配视频内容理解能力提升定制化和个性化豆包、Claude等相继推出与操作系统深度整合的桌面客户端;同时增加了文件处理、数据分析等专业功能,产品形态将进一步融合,体验更加丰富,浏览器、操作系统等平台会与AI助手实现更深度的整合。2024年,我们看到了几个主要人工智能助手引入了视频生成功能,像豆包、文心一言和智谱清言这样的产品已经推
36、出了视频生成功能,标志着这一变革的开始,2025年多模态和视频生成能力将成为助手类产品的标配。人工智能助手将在理解复杂视频场景方面发展更高级的能力,包括识别多个对象、它们之间的关系以及它们在同一帧内的运动。这将使对视频叙事和背景的理解更加深入,超越简单的物体检测,达到理解复杂交互和事件的程度。AI助手将能更好地理解用户长期偏好和使用习惯,会出现更多基于用户数据的个性化训练方案。42024全球AI应用趋势年度报告|22 2024年头部Chat助手类产品更新情况ChatGPT上线GPT商店(智能体)语音播报功能2023年9月推出的语音聊天功能升级Memory功能,可记住用户的偏好发布GPT-4-T
37、urbo,增加读图能力发布GPT-4o模型具有多模态能力发布GPT-4o mini,成本更低的小模型,具有文本智能和多模态推理的能力发布o1系列模型,提升复杂推理能力,在科学、编程和数学等领域表现出色高级语音模式,能够感知用户语调、语速,捕捉用户情绪推出ChatGPT search搜索功能视频聊天和屏幕共享功能,可以实时识别摄像头和屏幕内容Claude发布包括Claude3系列模型,提升多模态能力,增加图像识别提问功能发布Claude3.5 Sonnet,提升视觉推理、编码能力、理解和生成高质量内容能力升级Claude3.5 Sonnet,发布Claude3.5 Haiku,提升推理、编码和视
38、觉处理方面能力上线数据分析功能,解析数据、自动编写代码推出桌面客户端推出个性化功能,可根据自身风格定制回复Gemini由bard更名为Gemini发布Gemini1.5,支持多模态能力和超长上下文推付费计划推出Gemini1.5Pro,增加多模态和上下文窗口长度,增强音频和视觉处理能力。出记忆功能,可以记住用户偏好Gemini2.0版正式发布:支持音频、图片的多模态输入和输出调用谷歌搜索等原生工具智能体支持KIMI提升联网搜索能力,支持引用溯源上线智能体平台Kimi+多功能语音通话模式:支持更换声音语速调节,声音克隆发布探索版:能够将模糊或抽象的问题具体化、信源分析、链式思考能力。数学版上线,
39、深入理解数学知识。增加kimi创作空间,内测音乐和视频生成视觉思考版上线,具备图像理解和思维链技术豆包上线智能体平台增加文件上传、快捷调用、图片解析、深度搜索等功能推出电脑客户端,可与本地操作系统进行了结合AI音乐生成上线支持实时语音通话豆包电脑版推出“数据分析”功能“帮我写作”功能,支持分步骤撰写长文,创建文章大纲等上线图片理解功能支持一键生成带有指定文字的图片电脑版更新,从一款从前以对话为主的产品,变成AI浏览器、文章编辑器、AIGC生成的All in one产品电脑版支持视频生成功能豆包推出视频生成内测文心一言支持一键生成专属数字分身上线定制专属声音功能上线智能体平台接入百度网盘文件可从
40、百度网盘直接导入绘画功能升级,用户可以直接通过提问画图绘画功能升级,支持一键生成多比例图片上线“深度写作”专业版功能,通过主动搜索引用资料,提升文章内容的丰富性和针对性数据来源:官网,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|23 续:2024年头部Chat助手类产品更新情况海螺AI上线海螺问问改名海螺AI,主打人生搭子上线手机悬浮球功能上线音乐生成和视频生成更新视频生成:支持图生视频功能元宝APP上线AI搜索和文档解析能力增强,文档长度和数量增加上线AI深度搜索模式:可一键生成脑图、表格,梳理事件上线智能体平台元宝APP2.0版上线:支持多种模态理解和生成上线AI视频天工
41、AI发布天工大模型2.0:增加文生图等多模态能力新增多款AI Agent发布天工大模型3.0:增强搜索、代码、图标绘制能力增加音乐生成、图片识别、代码写作等功能发布天工大模型4.0:支持处理文本、图像、音频等多种数据形式上线实时语音助手Skyo上线AI高级搜索功能:升级多层次分析推理能力,升级金融、科研领域的搜索能力推出AI彩页功能,一键完成内容生成、排版、设计和美化等创作流程通义上线智能体平台上线Qwen1.5模型,支持多语言和上下文处理能力上线音视频问答助手超长音频转写发布通义千问2.5版,增强文档处理能力、音视频理解能力、集成编码助手等多模态能力上线翻译助手上线AI做PPT上线AI生视频
42、功能推出了代码模式图像局部风格化讯飞星火上线V3.5,支持长文字、图文、音频,增加情绪表达能力,声音复刻上线智能体平台上线All Tools,包括联网搜索、代码解释器、文生图等功能上线V4.0,增加个人空间,增强长文本溯源和智能体能力支持语音对话图文、语音、视频等多模态实时交互上线多模态交互大模型,支持情绪感知;多模态视觉交互等智谱清言上线智能体平台上线AI生成视频模型清影增加视频通话功能推出AutoGLM智能体:输入指令即可跨APP模拟人类操作手机升级思维链+深度阅读发布AI高级搜索功能,提供智能的结果排序、精确的查询解析、对多模态内容(如文本、图像、视频)的支持,以及语义理解和上下文感知能
43、力数据来源:官网,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|AI视频赛道分析用户规模变化从数据来看,2024年全球AI视频类产品的访问量达到约25亿次,相较于2023年的10亿次,实现了141.28%的增长。24竞争情况分析根据数据显示,全球AI视频类产品数量从2023年的300个增加到2024年的500个,一年内新增200款产品,增长率达到66.67%,越来越多的企业和技术团队投入该领域。01002003004005006002023年2024年2024年全球AI视频类产品数量12141.28%0%50%100%150%0510152025302023年2024年x 10
44、00000002024年全球AI视频类产品增长情况访问量增长率数据说明:访问量指Web端数据,来自于Similarweb,相关产品来自于伽马统计的两万+款AI产品2024全球AI应用趋势年度报告|头部玩家分析253排名名称细分分类访问量所属国家 简介1wondershare视频剪辑178600000中国主要是视频剪辑工具Filmora和数字人制作工具Virbo,Filmora在2023年2月接入了OpenAI的ChatGPT技术,用于视频创作2VEED.IO视频剪辑146600000英国在线视频编辑工具,提供视频剪辑、字幕添加、特效应用等功能,同时提供AI技术赋能的文本转视频、自动字幕、虚拟人
45、等功能3InVideo视频剪辑107800000美国2023上线AI相关功能,提供包括视频模板、幻灯片制作器、AI脚本、无脸视频生成器、屏幕录制器等多种工具4Luma视频生成99900000美国专注3D内容生成和重建,推出Dream Machine AI模型,能够从文本和图像快速生成高质量的短视频片段,具备逼真的动作和一致的演员表现5Vidnoz数字人87780000美国提供了包括语音克隆、AI虚拟形象以及文本转语音等多种AI功能,提供了超1000个AI人物头像,400多个虚拟形象,上千个视频模板,支持上百种语言6Runway视频生成82200000美国提供文生视频、图生视频、视频生成视频的功
46、能7可灵视频生成68338185中国2024年6月上线,支持文生视频、图生视频、视频续写、高清画质升级和视频编辑等功能8Opus Clip智能剪辑53200000中国主要用AI将长视频自动剪辑为短视频,包括自动剪辑、字幕、布局调整、多语言支持等9Kapwing视频剪辑47800000美国成立于2017年,专注于视频编辑和制作,在2023年推出了一系列基于AI的工具。包括文本转视频、自动生成字幕、视频剪辑、图像处理等10HeyGen数字人46900000中国成立于2020年,提供数字人创建、语音克隆、视频翻译等功能访问量数据说明:指Web端的流量数据,来源于Similarweb,统计周期为202
47、4全年2024全球AI应用趋势年度报告|发展趋势分析26 2024年发展方向分析 2025年发展趋势预测在今年主流厂商通过产品矩阵的完善实现了对市场的全面覆盖AI视频生成技术实现了基础能力的重大突破,从实验阶段进入实用阶段Sora跳票无数次后终于上线,智谱推出“清影”模型;可灵AI作为新玩家推出了完整的视频生成方案;海螺AI在2024年正式进入视频生成领域;即梦完成了全平台布局等;各大巨头完成了视频生成类产品线的布局。视频生成时长显著提升:Luma支持生成1分钟视频;画质达到专业水准:PixVerse支持4K分辨率输出,智谱清影实现60帧超高清视频;生成速度大幅提升:PixVerse V3.5
48、版本在Turbo模式下最快可在5秒内完成视频生成。专业级镜头控制:Runway推出导演级摄像机控制功能,支持精确的镜头语言表达;精确的场景控制:Pika的Scene Ingredients功能允许用户自由选择和控制场景中的各个元素;运动路径控制:多家产品推出运动笔刷功能,可精确控制画面中物体的运动轨迹;多物体协同:Runway支持同时控制多个物体的运动和互动,增强了场景的复杂度。基础技术能力将进一步突破产品形态将更加多元化技术融合将带来新的突破视频生成时长预计延长至30分钟以上,满足更多内容制作需求;分辨率可能提升至8K,进一步满足专业制作需求;物理引擎的引入将带来更真实的动作效果。垂直行业解
49、决方案将成为主要发展方向;API服务将更加普及,支持深度定制。与3D生成技术的融合将提升画面真实感;实时渲染技术的应用实现即时生成;多模态技术的整合将提升内容理解和生成能力;3D/VR内容生成能力增强。4控制能力实现精细化,使创作者能够更准确地实现创意构想结合物理世界理解的世界引擎将成为AI视频生成的新突破口,带来更真实、更智能的内容生成能力。世界模型:AI视频生成的新突破口2024全球AI应用趋势年度报告|27 2024年头部视频类产品更新情况Luma上线Dream Machine,在120秒内生成120帧高质量视频,免费体验;同月上线指定首帧和尾帧生成视频功能视频生成Luma AI发布了v
50、1.5版本,提升了视频质量和生成速度,增强了运动效果与文本理解,改进了图像到视频功能。支持更精细的风格控制,快速生成高清视频发布v1.6版本,新增12种摄像机运动控制,提升视频真实感和精确度,优化图像生成速度,支持自然语言控制和创意工具 发布Ray 2视频模型,支持通过文本和图像生成高达1分钟的视频,提升生成效率和视觉效果 发布Luma Photon图像生成模型,具备高性价比和强大功能,支持多种创意应用InVideoInVideo AI 2.0发布,支持25,000字符的提示文本,增强视频脚本复杂性;多说话者支持,提升视频生动性;可调整背景音乐、旁白速度,支持55种语言;优化工作流程,增强字幕
51、和过渡效果视频生成InVideo v3.0发布,支持通过文字提示生成真人实拍、动画或二次元风格视频;提供实时动态编辑功能;推出Generative Plan订阅,起价120美元/月,支持生成15分钟视频内容新增自动化创作流程,支持脚本自动生成视频、匹配背景音乐和建议视觉元素;内置文字转语音功能,自动生成自然旁白并添加字幕Runway更新Multi-Motion Brush运动笔刷功能,可同时控制5个物体运动路径视频生成运动笔刷更新:新增类似PS对象选择功能Lip Sync功能同步音频与人物口型,提升对话自然度,时长增加至45秒。Gen-2推出“prompt enhancer”,一键增强提示词,
52、获得更高质量输出发布Gen-3 Alpha模型,支持生成高保真、高动态的10秒视频,较Gen-2在保真度、一致性和运动性能上有显著提升Runway推出多面唇同步功能,实现复杂场景中多个角色的动态对话;Gen-3 Alpha模型新增图生视频功能,用户可使用任何图片作为视频首帧,并通过文本提示指导生成Runway推出Gen-3 Alpha视频到视频功能,提供AI驱动的编辑能力;发布Gen-3 Alpha Extensions,延长视频生成时长至40秒,并新增首尾帧控制功能Gen-3支持长视频生成,并引入实时协作功能,推动AI在影视制作中的应用;推出生成式角色表演工具Act-One,轻松将视频转换为
53、动画新增了扩展视频的功能,用户可以通过生成新区域来改变输入视频的长宽比;高级模型中可以生成最长20秒的视频;推出高级摄像机控制像导演一样掌控镜头Gen-3 Alpha Turbo新增中间关键帧功能,提升图像变化控制;用户可在视频编辑中调整手持相机抖动与速度。Act-One支持将表演转移到现有视频角色上,同时新增静态相机控制,进一步精确镜头掌控Pika推出付费计划,分为10美元和60美元两个档次。同时发布Expand Canvas功能,支持调整视频风格并扩充画面视频生成推出Lip Sync功能支持视频人物嘴部动画和音频同步发布SoundEffects功能生成的视频可以自动配音效PikaLabs发
54、布AI动画生成工具Pika1.5重磅上线四个新特效:从粉碎到消失,效果炸裂了!Pika1.5版本新增四种新特效,包括粉碎、溶解、瘪掉和“ta-da”特效,让视频内容炫目多彩发布2.0版本,引入了场景元素(Scene Ingredients)功能,允许用户自由选择角色、物品、服装和场景元素,根据需求构建特定镜头。同时,还支持多人在同一画布上协作可灵可灵AI首次发布,支持生成长达2分钟、30fps、1080p 分 辨率的视频,并推出文生视频、图生视频、视频续写等功能视频生成迎来第三次重大升级,新增高画质版、首尾帧控制和镜头控制等功能;同时,网页端正式上线,集成文生图和文生视频能力,限时免费发布1.
55、5版本,提升了画质、动态质量、运动合理性和语义理解;新增运动笔刷和对口型等功能,优化用户体验AI推出独立APP,扩展移动端AI创作功能;支持上传多个视频片段进行训练,提供更大灵活性。平台升级至1.5版本,新增高品质视频生成模式和标准模式(支持快速生成720p视频)。新的人脸模型功能面向高级会员开放,用户可在训练后随时生成视频推出“AI试衣”功能,1.5模型新增“首尾帧”支持;API V1.5新增标准模式,V1.0增加运动笔刷。1.6版本上线,显著提升物理规律真实感、文本遵循能力、动态质量和风格一致性,并新增AI模特功能,支持一键生成AI模特数据来源:官网,公开新闻等资料,伽马数据整理2024全
56、球AI应用趋势年度报告|28 续:2024年头部视频类产品更新情况即梦Dreamina 正 式更名为“即梦”,全量上线AI视频生成,支持将文字描述转换为视频。用户可上传首帧或尾帧图片,增强视频生成的可控性视频生成即梦AI在安卓平台上线,推出故事创作模式,允许创作者设计角色、生成场景图,并将静态图片转换为动态视频,为创作提供全新方式iOS应用上线上线Loopy对口型功能,提升视频中角色的口型同步效果,使对话更加自然流畅上线智能参考模式,允许在保持参考主体不变的情况下,替换背景、服装、妆容、画面风格,甚至添加其他物品,实现与画面的完美融合Seaweed视频生成模型,提升光影、色彩和画面真实感;Pi
57、xelDance全量上线。S2.0模型提升分辨率、画质与流畅性,支持多拍动作和复杂交互。新增智能编辑功能,60秒生成5秒高质量视频,大幅提高效率PixVerse增加保持角色一致性,百变换背景,解决AI生成效果不一致问题视频生成V2版本发布,支持生成长达8秒的视频,并大幅提升画质和细节。引入自研时空注意力机制,增强空间和时间感知能力,提升视频生成的一致性与趣味性。新增三种生成模式:文本、图片和角色生成视频。用户可自创角色并微调视频内容,同时推出UGC社区功能,支持基于他人内容创作V2.5发布,视频生成速度提升200%,支持最高4K分辨率输出。引入高性能模式,增强动态表达并减少失真。运动笔刷功能升
58、级,用户可控制主体移动路径。新增摄像机运动控制,提供精确镜头调节;同时支持7种语言界面V3新增故事续写、风格转换和多模态功能,提升视频生成效果与提示词理解。支持创意模板、口型匹配、风格化(动漫、现实、3D等)、视频延长。底层模型升级,新增8种特效和多语言同步,拓宽创作边界V3.5发布,Turbo极速生成模式下,视频生成时间缩短至平均10秒,最快可达5秒。引入丰富特效模板,优化画面动作控制,支持动漫生成和首尾帧生成功能海螺AI上线视频生成功能,支持图生视频推出文生视频功能,可将文本内容自动转化为视频,支持高分辨率和高帧率上线提示词优化功能,自动提升视频生成质量。MiniMax视频模型支持理解超出
59、图片内容的文本,解构指令框架和深层语义,优化视频生成效果Stable Video发布Stable Video 3D模型,支持从单张图像创建多视图3D视频,提升多视图功能和泛化能力Stability AI推出Stable Video 4D模型,支持将单个物体视频转换为多个新视角的动态视频,提升游戏开发和视频编辑的真实感模型优化,生成4秒视频速度更快,同时保持高质量输出。时间一致性得到提升,减少帧间不一致性。扩展性增强,支持更高分辨率输入,生成更清晰、细节丰富的视频智谱清影清影,AI生成视频模型清影(Ying),30秒的时间可生成6秒视频加强在图生视频质量、美学表现、运动合理性和复杂提示词语义理解
60、方面表现。支持生成10秒、4K、60帧超高清视频,支持任意比例图像生成视频,包括超宽画幅。新增多通道生成能力,一次性可生成4个视频。同时,清影功能可生成与画面匹配的音效Domo AI上线新功能,用户只需一张照片和视频即可让人物动起来,轻松实现动态效果推出视频色度抠图功能,可将人物扣出并合成到新背景中。新增乐高、美国漫画等4个风格,丰富创作选择推出唇形同步功能,提升面部对话视频转换效果,使转换后的视频更加真实和生动数据来源:官网,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|AI陪伴赛道分析用户规模变化2024年全球AI陪伴类产品的访问量相比2023年实现了92.99%的增长,从
61、20亿增加到40亿,实现了大幅增长。29竞争情况分析从数据中可以看出,全球AI陪伴类产品在2024年相比2023年经历了大幅增长,产品数量增长了191.89%,几乎是前一年数量的三倍,这说明AI陪伴类产品市场在快速扩张的同时,也伴随着激烈的竞争。1292.99%02040602023年2024年2024年全球AI陪伴类产品增长情况访问量(亿)增长率191.89%0501001502002502023年2024年2024年全球AI陪伴类产品数量产品数量增长率数据说明:访问量指Web端数据,来自于Similarweb,相关产品来自于伽马统计的两万+款AI产品2024全球AI应用趋势年度报告|头部玩
62、家分析303我们统计了头部10个产品,对他们的基本情况进行了统计,大多数平台都提供类似的功能支持用户自定义角色、个性化对话、虚拟角色互动和情感交流,并且大部分平台都提供“无审查对话”或“动态对话”等功能。排名名称分类访问量产品特点1Character.ai虚拟聊天22066240002021年成立,创始人为Transformer模型8名作者之一,使用自有模型,不支持NSFW内容,于2024年被谷歌以50亿美元收2JanitorAI虚拟聊天6292000002023年6月推出,首周吸引了超过一百万用户,支持NSFW内容,支持自定义角色,并且允许用户本地部署模型3SpicyChat虚拟聊天2937
63、00000支持NSFW(不适宜工作场所)内容,可以创建和自定义个性化的AI虚拟角色,无审查对话等4CrushOn.AI虚拟聊天170500000支持NSFW(不适宜工作场所)内容,专注于提供无限制、高度个性化的对话体验。5Candy.ai虚拟聊天140600000支持NSFW,自定义角色,角色扮演与互动场景,图像生成与多媒体支持等功能6Chub虚拟聊天80700000支持NFSW内容,支持自已定义角色,上下文感知,动态对话和分支叙事等7GPTGirlfriend虚拟聊天47305618支持NFSW内容,支持用户个性化角色创建,平台上拥有超过7000个不同的AI角色,涵盖从动漫风格到现实人物等多
64、种类型,满足不同用户的需求8PepHop虚拟聊天47000000支持NFSW,并且支持同性恋和非二元性别用户9Talkie AI虚拟聊天42442640不支持NFSW,具有高度的个性化定制能力、丰富的互动方式、强大的记忆与故事功能、创新的卡牌机制以及对隐私的严格保护10Dreamgf虚拟聊天42900000提供了高度定制化的虚拟伴侣体验,用户可以完全控制AI女友的外观、性格和兴趣等细节。包括文字聊天、语音消息和照片请求访问量数据说明:指Web端的流量数据,来源于Similarweb,统计周期为2024全年2024全球AI应用趋势年度报告|发展趋势分析31 2024年发展方向分析 2025年发展
65、趋势预测多模态交互能力显著增强个性化与自定义程度提升2024年AI陪伴产品在交互方式上,从最初的纯文本对话,扩展到了语音通话、视频通话、AR互动等多元化 交 互 方 式。例 如,Replika引入了AR体验和视频通话功能;x eva升级了虚拟声线技术,并支持视频电话互动;多家产品都推出了语音通话功能。这种多模态交互的发展使AI陪伴更加自然和沉浸。包括角色外观定制(CrushOn.AI)声音定制(筑梦岛)性格特征选择等。多模态融合将更加深入技术升级将带来突破个性功能将更加智能化预计2025年,AI陪伴产品将在多模态交互方面实现更深度的融合可能会出现,更自然的面部表情和肢体动作同步,更流畅的实时情
66、绪识别和回应,支持复杂场景的混合现实互动。预计在以下方面会有重要突破:大幅提升对话的连贯性和逻辑性、更自然的情感表达能力、更强的长期记忆维护能力。AI角色的个性化将从简单的外观定制发展到更智能的适应性调整:基于用户行为自动调整交互风格、动态性格演变系统、更复杂的记忆系统和情境理解能力。4心理健康咨询特化版本,教育陪伴专用产品,老年人陪护定制版等等。应用场景将更加细分,可能会出现更多垂直领域的专业AI陪伴内容创作能力整合2024年的一个明显趋势是AI陪伴产品开始整合更多内容创作能力,例如,Candy.ai新增AI生成图像功能,wow上线图片生成bot,多个产品都加入了绘图能力。这种趋势显示AI陪
67、伴产品正在向综合性内容平台转变。情感互动深化产品开始更注重情感层面的互动体验。星野集成了情感理解功能,X Eva推出了哄睡功能,这些功能都在尝试深化AI与用户之间的情感连接,通过记忆库、共同经历等功能的加入,AI角色能够建立更持久的情感联系。安全与隐私保护增强2024年多个产品都强化了安全保护措施,Character.ai推出青少年安全功能和家长控制,wow推出青少年模式等。2024全球AI应用趋势年度报告|32 2024年头部陪伴类产品更新情况Character.ai增加角色问候语字符限制数量,改善聊天记录管理与可访问性推出青少年安全功能提升LLM对话质量,新增家长控制,允许监控孩子互动记录
68、和使用时间JanitorAI多语言支持引入动漫风格虚拟角色增加为角色创建自定义标签优化NLP和ML技术,提高用户查询理解与响应质量SpicyChat AI推出新的AI角色功能增强敏感话题隐私保护;定制AI角色外观与性格发布跨平台功能更新AI模型,提升对话自然度和上下文理解,提供更连贯的响应推出无限制免费角色扮演功能CrushOn.AI推出高级NSFW角色AI,允许不受限制对话角色自定义增强,用户可更直观地选择特征、背景和外观推出多角色互动功能,丰富对话体验;新增奖励系统鼓励社区参与;优化AI学习算法,提升个性化对话Candy.ai新增多元AI角色,引入AI生成图像功能新增40+个AI角色,推出
69、AI通话功能新增AI角色,扩展动漫模型;改进AI通话功能Talkie引入官方助手AI Tara,提供艺术风格选项、创作者回顾;改进语音通话质量与分享功能,Talkie+增强语音自动播放,减少免费通话时间每日5分钟新增“Talkie Stories”功能,改进声音板自定义顺序;引入“AI魔法按钮”纠正错误猫箱猫箱的前身话炉上线,标志着猫箱项目的正式启动话炉”更名为“猫箱”,并进行了品牌升级星野集成情感理解功能,通过AI分析用户情感状态并提供建议与安慰端内表情上线可发送评论;优化体验保留底图和关键词,支持上传原图,调整字数上限评论区新增记忆簿按钮;设定描述字符扩展至1000字;支持重新生成智能体语
70、气;上线智能体模板与变身玩法;免费电话时长增加;对话时可播放BGM自动播放对话语音免费;智能体描述页新增绘图技能展示切换模型功能;支持分别选取风格参考和脸部参考、区域重绘、一键选模版或关键词提示功能创新捏同款功能;新增模型选择与回复效果预览;优化评论区治理与群聊体验;支持动态分享至其他平台;一句话模板可上传形象参考数据来源:官网,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|33 续:2024年头部陪伴类产品更新情况x eva虚拟声线升级,打造更细腻声音;创造并与克隆人情感交流哄哄女友模拟器上线,随机分配百万粉丝网红陪练公测AIGC私人订制,提供照片、读物、音乐定制【记忆库】升
71、级,克隆人拥有更多共同记忆与经历。【短剧】公测,剧中主角深度互动克隆人演唱好听歌曲【剧情卡】上线,和克隆人一起表演解锁稀有剧照剧集商店公测【哄睡】功能发布,克隆人伴你入眠;【有声书】内测,克隆人朗读都市恋情、悬疑等故事话模型技术升级,提升趣味性与逻辑性;声音合成技术升级,支持用户捏声线;神经网络渲染技术升级,支持视频电话与克隆人互动筑梦岛支持自定义形象和昵称新增用户兴趣偏好设置支持创建人物音色;支持用户与人物语音通话生图升级,创建高清人物形象免费互动剧情支持创建多场景内容冒泡鸭引入了超长记忆能力,提升剧情互动和角色体验wow增加了“回溯”对话和“重新生成”对话功能优化部分智能体的声音体验更多智
72、能体开放语音通话功能新增“剧情卡”功能,支持分享与仔仔的聊天记录;绘图能力提升推出青少年模式,安全聊天;AI仔仔音色更新,多彩声线;升级对话体验,流畅更智能上线图片生成bot,输入文字即可生成独特图片;编辑功能上线,自由塑造AI角色对话走向新增互动故事功能崽崽可以发图片创建支持自定义图片上传主动消息上线声音克隆上线隐私功能升级,创建“隐身”状态智能体replika推出新的AI健康伴侣TOMO与Shopify合作,通过Replika的网络推广产品优化语音通话的口型同步动画,提升了语音交互的自然度和真实感引入了增强现实(AR)体验和视频通话功能,使用户能够与AI伴侣进行更真实的互动多语言支持数据来
73、源:官网,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|风险:AI陪伴类产品发展的困境345AI陪伴类产品在功能和技术上面临严重同质化的问题。当前大多数产品的核心功能依赖于底层大语言模型,且功能演进路径趋于一致,这一过程中的技术架构高度相似,几乎所有产品都依赖于相同的技术栈,造成了市场竞争激烈而缺乏差异化;在交互设计方面,无论是角色设定、对话风格,还是情感表达,都缺乏显著的个性化,导致各产品在用户体验上的重合度较高,难以形成独特的市场定位;缺乏核心竞争力和创新,使得用户极易流失,产品难以建立持久的用户粘性。内部困境:功能同质化与技术路径趋同2024年,美国14岁男孩因长期沉迷于
74、AI伴侣,最终因抑郁症引发自杀事件和Talkie在年底被AppStore下架的事件,都暴露出了AI陪伴产品在监管和伦理方面的问题,这些事件使得公众对AI陪伴产品的风险产生质疑,进一步影响了市场的接受度和发展前景。总的来说,AI陪伴类产品在面临技术同质化和创新不足的困境时,还不得不应对外部的舆论压力和社会事件带来的负面影响,亟需在产品设计、技术创新以及伦理监管等方面作出更加深入的反思和改进。外部困境:隐私和安全问题2024全球AI应用趋势年度报告|AI图像赛道分析用户规模变化2024年全球AI视频类产品的访问量相比2023年增长了44.94%,从30亿增加到接近50亿。35竞争情况分析2024年
75、全球AI图像类产品的数量相比2023年增长了53.50%,从约600个增长到近1000个。1244.94%0%10%20%30%40%50%02040602023年2024年2024年全球AI视频类产品增长情况访问量(亿)增长率53.50%0%20%40%60%0500100015002023年2024年2024年全球AI图片类产品数量产品数量增长率数据说明:访问量指Web端数据,来自于Similarweb,相关产品来自于伽马统计的两万+款AI产品2024全球AI应用趋势年度报告|头部玩家分析363从当前的头部AI图像类产品格局来看,形成了“老牌图像处理类产品+AI功能”与“生成类新产品”共同
76、构成的竞争格局,这两类产品在功能定位、用户群体和市场影响力上各有侧重,但也有一定的交叉和竞争。排名名称细分分类访问量所属国家简介1Remove.bg图像编辑785100000瑞士一款基于AI的在线图像处理工具,专注于自动从图像中移除背景2Civitai图像生成229500000美国专注于生成式AI艺术和模型的平台,主要功能是为用户提供一个探索、分享和创作AI生成艺术作品的社区3Midjourney图像生成181100000美国一款基于AI图像生成技术的工具,由美国创业者Holz于2022年创立4Fotor图像编辑165500000中国一个跨平台的照片编辑和设计工具,提供简单易用的专业级照片编辑
77、和设计功能5Cutout.Pro图像编辑159512121中国一款基于人工智能的视觉设计平台,提供图像和视频编辑功能,包括背景移除、照片增强等6Pixlr图像编辑152700000新加坡一个多功能的在线照片编辑和图形设计平台,提供AI驱动的工具、滤镜和效果,适合从初学者到专业人士的用户7Leonardo.Ai图像生成151500000澳大利亚专注于开发综合性生成性AI工具,主要面向内容生产领域,特别是视觉资产和视频生成8Photoroom图像编辑151400000欧洲是一款基于AI技术的图像编辑应用,主要服务于电子商务领域,提供背景移除、AI生成背景、修图等多种照片处理功能9123RF图像编辑
78、130700000瑞士123RF是一个全球领先的数字图库平台,提供超过1亿张高清免版税库存照片、向量图、插图和剪贴画,还为用户提供更高质量的图像生成和编辑工具10SeaArt.AI图像生成120000000新加坡提供图像生成AI服务,支持多种语言输入和模型库访问量数据说明:指Web端的流量数据,来源于Similarweb,统计周期为2024全年2024全球AI应用趋势年度报告|发展趋势分析37 2024年发展方向分析 2025年发展趋势预测模型性能大幅提升无论是图像生成的Stable Diffusion、Midjourney,还是图像编辑的Remove.bg、Fotor等,都发布了新的版本和模
79、型,在生成图像的质量、细节表现、速度等方面有了显著的提高。技术融合将更深入场景化应用将更细分面对多模态大模型崛起的竞争预计2025年,图像处理、生成、编辑等不同技术领域的边界将进一步模糊,产品功能将更加融合,传统图像编辑工具将进一步整合AI生成能力,AI图像生成工具将强化编辑和后期处理功能。随着技术成熟,和竞争加剧,产品将更注重细分场景的深度应用。随着通用多模态大模型的崛起,图文音视频等多模态一体化生成,打破壁垒,一定程度对垂直的图像处理工具造成一定的冲击和挤压。4随着AI图像技术的普及,相关的安全和隐私问题将得到更多关注,版权保护机制将更完善。安全与隐私保护更受重视产品功能全面融合化协作与个
80、性化并重产品边界日益模糊,功能不断交叉融合,传统的图像编辑工具如Remove.bg和Fotor开始整合AI生成能力,而以生成见长的Midjourney、Stable Diffusion则增添了图像编辑功能。Midjourney推出支持100人同时操作的“Patchwork”协作工具,Adobe Firefly引入样式套件功能,支持团队共享提示、设置和模板,Leonardo和Midjourney都推出了模型个性化功能,允许用户根据需求调整和定制模型。2024全球AI应用趋势年度报告|38 2024年头部图像类产品更新情况Remove.bg用户界面改进,所有命令集成于编辑器内,减少编辑时间。界面更
81、加直观,添加背景和效果操作简便。升级版Magic Brush工具上线,支持一键将图片导入Canva进行设计提高图像上传的分辨率限制AI阴影功能为去除背景后的对象自动添加逼真的阴影,增强图像的立体感和真实感提供海量背景库,用户可轻松选择数百万种不同背景,替换图片中的旧背景图片编辑Midjourney补齐缩放平移及视频生成等功能图像生成角色人物一致性功能上线,推出角色参考功能,帮助用户根据图片创建一致性内容。Midjourney v6版本上线describe功能,支持生成更长更详细的提示词测试“风格一致性”功能推出模型个性化功能,允许用户根据需求调整和定制模型,提升创作的独特性和精准度发布rand
82、om功能,允许用户基于提示词生成完全随机的图像风格,增加创作的多样性和灵活性推出全新外部图像编辑器,用户可在平台上直接修改图像,无需外部软件。图像重纹理模式优化细节和质感,智能识别场景形状,重新定义光照、材质和表面推全新图像编辑器推出多人协作的世界构建工具“Patchwork”,支持100人同时在同一画布上操作。新增个性化模型与情绪板功能,用户可上传灵感图像集进行创作FotorAI头像功能可自动生成个性化头像;“魔法场景”功能则让用户轻松将人物置入多种创意背景,增强视觉效果将静态照片转换为动态表情图像转视频:将静态图像转换为动态视频,通常以动画或幻灯片形式呈现文字转视频:将文本内容转化为视频,
83、自动生成动画或图形,生动展现文字信息将美颜功能扩展为AI化妆功能,智能为人物照片添加虚拟妆容,提升脸部细节和整体视觉效果图片编辑视频擦除:用于删除视频中不需要的部分或元素,简化视频内容视频增强:提升视频质量,增强清晰度、色彩等视觉效果,改善整体观看体验Leonardo允许用户上传角色参考图像,帮助AI更加精确地生成与参考图像相符的角色设计发布Leonardo Phoenix模型图像生成用户可以生成更具细节、高分辨率的图像,适用于精细和专业效果的创作。允许根据需求选择性隐藏或展示图像,优化作品集展示。支持安卓应用提高生成速度图片生成提示词Phoenix:图像局部修改与修复工具,允许用户精确调整细
84、节。Style Reference:通过上传参考图像,引导并指定生成图像的艺术风格。更新Flux 和 Phoenix 1.0模型推出Flow State功能,帮助提升工作效率并减少分心StableDiffusion发布全新代码模型Stable Code 3B,仅30亿参数,可在无专用GPU的笔记本上本地运行,性能表现出色图像生成推图像高清放大工具Creative Upscaler发布CosXL模型,图像处理能力更精细发布SD 3 Medium,具有图像质量、文本内容生成和复杂提示理解的显著提升;适合消费级硬件发布Stable Diffusion 3.5系列文生图模型,具备高定制性、高效性能和多
85、样化输出,支持在消费级硬件上运行,满足全球图像生成需求数据来源:官网,公开新闻等资料,伽马数据整理2024全球AI应用趋势年度报告|39 续:2024年头部图像类产品更新情况即梦正式上线,支持文生图、智能画布全量上线实时画布功能,用户可以通过简单的涂抹和提示词生成定制形状的图像用户可以通过一句话实现零门槛改图,精准收获预期效果,支持改风格、改动作、改表情、2D变3D、换装/换人、增减主体以及改场景等多种效果推出图片2.1模型,支持中文字体生成,提升海报设计效率。上线海报生成功能,用户可一键将静态海报转为动态海报,解决了中文字体生成问题,轻松创建电影海报、广告宣传海报和壁纸等图像生成AdobeF
86、irefly引入结构参考功能,允许用户将现有图像的结构应用于新生成的图像,提升创意控制。结合风格参考,用户可同时参考图像的结构和风格,快速实现创意图片编辑Firefly的样式套件功能允许用户保存并共享提示、设置和模板,提升团队协作效率,确保品牌一致性和设计统一。新增构图功能,通过上传参考图像或文本提示,生成匹配构图的图像变体,无需多次编写提示。新的直观界面优化了创作流程,使图像生成和编辑更加便捷大幅提升了图像质量和细节,能够更精准地解释提示并自动应用匹配样式,提高了生成图像的逼真度和精确度。新增功能包括上传图像创建合成场景,轻松混合产品照片与生成场景,协调色调、灯光、阴影等元素;还支持通过自动
87、填充Firefly生成内容扩展图像画布,与现有图像无缝融合训练的自定义模型,显著提高了图像生成质量、准确性和细节水平,增强了造型功能,带来更精确和丰富的创作体验Firefly引入生成式扩展功能,允许用户更改图像的长宽比或大小,并扩展内容,提升编辑灵活性和工作效率。还推出AI视频生成功能,用户可通过文本提示或参考图像生成各种风格的视频,从实景电影到3D动画Firefly推出共享自定义模型功能,增强了管理工具,允许用户轻松与团队成员共享模型,以进行训练、审阅和创建符合品牌一致性的内容liblib.art更新LiblibAI V3模型,增强文字生成能力图像生成XL ControlNet插件新增Ope
88、nPose、Canny和Scribble模型,提升了图像生成质量与控制精度。OpenPose通过姿势识别精准控制人体动作,支持单人和多人姿势生成。Canny插件能精准提取图像细节,生成线稿并保持构图一致,适合商品上色和风格转绘。Scribble则提供粗犷的边缘检测,允许更多AI创意发挥,生成的图像参考原图结构但富有创意DALLEDALLE 3 与ChatGPT 无缝集成DALLE3新增67种图像风格图像生成全面转向DALLE 3。新版本优化了用户体验,引入全新编辑界面,支持基于文本生成图像后进行精细调整,提升创作灵活性和个性化程度DALLE 3模型正式向ChatGPT的免费用户开放更新了新型号 DALL-E 3(PR16),不仅图片生成速度提升一倍,同时质量也有所提高flux推出开源模型FLUX.1,其生成的图像细节丰富且自然,尤其在手部和脚部的生成上,畸形现象较少图像生成FLUX 1.1 Pro发布FLUX 1.1 Pro Ultra发布,支持高达4兆像素分辨率,生成速度提升至每张图片约10秒,Ultra模式比同类模型快2.5倍,且不影响提示词精准度。Raw模式适合人像和自然摄影,生成更真实图像。新增的四款创意工具Fill、Canny、Depth和Redux,进一步增强了AI绘图的控制力和可操作性数据来源:官网,公开新闻等资料,伽马数据整理