1、2024 iResearch Inc.2024年中国AI基础数据服务研究报告2目 录CONTENTS01AI基础数据服务行业概述02AI基础数据服务市场研究03AI基础数据服务厂商案例04AI基础数据服务行业面对的挑战与机遇3AI基础数据服务行业概述0142024.7 iResearch I2024.7 iResearch IAI产业整体进展在过去几年里,大众已见识到GPT、BERT等大语言模型在自然语言理解和生成方面的卓越能力。相比单一模态的大模型,多模态大模型能够提供更自然的人机交互方式,具备更全面和准确的认知能力,并在不同情境下表现出更高的鲁棒性,从而赋能更丰富和全面的AI应用。因此,多
2、模态技术已成为诸多大模型厂商的研发重点。此外,长文本处理能力的提升,使大模型在理解和生成复杂文档方面表现更佳,能够更好地支持多主题和多步骤的推理任务;通过知识蒸馏、模型剪枝和混合精度训练等技术,大模型得以小型化,减少了计算资源需求,提高了推理效率,使大模型在资源受限设备上高效运行,提升了响应速度和用户体验,保护了用户的数据隐私。聚焦国内AI商业化市场,大模型商业化进程加速,API市场竞争激烈,价格战频现,但同时也反映出供应商间能力同质化的问题,亟需破局;另一方面,央国企凭借较好的数字化基础、丰富的数据资源及业务场景、相对充足的科技投入预算,成为现阶段国内大模型项目建设的主力军,推动了大模型在中
3、国AI产业的商业化落地。来源:艾瑞咨询研究院自主研究及绘制。来源:艾瑞咨询研究院自主研究及绘制。全球AI产品技术进展中国AI商业化落地进展多模态、长文本、大模型小型化成为热点研究方向多模态概述:多模态大模型能够同时处理和理解包括文本、音频、图像和视频在内的多种数据类型,这使得它们能够提供更自然的人机交互方式,具备更全面和准确的认知能力,并且在不同情境下表现出更高的鲁棒性,从而赋能更丰富和全面的AI应用案例:2024年5月,OpenAI推出GPT-4o,可对音频、视频和文本进行实时推理;2024年5月,Google演示了多模态AI助手Astra长文本概述:长文本可支持模型理解和生成更复杂的文档、
4、报告、小说等内容,能够更有效地进行知识管理和信息检索,提升了模型对于上下文理解的连贯性,进而更好地实现多主题、多步骤的复杂推理任务案例:2024年3月,月之暗面宣布旗下大模型产品Kimi开启200万字无损上下文内测,其后阿里、百度等大模型厂商均宣布相关大模型产品的长文本能力升级规划;2024年4月,Google、Meta等机构的研究人员先后提出Infini-attention、Megalodon等无限长文本方法大模型小型化概述:通过知识蒸馏、模型剪枝、混合精度训练等方法,“大模型小型化”相关技术可减少模型参数并降低计算资源需求,提高推理效率,使大模型可在端边等资源受限的设备上高效运行,降低能耗
5、,提升了响应速度和用户体验,还增强了数据隐私保护,未来可能催生更多的创新型智能终端案例:2024年5月,微软表示Windows将附带40多个端侧AI模型,包括可用于搜索、实时翻译、图像生成和处理等任务的小语言模型Phi-Silica;2024年6月,苹果推出Apple Intelligence个人智能系统,内置3B端侧模型,可支持摘要、改写、问答等功能API调用市场卷起价格战价格战的积极意义扩大客户量及使用频次,促使大模型技术在国内更快普及,加速创新型应用的诞生;促进供应商不断优化模型及计算架构,降低模型推理成本;竞争加速产业分层,较少社会整体资源消耗为争夺大模型客户流量及背后云资源市场,24
6、年上半年云厂商、大模型厂商等相继调整API产品定价,低价甚至免费供应价格战的另一面为大模型产品技术壁垒的薄弱尽管大模型相关产品技术仍在迭代,但国内大模型尤其以API方式提供标准化大模型服务的各供应商的产品能力尚未形成较大代际差异;供应商需加速技术及产品差异化建设,获取足够的利润,产业才能健康、可持续的发展央国企引领大模型项目建设2024年上半年中国大模型相关项目中标统计据智能超参数统计,2024年1-6月中国大模型相关项目中标数量达237个,前5个月披露的项目金额合计已过2023年;行业分布上,电信(47个)、能源(42个)位居1-6月的项目数量头两名,其次为教育、金融、政务等行业,各行业中的