智能助手发展阶段澜舟科技baichuan-4因智能助手属中等频率使用场景的产品,采取3日留存和7日留存对比观察0246810121416188月总访问量8月新增增速访问时长独立访客数第一梯队第二梯队第三梯队第四梯队第五梯队Fast Cycle模型的性能决定了产品是否有足够的支持,但产品功能的实际表现同样决定着用户的体验。量子位智库对17款主流智能助手产品展开多方位测试。互联网时代下,掌握流量入口才能抢占用户使用习惯。收费模式推演收费模式推演智能助手在智能助手在B B端创造更高商业价值,而端创造更高商业价值,而C C端则引领市场风向。端则引领市场风向。免费增值第二阶段第二阶段目前阶段目前阶段第一阶段第三阶段第四阶段不计成本的模型研发中部梯队权衡投入产出比不计成本地投流获客应用层探寻变现模式梯队分化,头部加速,中游放缓
2 0 2 4 年深度行业分析研究报告目录目录端侧智能:人与人工智能交互的更优窗口端侧智能:人与人工智能交互的更优窗口政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道生态效应显著,把握高通、华.
1CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院CEO 生成式 AI 行动指南AI 模型优化生成式 AI 的多样性ChatGPT 让人们误以为自己都是 AI 专家,但这种表面的简单性掩盖了生成式 AI 领域的复杂性。CEO 在构建 AI 模型组合时必须考虑这些复杂因素。生成式 AI 模型有多种类型,每种模型的功能、效果和成本都大相径庭。模型的所有权、开发方式和训练数据集的大小都是影响不同应用场景下模型选择的重要因素。由于训练单个大语言模型(LLM)需要海量数据和资源,因此围绕生成式 AI 讨论的一个主要问题就是规模。因此,许多 CEO 都在考虑是否应为其业务大规模扩展大型 AI 模型,或者还是应当开发针对特定用途的小型专业 AI 模型。答案是需要双管齐下。许多组织已经开始这样做了。目前,一家典型的组织使用 11 种生成式 AI 模型,并预计会在未来三年内将其模型组合扩大约 50%。为什么需要如此多的模型?因为每个应用场景都有各自的需求和限制,而不同的业务问题也需要不同类型的模型。4F395er0Km2CEVd8OzZo6h4XVfWXw7jJBZrJEBMVBX6IMxnjSsw4IlWyB9yKUTfBGsAOx3pcrK74of7pGi3ocDPwNBL9YPkKDiICz25B2ktX0wNr4yqLG95GXf4r68OJhCXZzoyQwvhzOFJauLpT6aTCxxqRigx4EpInnkMdlnSZSYOOx9uGTZ6l6fRbKW1rjfElVLcjL37TzY74kZA9xfvwO389y2akePMiG1BYsFkdgvucUZJxpY4mXJLmHLjSrDc75qvkIhZu5mmWcAmPLeEJBJmyi72Tl3tzvQSdX7vAMItc9oZhaQMRy19VmrHYfZT5cB16XWrZYSRiV5rgBA6EnSjhV3kjovMDp1bVFwV3InZ1hzlq7L7oyMElvJW2sQReoQ4sa7emd0UBE977Kg1tN2Tyyr99DbUmnkiRpSYR1ia30TFyXBaSifDh310XlTrjT8t6dsM2bW5kgng1chYaebNnWzpZjoqqgCoLdiL3GdIOa3M8TZHx7kJUeDXnsASaqv8HzLE32eouM1D2nSdkkSY6iu3JCl5GmQfalH8FpIvK8Ge9GJ4vj7wLXoRsv8DUYkKufVG8RnotL6aapUdKjNW3cYBNUDUDERCDTNcbu75j4fhQXsQOsXkfHOaTCbHDLtUs9hy4xTpFyPISHNIAzucX9hv6X2WJ3DzoQntymXnxUDXuycngeY36itsXPqU3pVQ4g92qa6r05zMB7tFaQfYgnE38FuDBrP5oy7jD1v71in9YVHjyJVCOjh9h78R9ZJe5WnELzl2rXQEGOmi5h2syrrezMJFKmaK4qAhKStdpQphj4sxNdhWQvBkPXgPbWJ2bOtAupyHC885uaeCpVm0V47AyMa89bSkm8F63tTp0zdxGT7v9jReISxKbtIKbro0snTV92ojoLBiXFnAKvb5JPB6L4jcsNhP5JYzucC3yLhsyqo5MvtB8vbrHsgz93WVj5evWAxFtGm5Ne0AvuszdT4IQVFm6NbXFrKy070K3j9Q0O3gJAZwblYVrqrSkq7KozWy4bvnSAeafNyNaL1SgINrFHUdsqFjVs6j77tbdzXoSuiSrEua91JWZh9rX24KFpA2sIkGtoyEuPKZG9jJuKsuly6hdCP8BiZvF5FSzS5X106WvCTqmHjMomebkCHcIRCVYCDcayGqL0ZWuTclTJBSDQQThveQYbJXmuak2d7NBmBz46xGGl5jYrDl6jHUuvmfB738q2zQyK4jjwRowVWoXWDf4pu9z7dPNl36EuJAKp32aCUgkQl6DkF9Yc6Kw7hMhgw9vBQumcNimuPRKrrugW0dgng1chYaebNnWzpZjoqqgCoLdiL3GdIOa3M8XTz7EQCIF89peWCbz6ElVLcjpnhTib7dZQntc51d8O6picdP8TZHx7kJUeDXnsASaqv8HzLE32eouM1D2nSdkkSY6iu3JCl5GmQfalH8FpIvK8Ge9GJ4vj7wLXoRsv8DUYkKufVG8RnotL6aapUdKjNW3cYBNUDUDERCDTNcbu75j4fhQXsQOsXkfHOaTCbHDLtUs9hy4xTpFyPISHNIAzucX9hv6X2WJ3DzoQntymXnxUDXuycngeY36itsXPqU3pVQ4g92qa6r05zMB7tFaQfYgnE38FuDBrP5oy7jD1v71in9YVHjyJVCOjh9h78R9ZJe5WnELzl2rXQEGOmi5h2syrrezMJFKmaK4qAhKStdpQphj4sxNdhWQvBkPXgPbWJ2bOtAupyHC885uaeCpVm0V47AyMa89bSkm8F63tTp0zdxGT7v9jReISxKbtIKbro0snTV92ojoLBiXFnAKvb5JPB6L4jcsNhP5JYzucC3yLhsyqo5MvtB8vbrHsgz93WVj5evWAxFtGm5Ne0AvuszdT4IQVFm6NbXFrKy070K3j9Q0O3gJAZwblYVrqrSkq7KozWy4bvnSAeafNyNaL1SgINrFHUdsqFjVs6j77tbdzXoSuiSrEuCO2AREEz3NJ1PnBJXC2wlBn5SR9AWyz7Pv3t5GADYnlCaYFeKUKtqN85qs4r44xFboVKp05asmmWB6w4ydyZ4gOQ16nw0RsnJrDb2IXC68d5s2INREfFt0E977Kg1tN2Tyyr99DbUmnkiRpSYR1ia30TFyXBaSifDh310XlTrjT8t6dsM2bW5kgng1chYaebNnWzpZjoqqgCoLdiL3GdIOa3M8TZHx7kJUeDXnsASaqv8HzLE32eouM1D2nSdkkSY6iu3JCl5GmQfalH8FpIvK8Ge9GJ4vj7wLXoRsv8DUYkKufVG8RnotL6aapUdKjNW3cYBNUDUDERCDTNcbu75j4fhQXsQOsXkfHOaTCbHDLtUs9hy4xTpFyPISHNIAzucX9hv6X2WJ3DzoQntymXnxUDXuycngeY36itsXPqU3pVQ4g92qa6r05zMB7tFaQfYgnE38FuDBrP5oy7jD1v71in9YVHjyJVCOjh9h78R9ZJe5WnELzl2rXQEGOmi5h2syrrezMJFKmaK4qAhKStdpQphj4sxNdhWQvBkPXgPbWJ2bOtAupyHC885uaeCpVm0V47AyMa89bSkm8F63tTp0zdxGT7v9jReISxKbtIKbro0snTV92ojoLBiXFnAKvb5JPB6L4jcsNhP5JYzucC3yLhsyqo5MvtB8vbrHsgz93WVj5evWAxFtGm5Ne0AvuszdT4IQVFm6NbXFrKy070K3j9Q0O3gJAZwblYVrqrSkq7KozWy4bvnSAeafNyNaL1SgINrFHUdsqFjVs6j77tbdzXoSuiSrEua91JWZh9rX24KFpA2sIkGtoyEuPKZG9jJuKsuly6hdCP8BiZvF5FSzS5X106WvCTqmHjMomebkCHcIRCVYCDcayGqL0ZWuTclTJBSDQQThveQYbJXmuak2d7NBmBz46xGGl5jYrDl6jHUuvmfB738q2zQyK4jjwRowVWoXWDf4mxWwC99ZUy3X516SPyzQMlPO5acnKVGTNRPiyAlnb2VAX0O8XcdJruIPX30C5zeQ1TIygNWMM4F1SvCwY3R3M0trF7QgSRPKJr31DzUoornNdFqdRuRg2A3zMgGFx348RzV1RYbYW0MBjZsHmtZ9jjvzd6PB0CWuWlhj4hJnXHIzWyM2rp6r4yqLG95GXf4r68OJhCXZzoyQwvhzOFJauLpT6aTCxxqRigx4EpInnkMdlnSZSYOOx9uGL37TzY74kZA9xfvwO389y2akePMiG1BYsFkdgvucUZJxpY4mXJLmHLjSrDc75qvkIhZu5mmWcAmPLeEJBJmyi72Tl3tzvQSdX7vAMItc9oZhaQMRy19VmrHYfZT5cB16XWrZYSRiV5rgBA6EnSjhV3kjovMDp1bVFwV3InZ1hzlq7L7oyMElvJW2sQReoQ4sa7emd0UBE977Kg1tN2Tyyr99DbUmnkiRpSYR1ia30TFyXBaSifDh310XlTrjT8t6dsM2bW5kgng1chYaebNnWzpZjoqqgCoLdiL3GdIOa3M8TZHx7kJUeDXnsASaqv8HzLE32eouM1D2nSdkkSY6iu3JCl5GmQfalH8FpIvK8Ge9GJ4vj7wLXoRsv8DUYkKufVG8RnotL6aapUdKjNW3cYBNUDUDERCDTNcbu75j4fhQXsQOsXkfHOaTCbHDLtUs9hy4xTpFyPISHNIAzucX9hv6X2WJ3DzoQntymXnxUDXuycngeY36itsXPqU3pVQ4g92qa6r05zMB7tFaQfYgnE38FuDBrP5oy7jD1v71in9YVHjyJVCOjh9h78R9ZJe5WnELzl2rXQEGOmi5h2syrrezMJFKmaK4qAhKStdpQphj4sxNdhWQvBkPXgPbWJ2bOtAupyHC885uaeCpVm0V47AyMa89bSkm8F63tTp0zdxGT7v9jReISxKbtIKbro0snTV92ojoLBiXFnAKvb5JPB6L4jcsNhP5JYzucC3yLhsyqo5MvtB8vbrHsgz93WVj5evWAxFtGm5Ne0AvuszdT4IQVFm6NbXFrKy070K3j9Q0O3gJAZwblYVrqrSkq7KozWy4bvnSAeafNyNaL1SgINrFHUdsqFjVs6j77tbdzXoSuiSrEua91JWZh9rX24KFpA2sIkGtoyEuPKZG9jJuKsuly6hdCP8BiZvF5FSzS5X106WvCTqmHjMomebkCHcIRCVYCDcayGqL0ZWuTclTJBSDQQThveQYbJXmuak2d7NBmBz46xGGl5jYrDl6jHUuvmfB738q2zQyK4jjwRowVWoXWDf4mxWwC99ZUy3X516SPyzQMlPO5acnKVGTNRPiyAlnb2VAX0O8XcdJruIPX30C5zeQ1TIygNWMM4F1SvCwY3R3M0trF7QgSRPKJr31DzUoornNdFqdRuRg2A3zMgGFx348RzV1RYbYW0MBjZsHmtZ9jjvzd6PB0CWuWlhj4hJnXHIzWyM2rp6r4yqLG95GXf4r68OJhCXZzoyQwvhzOFJauLpT6aTCxxqRigx4EpInnkMdlnSZSYOOx9uGL37TzY74kZA9xfvwO389y2akePMiG1BYsFkdgvucUZJxpY4mXJLmHLjSrDc75qvkIhZu5mmWcAmPLeEJBJmyi72Tl3tzvQSdX7vAMItc9oZhaQMRy19VmrHYfZT5cB16XWrZYSRiV5rgBA6EnSjhV3kjovMDp1bVFwV3InZ1hzlq7L7oyMElvJW2sQReoQ4sa7emd0UB利用定制化生成式 AI 实现精准发力不同于以往的任何技术,生成式 AI 正在迅速颠覆商业和社会形态,迫使企业领导者刻不容缓地重新思考其假设、计划和战略。为了帮助 CEO 们掌握快速变化的形势,IBM 商业价值研究院(IBM IBV)发布了一系列有针对性、基于研究数据的生成式 AI 指南,涵盖数据安全、技术投资策略和客户体验等主题。这是本指南的第十八部分,重点关注 AI 模型优化。2CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院50%专有模型嵌入模型专有模型嵌入模型公开大型商用模型公开专业商用模型 63% 61% 34% 31% 27%开放模型20242027公开大型商用模型公开专业商用模型开放模型模型组合总体量平均增长例如,图像编辑或数据分析等高度专业化的任务需要基于小型专业数据集进行训练的生成式 AI 模型。敏感或专有的工作则需要能够保证机密性的生成式 AI 模型。而对于文本生成等常规性任务,就可能需要在尽可能大的数据集上训练生成 AI 模型。3CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院IBM 商业价值研究院甄别出了每位领导者都需要了解的三个要点:现在,每位领导者都需要采取以下三项行动:1.不存在万能的 AI 模型。2.生成式 AI 成本完全 可控。3.生成式 AI 的优势 转瞬即逝。1.为不同的团队提供 不同的工具。2.找到生成式 AI 的最 佳平衡点。3.让模型更高效地运作。尽管团队应当深入理解不同 AI 模型的具体差异,但 CEO 也需要认识到为生成式 AI 的每种应用场景选择合适模型的重要性。理解哪些因素会影响成本、环境足迹和业务价值有助于优化 AI 模型组合的性能,并为团队提供超越竞争对手所需的利器。4CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院1.敏捷性 生成式 AI不存在万能的 AI 模型生成式 AI 可以帮助组织更加精准、敏捷地加快行动但前提是要在合适的环境中针对合适的目标运行合适的 AI 模型。尽管技术高管最有能力决定在何处使用哪种生成式 AI 模型,但了解不同模型类型的优缺点以及竞争对手的走向,有助于 CEO 做出更明智的投资决策。需要了解的事项模型类型示例和特点开放模型Granite、Mistral 训练方式因规模和专业化程度而异 注重透明度和职责划分 不同公司/模型具有不同的开放程度 更具创新潜力专有模型企业定制开发模型 训练成本由企业承担 更有效地控制范围和数据 更具差异化潜力嵌入模型 Models in SAP Joule、Salesforce Einstein 和 Adobe Firefly 集成到现有企业软件中 通常利用现有模型作为软件产品功能 通常不可独立使用公开专业商用模型Google Med-PaLM 基于大型专有数据集进行训练 注重深度和专业化 通常不透明 具有一定的差异化潜力公开大型商用模型 GPT-4 基于海量数据集进行训练 注重广度和深度 通常不透明 差异化潜力有限5CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院我们从调研中收集到了一些有用的数据。例如,在一家典型组织使用的模型组合中,公开可用的大型商用模型(如 GPT-4)仅占约四分之一。公开专业商用模型(如 Google Med-PaLM)占 23%,开放模型(如 Granite 和 Mistral)占 16%,嵌入模型(如 SAP Joule、Salesforce Einstein 和 Adobe Firefly)占 14%,企业定制开发的专有模型占 11%。除此之外,其他模型占 12。在为工作流程选择生成式 AI 模型时,模型规模是技术高管的首要考虑因素之一。大型模型基于数千亿个参数进行训练,可提供更广泛和深入的专业知识,处理更复杂的任务,但其价格更高,碳足迹也更大。相比之下,较小的专业模型通常基于数百亿个参数进行训练,可以更精准、快速、高效地处理特定任务,例如将代码或内容翻译为特定语言。模型所有权是另一个重要考虑因素。尽管公开商用生成式 AI 模型非常受欢迎,约占企业 AI 模型组合的一半,但存在其局限性。任何企业都可以购买或获准使用这些模型,因此所有企业都在使用相同的数据,也就无法有效建立差异化优势。公开模型可以帮助团队更加快速高效地工作,但这些模型在公共云上运行,因此无法为企业提供处理关键任务所需的隐私和控制。而这正是企业专有生成式 AI 模型的用武之地。此类模型是由使用模型的企业开发、拥有和控制的,因此企业可以决定用哪些数据来训练模型,从而减少模型及其输出受到错误信息污染的可能性。这些专有模型还为技术高管提供了更高的灵活性,可决定是在本地环境还是云端运行模型,以及如何存储或使用用户提供的信息来调优模型性能,从而减少私有或敏感数据被不当使用或分享的风险。这是一项至关重要的能力,因为误用、隐私和准确性是高管在选择生成式 AI 模型时最关心的问题。需要了解的事项 不存在万能的 AI 模型(续)开放生成式 AI 模型是在开源开发者社区的帮助下透明地构建的,规模可大可小,也可以解决这些问题。由于此类模型是公开构建的,因此用于训练模型的数据是公开透明的,并且经过严格审查,可迅速识别和应对各种风险及问题,例如输出是否侵犯知识产权或版权。随后,企业可以修改和定制这些基础模型,以加速创新、提升性能以及建立对生成式 AI 的信任。嵌入生成式 AI 模型的来源多样,完全嵌入到 SAP、Adobe 和 Salesforce 等平台或软件中,可满足软件功能范围内的特定需求。此类模型可为所支持的产品提供增值,但无法单独使用。在未来三年内,生成式 AI 模型的采用将大幅增长,其中最具增长潜力的是开放模型。平均而言,受访企业高管预计其 AI 模型组合中的开放模型将增长 63%,其背后的驱动力包括灵活性、透明性和定制化需求。同时,受访高管还预计更加可靠且易于扩展的大型商用模型的使用量将增长 27%,可处理更专业化任务的专业商用模型的使用量将增长 31%。同样在未来三年内,受访高管预计专有模型的使用量将增长 61%,嵌入模型的使用量将增长 34%。6CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院1.敏捷性 生成式 AI为不同的团队提供不同的工具评估基础模型组合,并确定与战略工作流的契合度。投资部署大型生成式 AI 模型以提高生产力,并利用专业模型来处理更有针对性的任务。建立生成式 AI 全景图。了解不同类型的生成式 AI 模型的区别,包括大语言模型、企业定制开发的专有模型、开放模型等。做好充分准备,针对不同用途投资部署不同的模型。绘制 AI 模型地图。要求 AI 高管创建全面的生成式 AI 模型目录,涵盖组织内使用的所有模型的用途、功能和性能指标,并确保该目录定期更新以反映 AI 领域的变化。找到最佳匹配。确保团队根据其优势、劣势和特点来将生成式 AI 模型与合适的工作流相匹配。识别差距但如果一本字典就能解决问题,就不要使用一整套百科全书。需要采取的行动 7CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院CEO 知道其组织需要生成式 AI但成本多少?随着生成式 AI 逐渐渗透到企业的各个领域,企业高管表示首先考虑的是如何在规模化应用中实现成本效益,以便在不同场景中选择合适的模型。就面临的障碍而言,63%的受访高管表示模型成本是最担忧的问题,而 58%的受访高管则认为模型复杂性是最担忧的问题。为什么成本如此重要?因为成本会因所使用的模型而存在很大的差异。例如,更大的模型需要更多的数据存储和计算资源,这可能导致更高的云计算费用。此外,大型模型还需要更频繁的更新、调优和维护,这也会增加人力成本。相比之下,专业模型则具有较低的计算、数据存储和能源成本,并且可减少组织 AI 模型组合对环境产生的影响。而且专业模型的部署速度更快,维护需求更少,因此可降低人力成本。根据具体任务选择最合适的模型规模对于帮助组织管理生成式 AI 成本至关重要。例如,长篇写作、高风险决策和研究假设测试等复杂任务需要多种技能和高精度性,因此也就需要成本更高的大型模型。而更具成本效益的专业模型则更适合处理更具针对性的任务,尤其是速度和效率至关重要的任务,例如实时聊天支持、垃圾邮件检测、数据增强和原型设计。团队还可以利用链式推理等先进技术,将复杂工作分解为专业模型能够处理的小任务,从而减少对成本较高的大语言模型的依赖。随着技术的成熟,专业模型将能够处理更广泛的任务,让组织有机会实现更精细的成本管理。借助“针对特定用途的专用”模型,即根据特定需求和目标进行设计、训练和验证的模型,团队可以仅为每项任务使用所需的资源。如果使用大型模型来训练更具针对性的专业模型,企业还可以提高模型开发的成本效益。在不久的将来,企业高管或许可以通过企业生成式 AI 控制中心来改善成本管理,从而简化关于应为每项任务使用哪种模型的决策。通过添加一个用户友好的体验层,将整个 AI 模型组合中的模型、助手和提示连接起来,企业高管可以实施成本控制,同时确保安全、隐私和合规性,从而让每位员工每次都能高效地使用模型。2.成本 生成式 AI生成式 AI 成本完全可控需要了解的事项受访高管表示成本是采用生成式 AI 模型的首要障碍。8CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院2.成本 生成式 AI找到生成式 AI 的最佳平衡点发掘多样性的价值:为每项任务使用适当规模的生成式 AI 模型,有效控制成本并提高整体 AI 投资回报率。培养与模型无关的思维方式。保持灵活性,采用针对价格和性能进行了优化的模型,在准确性、资源使用和速度之间取得平衡。追求效率设计。根据部署环境来调整模型范围:针对移动和实时应用,优先选择速度更快的小型专业模型,而针对复杂的高精度任务,则优先选择大型模型。削减不必要的开支。为每一个生成式 AI 部署建立明确的性能指标和对标。使用数据驱动的洞察,了解生成式 AI 可在哪些领域实现预期价值,以及需要在哪些方面控制成本。需要采取的行动9CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院3.竞争力 生成式 AI生成式 AI 的优势转瞬即逝生成式 AI 当前带来的竞争优势,未来可能只是基本要求。随着团队获得更丰富的生成式 AI 经验以及模型变得更加智能,CEO 必须将持续改进列为首要任务。致力于持续优化的组织有望实现显著的绩效提升。根据 IBM 商业价值研究院的研究,对于使用调优或提示工程技术的组织,其模型输出的准确度要比其他组织高出约 25%。更高的准确度有助于改进预测能力、资源分配和个性化体验,从而最终转化为更高的盈利水平。然而,只有 42%的受访高管表示始终会使用提示工程技术(即通过设计输入来确保生成符合预期的输出)来提高模型准确度。但模型优化只是解决方案的一部分。随着模型组合的不断发展,模型治理也必须同步演进。这就需要定期更新企业的内部管理方式,以便有效管理和控制模型库,以及明确哪些人员有权开发、训练和调优模型。组织还需要通过清需要了解的事项晰的流程来跟踪模型绩效指标,处理模型漂移(即模型准确性随着时间的推移而下降),以及纠正模型输出中的偏差。最重要的是,团队还需应对快速变化的法规以保持合规性。组织还需要持续改进其 AI 基础架构(即混合云战略),以便开发和采用更强大的 AI 模型。随着数据量和模型复杂性的增加,技术基础架构必须能够处理更高的负载。接下来是扩展的问题。随着越来越多的团队开始使用各种不同形式的生成式 AI,组织需要扩展其基础架构或云环境来满足日益增长的需求。那么当前的现实情况是什么样的?目前,至少有一半的组织正在专注于优化网络基础架构、加速数据处理或部署分布式计算。总体而言,63%的受访高管表示其组织正在使用至少一种基础架构优化技术。调优和提示工程可将模型准确度提高 25%。10CEO 生成式 AI 行动指南 AI 模型优化IBM 商业价值研究院3.竞争力 生成式 AI让模型更高效地运作不要满足于早期的成功。持续推动团队利用最新的 AI 技术和基础架构来提升模型性能并超越竞争对手。提高生成式 AI 的标准。将企业数据整合到私有云或本地部署环境中的现有生成式 AI 模型中,打造组织的独有优势。使用调优、提示工程和其他优化技术,始终保持领先竞争对手三步。打造面向未来的 AI 基础架构。投资部署基于云的服务或专用硬件以及开放框架,以便持续利用 AI 驱动的创新来推动变革。避免被边缘化。建立清晰的治理框架,加速推动生成式 AI 的应用。质疑自身在监管准备方面的假设,成为最严格的自我审查者。需要采取的行动 Copyright IBM Corporation 2024国际商业机器(中国)有限公司 北京市朝阳区金和东路 20 号院 3 号楼 正大中心南塔 12 层 邮编:100020美国出品|2024 年 9 月IBM、IBM 徽标、 和 Watson 是 International Business Machines Corporation 在世界各地司法辖区的注册商标。其他产品和服务名称可能是 IBM 或其他公司的商标。以下 Web 站点上的“Copyright and trademark information”部分中包含了 IBM 商标的最新列表: 可能随时对其进行更改。IBM 并不一定在开展业务的所有国家或地区提供所有产品或服务。本文档内的信息“按现状”提供,不附有任何种类的(无论是明示的还是默示的)保证,包括不附有关于适销性、适用于某种特定用途的任何保证以及非侵权的任何保证或条件。IBM 产品根据其提供时所依据的协议条款和条件获得保证。本报告的目的仅为提供通用指南。它并不旨在代替详尽的研究或专业判断依据。由于使用本出版物对任何企业或个人所造成的损失,IBM 概不负责。本报告中使用的数据可能源自第三方,IBM 并未对其进行独立核实、验证或审查。此类数据的使用结果均为“按现状”提供,IBM 不作出任何明示或默示的声明或保证。WPXGRV7D-ZHCN-01IBM 商业价值研究院CEO 生成式 AI 行动指南 AI 模型优化本报告分析所依据的统计数据来自 IBM 商业价值研究院联合牛津经济研究院开展的一次专项调查。这项调查于 2024 年 6 月询问了 200 名美国高管对 AI 模型优化的看法。IBM 商业价值研究院IBM 商业价值研究院(IBM IBV)成立二十多年来,凭借IBM在商业、技术和社会交叉领域的独特地位,每年都会针对成千上万高管、消费者和专家展开调研、访谈和互动,将他们的观点综合成可信赖的、振奋人心和切实可行的洞察。需要 IBV 最新研究成果,请在 上注册以接收 IBV 的电子邮件通讯。您可以在 Twitter 上关注 IBMIBV,或通过 https:/ibm.co/ibv-linkedin 在 LinkedIn 上联系我们。访问 IBM 商业价值研究院中国官网,免费下载研究报告:https:/ IBM 商业价值研究院官网微博微信公众号
版权声明 本报告中所涉及的图片、表格及文字内容的版权归浪潮电子信息产业股份有限公司和中国信息通信研究院共同所有。其中部分数据在标注有来源的情况下,版权归属原数据公司所有。任何机构、个人在引用本报告数据或转载有关报告内容时,应注明“来源:人工智能算力高质量发展评估体系报告”。违反上述声明者,将追究其相关法律责任。目 录 1 发展现状及挑战.1 1.1 发展现状.1 1.1.1 政策上:政策导向日益明确.1 1.1.2 技术上:生成式 AI 突破发展.3 1.1.3 市场上:算力投资持续加码.4 1.1.4 规模上:智算规模增速明显.6 1.1.5 发展水平上:算力发展由“量”向“质”.7 1.2 面临挑战.8 1.2.1 挑战一:算力供给不足,供需匹配不平衡.8 1.2.2 挑战二:算力智能水平较低,难以满足多元应用场景.9 1.2.3 挑战三:算力面临能源考验,节能降碳刻不容缓.10 1.2.4 挑战四:多样化算力需求提升,普适普惠水平较低.10 1.2.5 挑战五:供应链完备性不足,生态构建待完善.11 1.2.6 挑战六:性能评价简单,算力实测性能欠缺.12 2 定义、内涵及特征.12 2.1 定义.12 2.2 内涵.14 2.3 特征.15 2.3.1 高算效:设计与运行计算效率“双优”体现.15 2.3.2 高智效:兼备高效和智能的 AI 业务支撑能力.16 2.3.3 高碳效:最低碳排放前提下实现最大化算力输出.17 2.3.4 可获得:普适应用需求和普惠使用成本的极致追求.18 2.3.5 可持续:技术兼容、供应链完备、产业生态开放的共同选择.18 2.3.6 可评估:反映算力实际应用水平的多元评估.19 3 发展路径及展望.19 3.1 发展路径.20 3.1.1 系统设计,提升算效.20 3.1.2 协同驱动,提升智效.21 3.1.3 全生命周期管理,提升碳效.22 3.1.4 基建先行,推动算力普适普惠.24 3.1.5 繁荣生态,推动算力可持续发展.25 3.1.6 多元评估,加速算力规范化发展.27 3.2 展望.28 4 评估体系探索.29 4.1 评估体系构建背景.30 4.1.1 评估体系构建现状.30 4.1.2 评估体系构建建议.31 4.2 评估体系构建原则.33 4.3 评估体系构建实践.34 4.3.1 评估体系.34 4.3.2 算效水平.34 4.3.3 智效水平.35 4.3.4 碳效水平.36 4.3.5 可获得水平.37 4.3.6 可持续水平.37 4.4 评估体系构建意义.39 4.5 评估体系应用建议.39 1 1 发展现状及挑战发展现状及挑战 1.1 发展现状 1.1.1 政策上:政策导向日益明确 全球各国通过政策支持、战略规划等手段,加速构建领先的算力全球各国通过政策支持、战略规划等手段,加速构建领先的算力竞争力。竞争力。美国公布 2024 财年政府预算,包括国防部、能源部、国土安全部等多个机构,累计向 AI 领域计划投入超过 2511 亿美元,以推动 AI 研究和软硬件服务;欧洲陆续发布 塑造欧洲的数字未来、欧洲芯片法案等文件,围绕数字化转型进行算力产业布局;日本近年来频繁强调振兴半导体产业,坚持以应用、绿色为导向发展算力,不断扩大国内尖端半导体生产。这些政策的实施加速了全球产业升级和科技创新,并提升了这些国家的算力竞争地位。我国以算力基础设施建设为锚点,全面推动算力高质量发展。我国以算力基础设施建设为锚点,全面推动算力高质量发展。二十届三中全会提出,高质量发展是全面建设社会主义现代化国家的首要任务。我国通过加强算力基础设施建设,推动算力技术与产业的创新发展,为经济社会的高质量发展注入新动能。在国家层面,数字中国建设整体布局规划、深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见、算力基础设施高质量发展行动计划、数据中心绿色低碳发展专项行动计划 等提出我国算力高质量发展的具体要求;在地方层面,浙江、北京、上海、广东、贵州、山西等省市也纷纷发布相关政策明确未来几年算力高质量发展行动计划。2 表 1 我国算力中心相关政策规划(部分)发布发布 时间时间 发布部委发布部委/省份省份 政策名称政策名称 2024 年 7 月 国家发改委、工信部、国家能源局、国家数据局 数据中心绿色低碳发展专项行动计划 2023 年 12 月 国家发改委、国家数据局、中央网信办、工信部、国家能源局 深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见 2023 年 10 月 工信部、中央网信办、教育部、国家卫健委、中国人民银行、国务院国资委 算力基础设施高质量发展行动计划 2023 年 2 月 中共中央、国务院 数字中国建设整体布局规划 2024 年 5 月 浙江 浙江省运力提升行动方案(20242027年)2024 年 4 月 北京 北京市算力基础设施建设实施方案(20242027 年)2024 年 4 月 江苏 江苏省算力基础设施发展专项规划 2024 年 3 月 上海 上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024-2025 年)2024 年 3 月 广东 广东省算力基础设施高质量发展行动暨“粤算”行动计划(2024-2025 年)2024 年 2 月 贵州 贵州省算力基础设施高质量发展行动计划(2024-2025 年)2024 年 1 月 山西 山西省算力基础设施高质量发展实施方案 2023 年 12 月 深圳 深圳市算力基础设施高质量发展行动计划(2024-2025)2023 年 12 月 重庆 重庆市算力网络发展“算力山城 强算赋能”行动计划(2023-2025 年)2023 年 12 月 安徽 安徽省智能算力基础设施建设方案(2023-2025 年)2023 年 8 月 湖北 湖北省加快发展算力与大数据产业三年行动方案 2023 年 7 月 河南 河南省重大新型基础设施建设提速行动方案(2023-2025 年)2023 年 4 月 天津 关于做好算力网络建设发展工作的指导意见 2023 年 3 月 宁夏 全国一体化算力网络国家枢纽节点宁夏枢纽建设 2023 年工作要点(来源:公开资料)3 1.1.2 技术上:生成式 AI 突破发展 人工智能以生成式人工智能以生成式 AI 技术为核心快速发展。技术为核心快速发展。以 ChatGPT 为代表的 AIGC 技术加速成为 AI 领域的最新发展方向,对经济社会发展产生了重大的影响。随着人工智能预训练大模型的不断进步、AIGC 算法的持续创新,以及多模态 AI 技术的日益普及,AI 已经能够生成包括文本、代码、图像、语音和视频在内的多样化内容。这些技术的发展提升了 AIGC 模型的通用性和工业化水平,AIGC 的商业潜力变得更加显著,如今大模型已成为企业在 AI 领域竞争的核心焦点。算力成为算力成为推动推动生成式生成式 AI 发展发展的的关键。关键。在大模型训练和生成式 AI应用的推动下,GPU 和异构计算资源需求显著增长,算力的提升从简单的硬件扩展发展为涵盖算法优化、系统设计、资源调度和网络通信等多个层面的系统优化,算力性能和效率对模型推理、训练至关重要。在大模型训练中,通常采用多机多卡构建的算力集群进行分布式训练,而拥有大量的计算节点并不等同于拥有强大的计算能力。在分布式训练环境中,拥有数千亿至万亿参数的庞大模型通信时间可能占据整个训练过程的一半,网络通信和数据缓存等瓶颈问题会显著降低训练效率。另外,随着模型参数量增加,传统的训练方式可能会导致训练过程中算力利用率的降低。在大模型训练中,Checkpoint 机制常用于在训练中定期保存模型参数,然而对于参数量极大的模型,该训练方式可能会导致显著的写入延迟,如 GPT-3(1750 亿参数),以 15GB/s 的文件系统写入速度计算,完成一次 Checkpoint 需要 2.5 分钟,这不仅增加了训练时间,也降低了 GPU 的利用率。4 1.1.3 市场上:算力投资持续加码 国家以直接投资或补贴方式推动算力产业投资建设。国家以直接投资或补贴方式推动算力产业投资建设。美国计划 5年内投资 2800 亿美元以保持美国在芯片技术领域的领先地位;中国全面启动“东数西算”工程,截至 2024 年 6 月底,“东数西算”八大国家枢纽节点直接投资超过 435 亿元,拉动投资超过 2000 亿元;欧盟计划提供 12 亿欧元的公共资金用于“欧洲共同利益重要计划下一代云基础设施和服务”;日本经济产业省拟为 5 家日本企业提供总额 725 亿日元的补贴,用于打造人工智能超级计算机。随着全球各国在算力领域的竞争愈发激烈,算力相关产业市场规模将呈现持续增长态势。以 AI 服务器为例,据 IDC 预测,未来几年全球人工智能服务器市场规模将持续增加。图 1 全球人工智能服务器市场规模预测(单位:百万美元)(来源:IDC,2023)科技巨头发力智能算力,万卡算力集群布局加快。科技巨头发力智能算力,万卡算力集群布局加快。2023 年以来人工智能市场持续保持高增长态势,成为推动各国经济增长和技术创新的关键因素。据 IDC 研究,预计 2022 年至 2032 年全球人工智能819294654668203109881868421818231522359023674050001000015000200002500030000350004000020222023202420252026生成式AI服务器非生成式AI服务器 5 产业规模的复合增长率高达 42%,2032 年将达到 1.3 万亿美元。基于人工智能的广阔前景,全球科技巨头纷纷加大对 AI 基础设施布局以维持行业竞争力。国际上 Meta、微软&OpenAI、xAI 等多家 AI 巨头陆续宣布或者完成 10 万卡集群建设,国内通信运营商、头部互联网、大型 AI 研发企业等均发力超万卡集群的布局。图 2 全球 AI 产业规模预测(单位:十亿美元)(来源:IDC、Bloomberg、Mandeep Singh)406713721730439954872889710791304020040060080010001200140020222023202420252026202720282029203020312032 6 表 2 全球科技巨头智算布局(部分)科技科技 巨头巨头 万卡智算集群布局进展万卡智算集群布局进展 谷歌 2023 年 5 月,推出 AI 超级计算机 A3,搭载了约 26000 块 H100 GPU,为其在机器学习和深度学习研究中的应用提供强大的算力支持 Meta 2024 年初,Meta 建成了两个各含 24576 块 GPU 的集群,并设定目标:到2024 年底,构建一个包含 35 万块 H100 GPU 的庞大基础设施,以支撑其元宇宙和 AI 研究 微软 早在 2020 年,微软便构建了一个覆盖 1 万块 GPU 的超级计算机,加速其在云计算和 AI 服务领域的发展 亚马逊 Amazon EC2 Ultra 集群采用了 2 万个 H100 TensorCore GPU,为用户在处理大规模数据分析和机器学习任务方面提供强大算力支持 特斯拉 2023 年 8 月,特斯拉上线集成 1 万块 H100 GPU 的集群,将极大提升特斯拉在自动驾驶和车辆智能化方面的研发速度 腾讯 推出的星脉高性能网络能够支持高达 10 万卡 GPU 的超大规模计算,网络带宽高达 3.2T,为未来的 AI 和大数据应用提供了广阔的发展空间 字节跳动 提出的 MegaScale 生产系统,支撑 12288 卡 Ampere 架构训练集群,为字节跳动在内容推荐、图像处理等 AI 应用方面提供了强大的算力保障 中国移动 计划今年商用哈尔滨、呼和浩特、贵阳三个万卡集群,总规模接近 6 万张GPU 卡 中国电信 计划 2024 年在上海规划建设一个达到 15000 卡、总算力超过 4500P 的万卡算力池。2024 年 3 月,天翼云上海临港万卡算力池已正式启用 中国联通 计划今年内在上海临港国际云数据中心建成中国联通首个万卡集群,集群建成后将为中国联通在数据中心和云计算市场提供新的竞争优势(来源:公开资料)1.1.4 规模上:智算规模增速明显 全球算力规模稳步扩张,智算同比翻倍增长。全球算力规模稳步扩张,智算同比翻倍增长。以 AIGC 为代表的人工智能应用、大模型训练等新需求、新业务的崛起,推动全球智算规模呈现高速增长态势。据中国信通院测算,截至 2023 年底,全球 7 算力总规模约为 910EFLOPS1“,同增增长 40%,智能算力规模达到335EFLOPS,同增增长达 136%,增速远超算力整体规模增速。我国我国智能算力占增显著增加,智算中心集聚分布。智能算力占增显著增加,智算中心集聚分布。据中国信通院测算,截至 2023 年底,智能算力规模占整体算力规模的增例近 30%,增效明显。国家及地方层面积极推进智算中心建设,北京、广东等多地提出2025 年智算规模目标。从区域分布上来看,智算中心呈集群建设趋势,过半分布在我国东部地区。图 3 全球算力规模(单位:EFLOPS)(来源:Gartner、IDC、中国信通院)1.1.5 发展水平上:算力发展由“量”向“质”我国算力发展正处在由我国算力发展正处在由“量的扩张量的扩张”转向转向“质的提高质的提高”这一重要关这一重要关口。口。我国算力产业规模扩张下开始以应用为导向,推动过去的重资产、重硬件模式向软硬协同、服务驱动转型等高质量发展方向转型升级,算力发展从规模速度型粗放增长转向质量效率型集约增长。在应用导向下,全国各地增加智能算力生产以提升算力在人工智能领域的适配 1 算力规模包含通用算力、智能算力、超算算力,边缘算力暂未纳入统计范围,表示方式皆为单精度(FP32)。39849855111314233510102401002003004005006002021年2022年2023年通用算力智能算力超算算力 8 水平,建设超大规模算力中心集群,以匹配大模型训练需求。随着集群建设规模越来越大,算力效率问题引起关注。算力中心建设、运营开始重视超大规模组网互联、集群有效计算效率、训练高稳定性与可用性等算力处理效率相关的性能。另外,双碳目标日益紧迫,能耗要求日趋严格,算力行业的高耗能和碳排放问题引起诸多关注。我国出台了一系列政策对算力产业节能降碳提出更加严格的要求,相关企业通过技术创新、绿色管理等措施不断开展节能降碳行动,绿色低碳成为算力产业重要发展方向。与此同时,算力中心作为算力的主要载体,承载功能逐渐多元化。算力中心可为服务购买方提供多元化业务支撑和多样化算力服务,不再只是提供计算、存储等服务的场所,数据、算力、算法、生态合作等服务内容不断拓宽算力中心能力边界。算力提供方越来越注重提升算力服务的品质,整合各类算力资源,为用户提供一站式服务,降低用户获取算力资源的成本,推动算力普适普惠。1.2 面临挑战 1.2.1 挑战一:算力供给不足,供需匹配不平衡 一方面,一方面,AIGC 带动算力需求总量不断增长,大模型训练亟需大带动算力需求总量不断增长,大模型训练亟需大量量 AI 算力支撑。算力支撑。从整体需求规模上看,模型训练引起 AI 算力需求暴增。据新一代人工智能基础设施白皮书表明,过去几年,大模型参数量以年均 400%复合增长,AI 算力需求增长也超过 15 万倍,远超摩尔定律。在单个大模型训练需求上,模型越大算力需求越大,以参数规模达到 4050 亿的 Llama3.1 大模型为例,其单次训练算力需 9 求相较于 700 亿的 Llama2 翻了 50 倍。另外伴随模型不断迭代,训练数据集规模将不断增大,未来的大模型的算力需求将呈现指数级爆发式增长。另一方面,现有供给结构与用户实际的算力需求另一方面,现有供给结构与用户实际的算力需求不匹配不匹配造成资源造成资源浪费。浪费。一是供需错位问题,国内算力产业链企业相对分散,众多芯片厂商和大模型企业技术路径不同容易造成芯片和模型之间不适配,且大多数智算服务仍是裸金属租赁的粗放式经营方式,无法精准满足不同企业的多元化需求。二是资源利用率不足问题,据清华大学研究表明,大模型在处理大量数据时,由于算力调度、系统架构、算法优化等诸多问题,很多大模型企业的 GPU 算力利用率低于 50%,造成了巨大的资源浪费。1.2.2 挑战二:算力智能水平较低,难以满足多元应用场景 人工智能、大数据、物联网等数字技术不断人工智能、大数据、物联网等数字技术不断发展发展,多元应用场景,多元应用场景对算力的智能水平和计算对算力的智能水平和计算能力能力要求不断提升。要求不断提升。从需求上看,算力应用场景的复杂化导致数据量和算法复杂度急剧增加,这要求算力具备更高的智能化水平。算力是算法自主学习的基础,能够灵活处理和分析大规模的数据集,有助于满足更大参数量模型的训练需求,不断提升模型的自主学习和泛化能力。从技术上看,传统芯片架构面临着“存储墙”和“功耗墙”的问题,难以满足现阶段人工智能应用的低时延、高能效、高可扩展性的需求,需要先进的计算架构将更多算力单元高密度、高效率、低功耗地连接在一起,提高异构多核之间的传输速率,从而为人工智能大模型提供强大计算能力保障。10 1.2.3 挑战三:算力面临能源考验,节能降碳刻不容缓 双碳目标下,算力产业面临节能降碳挑战。双碳目标下,算力产业面临节能降碳挑战。算力中心是算力的主要载体,是公认的高耗能基础设施。据中国信通院数据表明,截至2023年底,我国算力中心耗电量达 1500 亿千瓦时,预计到 2030 年将超过4000 亿千瓦时,若不加大可再生能源利用增例,2030 年全国算力中心二氧化碳排放或将超 2 亿吨。人工智能模型训练的能耗远高于常规计算能耗,根据 Digital Information World 数据,训练 AI 模型产生的能耗是常规云工作的三倍。OpenAI 曾发布报告称,自 2012 年以来,AI 训练的电力需求每 3-4 个月就会翻一倍。据浪潮信息测算,一个10 万亿参数大模型训练需要 10 万卡 H100 集群,训练 1193 天,所消耗的电量约 40 亿千瓦时,约 1.4 亿美国家庭 1 天用电量。面对人工智能对算力的旺盛需求,算力产业如何在高速发展的同时实现“碳中和”,是当下整个行业需要解决的重要问题。图 4 近 5 年我国算力中心耗电量(单位:亿千瓦时)(来源:中国信通院)1.2.4 挑战四:多样化算力需求提升,普适普惠水平较低 8249391116130015000200400600800100012001400160020192020202120222023 11 算力资源获取成本有待降低,多元算力匹配能力有待加强。一是算力资源获取成本有待降低,多元算力匹配能力有待加强。一是算力资源获取上,算力资源获取上,据斯坦福 2024 年人工智能指数报告 估算,OpenAI的 GPT-4 预计使用了价值 7800 万美元的计算资源进行训练,而谷歌的 Gemini Ultra 耗费了高达 1.91 亿美元的计算资源成本。目前大模型研发已进入万卡时代,一家企业如果想拥有自己的大模型,至少需要几十亿投资,对于中小企业来说算力成本过高。二是算力应用上,二是算力应用上,大模型训练、推理等业务场景的出现促使企业业务对多样化算力需求提升,如今产业界不论是模型还是算力芯片,正处于百花齐放、创新并存的阶段,算力资源多元并用,多元算力与多种模型及框架的适配难度较大。另外,大模型应用能够帮助企业更高效率的实现商业目标,但对于绝大多数企业而言,大模型的应用开发流程繁琐,模型设计、训练、调优等环节需要专业开发人员,自研大模型成本高且研发门槛过高。1.2.5 挑战五:供应链完备性不足,生态构建待完善 算力供应链算力供应链完备性不足完备性不足,亟需强化算力保障能力。,亟需强化算力保障能力。一是随着多元异构算力的发展,不同 OS、固件、整机、芯片平台兼容性问题突出,不同硬件生态系统封闭且互不兼容,给算力使用方带来一系列技术挑战。二是算力服务商资源采购受各厂商芯片生态影响,存在应用与硬件紧耦合、难迁移问题。如一些芯片厂商为了维护自身利益,会构建相对封闭的生态系统,限制其他厂商或第三方开发者的接入。这种封闭性导致应用开发者只能针对特定厂商的芯片进行优化和定制,进一步加剧了应用与硬件之间的紧耦合关系。12 1.2.6 挑战六:性能评价简单,算力实测性能欠缺 现有算力评估体系评估场景简单,无法全面、深入地反映算力应现有算力评估体系评估场景简单,无法全面、深入地反映算力应用的实际效果。用的实际效果。如今算力基础设施面临着更高的建设与发展要求,应对算力质量进行系统评估,保障算力安全稳定运行和资源高效利用。在万亿参数模型的训练过程中,软硬件组件需精密配合,一旦出现问题,其定界与定位过程极为复杂。根据公开资料显示,业界在硬件故障定位上通常需要 1-2 天,复杂应用类故障的定位时间则更长。节点故障不仅会导致训练时间大幅延长,还会对算力资源造成巨大浪费。然而,当前算力评估体系由于评估场景相对单一,往往难以全面、深入地揭示算力应用在实际复杂环境中的真实效果,测试评估指标主要以单芯片性能测试为主,测试结果偏理论,参考价值有限,对于多场景下算力的性能评估也缺乏深入研究与重视,这严重限制了评估体系在指导高效能、多元化算力资源配置中的应用广度和效果。2 定义、内涵及特征定义、内涵及特征 全球及我国算力发展态势显示,在人工智能时代,算力产业政策导向日益明确、算力领域相关技术突破发展、算力投资持续加码、智算规模不断增加、整体发展水平日益提升,然而算力发展也面临着供给不足、供需匹配难、能耗激增等挑战。算力成为衡量国家综合实力和国际话语权的重要指标,亟需更高水平的发展变革以应对新阶段的发展机遇和挑战。2.1 定义 人工智能时代,高质量算力是基于最新人工智能理论,采用先进人工智能时代,高质量算力是基于最新人工智能理论,采用先进 13 的的人工智能计算架构,与算法、数据深度结合的高水平计算能力。人工智能计算架构,与算法、数据深度结合的高水平计算能力。高质量算力是驱动“算法”赋能劳动者、加速“数据”优化劳动对象、激发“算力(设备)”升级劳动资料,从而推动生产力要素发生根本性质变,实现全要素生产率提升的一种新质生产力,有效推动数字经济与实体经济的深度融合,实现经济社会高质量发展。表 3 生产力变迁 农业时代农业时代 工业时代工业时代 人工智能时代人工智能时代 劳动者劳动者 人人 缓慢增长(马尔萨斯陷阱)人人 线性增长(医疗、粮食进步)人人 算法算法 算法产生智能,劳动者能力增强 劳动劳动 对象对象 农作物农作物 增较原始 工业产品工业产品 延伸至一切可利用的有形物质,总量越用越少 数据数据 从有形到无形,生生不息,越用越多 劳动劳动 资料资料 农业工具农业工具 生物能驱动 工业设备工业设备 化石能、电能驱动 算力(设备)算力(设备)计算力驱动、生产工具智能升级(来源:浪潮信息、中国信通院)人工智能时代,高质量算力具备技术创新的“主引擎”、生产要素配置的“优化器”、产业深度转型升级的“化化”三大内涵;具备高算效、高智效、高碳效、可获得、可持续、可评估六大特征;以系统设计、协同驱动、全生命周期管理、基建先行、繁荣生态、多元评估为六大主要发展路径,可充分响应数字经济快速增长的计算需求,应对人工智能时代算力发展机遇和挑战。14 图 5 高质量算力魔方(来源:中国信通院)2.2 内涵 高质量算力是人工智能时代的新质生产力。新质生产力本质是生高质量算力是人工智能时代的新质生产力。新质生产力本质是生产力,由技术革命性突破、产力,由技术革命性突破、生产要素生产要素创新性配置、产业深度转型升级创新性配置、产业深度转型升级而化生。而化生。人工智能时代背景下,高质量算力已逐渐融合到生产生活的方方面面,为社会、产业智能化转型提供基础动力,具体体现在以下三点:一是技术创新的一是技术创新的“主引擎主引擎”。高质量算力推动人工智能模型训练和应用,在 AI 模型训练和部署上更具优势,推动预训练大模型在海量数据的学习训练后具有良好的通用性、泛化性和高效率,用户基于大模型通过零样本、小样本学习即可获得领先的效果,能够显著降低AI 应用的门槛。在科学研究方面,高质量算力强大的计算能力能够提高大规模数据处理的速度,缩短模型训练的时间,进一步提升科研效率,降低科研成本,同时加速前沿科学问题的探究,如新药创制、基因研究、新材料研发等,推动科学技术创新发展。15 二是生产要素配置的“优化器”二是生产要素配置的“优化器”。数据是人工智能的三要素之一,高质量算力提供强大的计算资源对数据进行分析、加工、处理,将海量数据转化为先进生产要素,畅通生产、分配、流通、消费各环节,构建数据流通交易体系,实现数据资源的有效配置和价值最大化。另外,高质量算力通过智能化的资源管理和调度系统,根据实际需求动态调整资源分配,对计算、存储和网络资源进行优化配置,通过虚拟化和云计算技术实现资源的弹性伸缩,提高资源利用效率。三是产业深度转型升级的“化化”。三是产业深度转型升级的“化化”。在改造提升传统产业上,高质量算力推动前沿科技与传统行业相结合,为传统产业注入新活力,化生新的商业模式和服务,如智能制造、智能医疗、智慧金融等。在培育壮大新兴产业上,高质量算力推动人工智能、大数据、区块链等数字产业发展,加快数字产业化步伐。在推动未来产业建设上,高质量算力瞄准前沿领域,促进元宇宙、人形机器人、脑机接口、量子信息等新产业发展,加速重大科技成果产业化。2.3 特征 2.3.1 高算效:设计与运行计算效率“双优”体现 高算效高算效指的是指的是在提高在提高算力算力理论算效的同时考虑更高的实测性能理论算效的同时考虑更高的实测性能和资源利用率,和资源利用率,是是综合考虑设计、运行等维度的计算效率。综合考虑设计、运行等维度的计算效率。理论算效是设计维度理论算效是设计维度上的考量上的考量,是计算系统算力与功率的增值,即“每瓦功率所产生的算力”,是同时考虑计算性能与功率的一种效率指标。理论算效数值越大,代表单位功率的算力越强,效能越高。2023 年年底,全国在用算力中心平均算效为 11.8GFLOPS/W,达到 16 GB/T 43331-2023“互联网数据中心“(IDC)技术和分级要求中通用算力算效第三等级,我国算效水平仍有较大的提升空间。实测性能是实测性能是短期短期运行维度运行维度上的考量上的考量,在充分考虑理论算效的基础上,关注的是应用场景下的实测性能,如单位时间内处理的 Token 数量、时延、模型训练时间、数据处理质量等指标。在实测性能方面,高质量算力致力于提升整机系统输出能力,消除网络、存储等集群性能瓶颈,兼顾软件生态建设、应用适配。如今算力集群实测性能和理论性能差距过大这一问题逐渐凸显,部分算力实测性能不足 10%,大量算力资源被浪费,算力系统实测性能亟需优化提升。资源利用率是资源利用率是长期长期运行维度运行维度上的考量上的考量,指的是算力系统实际运行过程中的平均资源利用率,避免算力堆砌及大量资源闲置。资源利用率的“高”体现在不断优化算力资源实际应用水平。如可通过优化GPU平均利用率来提升算力资源利用率。据公开数据统计,传统模式下的智算中心 GPU 利用率较低,平均数值低于 30%,英伟达 GTC 2022 公布数据显示 Google 云平均 GPU 利用率为 25%,算力资源利用率存在较大优化空间。2.3.2 高智效:兼备高效和智能的 AI 业务支撑能力 高智效指的是算力具备高智效指的是算力具备高效处理高效处理 AI 业务的能力业务的能力和较高的自动化、和较高的自动化、智能优化水平智能优化水平。高智效体现算力面向人工智能业务的高效处理能力。高智效体现算力面向人工智能业务的高效处理能力。在以大模型为代表的人工智能技术上,更高的模算效率是体现高智效的主要指标。模算效率正增于模型精度与模型的计算效率,模型本身精度越高、在 17 对应软件上对硬件性能利用率越高、推理及训练所需算力越小,模算效率越高,整体反映被测模型在人工智能业务应用中的综合处理效率。高智高智效效体现算力体现算力较高的自动化水平和智能优化能力较高的自动化水平和智能优化能力。这种高效能不仅体现在硬件的计算速度和处理能力上,更在于整个系统对资源的智能管理和优化调度上。通过高度自动化的任务调度、资源分配和故障恢复机制,以及智能优化算法、能耗管理和自适应学习技术,高智效的算力系统能够实现更强的可靠性和可用性,为推动智能化应用的发展提供有力支持。2.3.3 高碳效:最低碳排放前提下实现最大化算力输出 高碳效指的是算力在最低碳排放前提下实现最大化算力输出,是高碳效指的是算力在最低碳排放前提下实现最大化算力输出,是兼顾碳排放量和算力性能的综合指标。兼顾碳排放量和算力性能的综合指标。高碳效不仅关注算力单纯的能源消耗、算力输出水平,更注重算高碳效不仅关注算力单纯的能源消耗、算力输出水平,更注重算力系统力系统从从采购到回收整个采购到回收整个过程过程的的全生命周期碳足迹管理。算力碳效全生命周期碳足迹管理。算力碳效是有效衡量高碳效水平的一个关键指标,指设备使用周期内产生的碳排放与所提供的算力性能的增值。据数据中心算力碳效白皮书测算表明,对于服务器来说,CPU 性能越好,可提供的计算能力更优越,所消耗的能量越多,带来的温室气体排放也越多,但服务器算力碳效即单位算力性能的碳排放量反而会降低。全生命周期碳足迹管理全生命周期碳足迹管理主要通过绿色采购、绿色设计、清洁生产、绿色包装和运输、绿色运营、回收处理等降低整个算力系统的碳排放。如在绿色设计环节采用高效的服务器和存储设备、先进的制冷和散热技术。根据中国电子节能技术协会的数据,液冷 PUE 低于传统风冷 PUE 至少 50%,意味着算力 18 中心的能耗可至少减少 50%,碳排放量也将减少 50%。2.3.4 可获得:普适应用需求和普惠使用成本的极致追求 可获得指的是算力能够满足普适应用可获得指的是算力能够满足普适应用需需求和普惠使用成本求和普惠使用成本要求要求。普适性表现在普适性表现在算力能够广泛满足各种应用场景的需求。算力能够广泛满足各种应用场景的需求。普适性保障算力系统在智慧医疗、智能制造、自动驾驶、金融服务、科研计算、智慧城市等多个领域的广泛应用,是推动这些领域发展的关键因素。在使用门槛上,算力像水电类的公共资源一样,具备好用易得等特点,各行各业用户无需深入了解复杂的技术细节,只需简单的操作即可获得所需的计算资源。普惠性主要表现在普惠性主要表现在可保障可保障用户以合理、可负担的成本使用用户以合理、可负担的成本使用算力算力资资源。源。普惠算力通过优化资源配置、提供灵活计费方式、推动技术创新等手段不断降低用户成本、扩大服务覆盖范围、提升用户体验,可实现各行各业低成本使用,无论是大型企业还是中小企业,甚至是个人开发者,都可以方便地获取和使用算力资源。2.3.5 可持续:技术兼容、供应链完备、产业生态开放的共同选择 可持续指的是算力具备技术兼容、供应链完备、产业生态开放的可持续指的是算力具备技术兼容、供应链完备、产业生态开放的特性。特性。在技术上,在技术上,算力的可持续特征体现在可向“前”兼容,向“后”持续迭代升级,软件配套支持能力及开放水平高,不同品类、不同技术路线的芯片、算法、模型、应用可实现兼容适配。在供应链上,在供应链上,算力的可持续特征体现在从核心部件到专用芯片、从电子元器件到基础软件、应用软件的全方位、多层次的供应链条强 19 大且完备,并以完善的产业链带动算力产业上下游的发展。在产业生态上,在产业生态上,算力的可持续特征体现在算力服务生态开放,算力系统分层解耦,提供可替代的算力支撑能力,可有效打破封闭和垄断现象,降低应用迁移门槛。2.3.6 可评估:反映算力实际应用水平的多元评估 可评估指的是面向人工智能应用场景,算力可通过完整、有效的可评估指的是面向人工智能应用场景,算力可通过完整、有效的评估体系得到反映实际应用情况的特性。评估体系得到反映实际应用情况的特性。当前算力评估体系存在评估场景简单、同质化严重、评估维度单一、全面性不足等问题,亟需拓展系统性能评价维度,以更全面、深入地反映算力应用的实际效能与发展潜力。高质量算力的评估体系能够满足市场对高效、可衡量的计算力解决方案的评估需求,评估体系主要具有以下特点:一一是评估体系全面多元,适用范围广。是评估体系全面多元,适用范围广。评估体系指标多元,综合考虑人工智能不同业务场景、多环节的质量评估需求,侧重评估算力在人工智能方面的创新能力和对新技术的支持程度,评估结果为算力技术和成本优化提供依据,提升算力资源的人工智能支撑能力。二二是评估指标以应用为导向,科学合理。是评估指标以应用为导向,科学合理。重点体现在从单纯的理论计算效率评估升级为对实际应用效率等的多维评估。通过标准化的评估方式得出准确数据,通过数据结果辅助用户决策,提出贴合实际的指导建议,促进技术、产品功能不断升级,引导产业向更高效、规范的方向发展。3 发展路径发展路径及展望及展望 20 3.1 发展路径 发展具有高算效、高智效、高碳效、可持续、可获得、可评估六大特征的高质量算力是迎接新阶段重大发展机遇、应对严峻挑战的关键途径。聚焦高质量算力“三高三可”特征,可推动算力发展由“量”聚焦高质量算力“三高三可”特征,可推动算力发展由“量”向“质”向“质”。高质量算力以系统设计提升算效、协同驱动提升智效、全生命周期管理提升碳效、基建先行推动算力普适普惠、繁荣生态推动算力可持续发展、多元评估加速算力规范化发展为主要发展路径,可全面赋能数字经济、智能社会发展和新型科技创新。图 6 高质量算力发展路径(来源:中国信通院)3.1.1 系统设计,提升算效 以系统设计为核心,围绕生产、聚合、调度、释放算力四大关键以系统设计为核心,围绕生产、聚合、调度、释放算力四大关键环节全面提升算效。环节全面提升算效。将算力的生产、聚合、调度和释放视为一个整体,通过精心设计的系统架构和流程来优化每个环节,从而实现算力资源的有效利用和性能的最优化。在生产算力方面,提升算力输出水平。在生产算力方面,提升算力输出水平。聚拢核心部件、专用芯片、电子元器件、基础软件、应用软件等国内外产业链领先技术方案,整合高性能部件,打造多元异构的强大算力机组。在聚合算力方面,提升集群算力使用效率。在聚合算力方面,提升集群算力使用效率。运用系统工程方法,21 构建高效的算力中心集群,通过卡间和节点间的互联网络、软件和硬件的适配调优等提升集群算力效率,对大规模集群网络进行精细化设计,减少算力资源空闲度。在调度算力方面,实现算力高效调度。在调度算力方面,实现算力高效调度。通过硬件重构和软件定义对 GPU、AI 芯片等进行聚合池化,再利用先进的资源管理技术进行切分、调度、分配,提升算力资源利用率。在在释放算力方面,提升算力应用水平。释放算力方面,提升算力应用水平。聚焦于模型算法、框架、工具等方面不断优化完善,提高模型框架与底层 AI 芯片适配度,开发更加高效、易用的模型训练工具,降低用户开发大模型的算力资源开销,充分激活算力资源性能。3.1.2 协同驱动,提升智效(1)算力、算法、数据协同创新,强化算力智)算力、算法、数据协同创新,强化算力智效效水平水平 算力层面,算力层面,推动全新计算架构的创新应用,如通过数据流架构、存算一体、Chiplet 技术等改进芯片的架构、互联、封装,满足人工智能业务对算力高效率和高可靠性的需求;算法层面,算法层面,加强模型算法的研究,改进算法结构,减少冗余计算,提高算法的运行效率,推动模型算法创新,研究更高效的并行算法、更智能的任务调度处理,使算力能更灵活的适应不断变化的应用需求;数据层面,数据层面,通过加强数据清洗、创新数据合成等手段构建高质量数据集,充分激活数据要素价值,使得系统能够更好地理解和处理复杂的业务逻辑,从而提升智能化水平。(2)软硬件联合设计与优化,提升算力)软硬件联合设计与优化,提升算力 AI 业务应用水平业务应用水平 软硬件联合设计与优化的核心在于将软件算法与硬件架构紧密软硬件联合设计与优化的核心在于将软件算法与硬件架构紧密 22 结合,以实现更高效的计算性能和更智能的业务处理能力。结合,以实现更高效的计算性能和更智能的业务处理能力。一是通过软硬件协同设计消除软硬件之间的瓶颈,提高整体的算力应用水平。通过定制化的硬件设计和针对性的软件优化,提高整体系统的应用性能。例如通过专门为 AI 算法设计的硬件加速器,可以显著提高数据处理速度。二是根据特定业务需求提供定制化的解决方案,软硬件联合设计提高业务处理的灵活性和适应性。开展软硬件协同的高效微调方案研究,如结合企业专有数据进行模型微调,可使通用模型升级为企业模型,增强 AI 算力在特定应用场景和任务中的智能处理能力。3.1.3 全生命周期管理,提升碳效(1)全生命周期低碳管理,推动全产业链节能降碳)全生命周期低碳管理,推动全产业链节能降碳 一是提升算力系统可再生能源利用率,减少对化石燃料的依赖,降低碳足迹,从源头打造绿色算力体系。二是梳理供电、制冷、服务器、网络、存储等各环节碳足迹,建立绿色算力供应链,优先选择环保材料和生产过程,推动全产业链节能降碳。三是建立全生命周期低碳管理制度,在算力系统的规划设计、施工建设、运行维护直至最终退役和废弃处置的全过程充分考虑绿色发展,减少算力全生命周期的环境影响。23 图 7 全生命周期碳足迹管理探索(来源:浪潮信息)(2)采用节能低碳新技术,降低算力中心能耗采用节能低碳新技术,降低算力中心能耗 算力系统的建设、设备选型、平台运营等方面均采用绿色低碳技术,通过材料、产品、工艺创新等手段全方位降低能耗。如算力基础设施能耗主要来自于计算、制冷和配电系统,在供配电以及制冷散热方面,可通过高效的不间断电源(UPS)和电源转换设备减少电力转换过程中的能量损失、采用液冷技术提高散热效率、利用 AI 和大数据技术对算力制冷系统智能化管理,降低整体能耗。图 8 算力绿色低碳技术(来源:中国信通院)24 3.1.4 基建先行,推动算力普适普惠(1)以智算中心为建设重点,强化智算供给能力)以智算中心为建设重点,强化智算供给能力 生成式 AI 带来的智能时代需要大量增加智能算力的供给才能满足更大参数量的模型训练需求,应分层次、分类别建设布局智算中心,缓解如今智算资源紧张、算力成本高的问题。一是集中建设大规模智算集群,着重满足人工智能大模型对海量数据和复杂计算的需求,确保高效、稳定的运算服务;二是区域建设小规模算力中心,以适应不同行业和场景下的多样化计算需求,形成对大型算力节点的有力补充。如今智算中心的建设和服务市场高度竞争且不断变化,智算中心市场的参与者应重视智算中心技术研发、商业模式、服务模式和市场策略的创新,把智算中心“建好”更要“用好”。(2)积极推动算力平台建设,提升算力供需匹配能力)积极推动算力平台建设,提升算力供需匹配能力 我国算力产业存在算力市场分散、供需匹配能力不足、计算框架不同等问题,算力平台可实现对算力资源的统计、监测、匹配和分析,提升算力供给水平与资源匹配能力。算力资源需求方和提供方应积极促进算力平台的建设,以平台为依托进行供需对接,充分连接算力资源供给,实现算力的一键式订购和灵活调整,推动算力普适普惠。25 图 9 中国算力平台(来源:中国信通院)3.1.5 繁荣生态,推动算力可持续发展(1)算力技术,开放解耦)算力技术,开放解耦 算力技术应采用多元开放的架构,兼容成熟主流的软件生态,支持主流的 AI 框架、算法模型、数据处理技术、广泛的行业应用等,CPU、服务器、云操作系统、平台层、应用层等分层解耦,消除单一技术路线依赖,构建开放技术生态。算力技术的开放解耦可通过标准化、模块化的设计实现,使算力技术的各个组件能够独立发展、灵活组合,从而实现技术间的互联互通和资源共享,这种模式有助于打破传统封闭系统的限制,促进技术创新和产业融合。(2)算力产业,标准化建设)算力产业,标准化建设 建立完善的标准体系,推进不同 OS、固件、整机、芯片平台兼容、统一算力度量标准,推动低代码无代码开发平台标准化。另外,从技术、接口、设备、平台等多个维度,全面采用标准化的设计,不同层次间可通过虚拟化、API 等标准化方式对接,实现产业链整体标 26 准规范,提高技术的兼容性和设备的通用性,降低集成和迁移的成本。(3)算力生态,合作共创)算力生态,合作共创 加强交流合作,积极参与算力产业生态建设。依托行业协会、技术联盟等合作组织,加强和产业的交流合作,促进技术成熟推广,实现技术路线、目标架构、标准体系的统一,软件层、硬件层到模型层、应用层等全产业链合作共建,形成行业共识和最佳实践。另外,积极推动建构资源共享、平台共建、价值共创的产业生态。将企业个体向有机融合的产业链条聚集,促进算力上、下游产业及应用生态市场协同发展,充分发挥算力对其他相关行业的赋能价值。27 图 10 算力生态体系架构(来源:中国信通院)3.1.6 多元评估,加速算力规范化发展(1)实测性能评估指导算力建设,提升算力利用率)实测性能评估指导算力建设,提升算力利用率 算力的真实应用性能需要综合考虑计算、存储、网络以及平台软件各层协调所呈现的综合业务水平,传统算力度量常关注 IT 计算设备的单台设备理论性能,无法完全体现集群系统或者算力中心整体性 28 能。未来应以应用为导向,深入分析算力实际应用场景下的关键性能指标,通过评估真实业务性能表现,如实测性能、模算效率等,衡量算力对业务的支撑效果,引导算力提升实际利用率。(2)建立全面算力评估体系,开展算力评估评测)建立全面算力评估体系,开展算力评估评测 产业各主体积极参与面向实际应用场景下的算力系统“(小到单机大到算力中心集群)评估,完善相关技术要求和测试方法等;建立多维、全面算力评估体系,如针对算力中心的节能降耗,构建算力全生命周期节能低碳水平评价体系,推动整个产业链的绿色发展;算力相关生产者、使用者、集成者、测试者积极推动算力质量测试评估,依据测试结果不断优化技术、产品,提高新技术、新产品的广泛认可度,促进产业链成熟,规范加速算力产业高质量发展。3.2 展望 根据新质生产力发展新方向和新要求,未来数年,高质量算力在推动人工智能全面发展、加速产业升级转型等方面的价值将被持续发掘,不断激发高质量发展新动能,并深度影响社会发展、产业变革、人类生产生活。聚焦高质量算力发展,将呈现如下趋势:(1)市场环境将成为支撑我国算力产业发展的最大优势)市场环境将成为支撑我国算力产业发展的最大优势 我国拥有以人工智能、智能制造、自动驾驶等为代表的庞大应用市场,也是全球体量最大、用户最活跃的数据市场,丰富的数据量和应用场景为算力产业发展提供广阔土壤,对计算资源的需求巨大。如今国家层面高度重视算力产业的发展,将其纳入国家发展战略,各地方政府也纷纷出台相关政策,提供税收优惠、资金补贴等支持措施,29 鼓励算力产业集聚发展。在这样的背景下,算力产业正迎来前所未有的发展机遇,将迸发出蓬勃的活力与生机。(2)算力普适普惠将推动人工智能在各领域释放潜力)算力普适普惠将推动人工智能在各领域释放潜力 在人工智能、数字经济的拉动下,算力普适普惠化是大势所趋,产业生态也将逐步完善。依托完善的高质量算力基础设施,各行业将不必从零开始开发,只需结合领域数据进行调整和增量学习,即可形成具有良好精度和性能的下游应用。高质量算力的进一步普及将为AI 在医疗、教育、交通、金融等多个领域的应用提供强大的支持,推动 AI 技术更深入地融入到各行各业的业务流程中,人工智能在各个领域将展现出巨大的潜力和价值。(3)算力智能升级将推动经济社会深层次发展)算力智能升级将推动经济社会深层次发展 随着 AI 大模型等新兴技术和应用的快速发展,算力资源将加速整合,形成规模化发展,高质量算力实现对经济发展效能的放大、叠加、倍增,推动算力经济蓬勃发展。算力投入将带动制造业、工业、交通等其他行业更高的经济增长,高质量算力建设将进一步激发数据要素创新活力,加快数字产业化和产业数字化进程,加速新旧动能转化,有效改善民生,为生产端、流通端、消费端对数字化、智能化的多样化需求提供坚实保障。4 评估体系评估体系探索探索 在人工智能时代,多模态数据挖掘、智能化业务处理、海量数据分布式存储调度、人工智能模型开发、模型训练和推理服务等场景的不断涌现,对算力要求不断提高,我国算力发展开始走向了由“量”30 向“质”的重要阶段,对高质量算力的需求正日益增长。然而,只有通过精准的性能评估与测试,发现算力系统的瓶颈,才能促进算力技术创新和产品优化,不断提升算力质量发展水平。因此,本报告结合人工智能时代算力发展面临的机遇与挑战,初步提出面向人工智能的算力高质量发展评估体系。4.1 评估体系构建背景 4.1.1 评估体系构建现状 目前我国算力评估主要可分为规格算力评估和算力综合评估两大类。其中,规格算力评估主要关注硬件设备的计算性能,评估方法通常采用标准化的测试程序,对硬件设备进行基准测试,以获取其计算水平。算力综合评估通常采用多种测试方法和工具,对算力系统进行多元的性能测试和分析,由于综合考虑多个因素,评估过程相对复杂。规格算力评估和算力综合评估各有优缺点,适用于不同的应用场景和需求。(1)规格算力评估)规格算力评估 规格算力评估主要以芯片的标称算力为基准,一般可分为部件级算力评估、单机算力评估、算力中心/集群算力评估三个维度。部件级算力评估主要测试部件的规格算力,针对部件标称的算力指标进行测试,如内存的 Stream 测试软件,硬盘测试软件 IOzone 等,反映硬件设施的基本性能;单机算力评估多采用实际业务中的计算密集型业务场景作为测试负载,得到该设备的整机算力,如通用算力评测工具SPEC、CPUBench 等,只关注 IT 计算设备的单台设备性能,无法完 31 整体现集群系统性能;算力中心/集群算力评估按照通用算力中心、智算中心、超算中心分类检测,这类测试侧重于对算力系统的单一性能评价,如超算算力评测工具增较成熟的有 Linpack(集群环境下多采用 HPL 基准)等,重点呈现系统在稠密矩阵求解方面的能力。(2)算力综合评估)算力综合评估 现阶段算力综合评估一般涉及算力的多维度、多指标分析,不同的评估模型体系分析角度不同,侧重点也有一定偏差。部分评估体系侧重于算力计算能力的综合展现,针对性解决基于单一指标难以全面评估算力水平的问题。如算力五力模型综合考虑通用算力、智能算力、算效能力、存储能力、网络能力,结合双向投影法和 TOPSIS 方法对算力综合情况进行评估。部分评估体系充分响应国家政策趋势和发展需求,针对某一方面进行系统评估。如“数据中心全生命周期绿色算力指数白皮书 针对算力绿色低碳发展方面构建了数据中心全生命周期绿色算力指数体系,从安全高效性、绿色低碳性、管理智能性和全生命周期绿色管理四个维度评价数据中心的绿色算力水平。整体而言,现阶段算力综合评估重点在于检测算力单一维度的能力,无法广泛覆盖算力从建设到应用的综合性评估。4.1.2 评估体系构建建议 从规格算力评估和算力综合评估体系的指标中可以看出,算力评估指标从单点部件能力逐步过渡到更全面的系统能力,也逐渐更加响应产业发展趋势和国家政策要求。结合以往算力评估体系及当前算力需求特点,本报告认为算力评估体系应做出系列优化:32 第一,应以应用为导向,增加实际业务性能指标检测。第一,应以应用为导向,增加实际业务性能指标检测。规格算力并不能准确反映实际计算能力,因为算力的发挥需要算力系统各个部件的协作,任何性能上的薄弱环节都会对整个计算系统产生影响。另外,虽然理论算效衡量方式较为简洁,但不能完整反映真实的网络、存储等系统能力。人工智能时代的高质量算力如何进行评估,对应的标准体系如何建立,需充分考虑应用实际情况,因此应增加实测性能指标直观地反映计算系统在特定作业上的、用户可获得的计算能力。第二,应聚焦人工智能,强化第二,应聚焦人工智能,强化 AI 业务支撑能力评估。业务支撑能力评估。人工智能驱动算力走向“重应用”阶段,算力加速向政务、工业、交通、医疗等各行各业渗透,成为传统产业智能化改造和数字化转型的重要支点,提升算力在垂直行业领域的智能支撑水平是未来算力高质量发展的重要着力点。对于算力质量的评估应聚焦算力在 AI 业务中的性能表现,为人工智能时代下算力高质量发展提供指导。第三,应全面节能降碳,注重全生命周期碳足迹管理。第三,应全面节能降碳,注重全生命周期碳足迹管理。PUE 及耗电量通常被认为是算力绿色评估的核心指标,如 2020 年底全国数据中心平均 PUE 为 1.62,总耗电量为 939 亿 kWh,2023 年底平均 PUE和总耗电量分别为 1.48 和 1500 亿 kWh。算力产业耗电量急剧增加,但 PUE 优化空间不断缩小,单纯从 PUE 角度进行评估优化已无法适应算力产业的绿色发展需求。因此,应从全生命周期角度对算力碳足迹进行优化管理,评估算力从采购、设计到运营、回收等全产业链的节能降碳水平,响应国家双碳目标。第四,应以系统为核心,算力设施与算力资源利用整合评估。第四,应以系统为核心,算力设施与算力资源利用整合评估。从 33 评估体系现状可以看出,现有评估体系多是以上架率、PUE、WUE 等指标为主,无法综合反映算力资源应用时的系统性能。以上架率为例,据中国信通院统计,2023 年底全国在用数据中心上架率为 66.7%,该指标通过简单的计算就可以得出当前全国算力资源的利用情况,然而上架率主要关注物理层面的资源占用情况,如机架空间、电源插座等,忽略了服务器的实际性能和负载情况。如果数据中心的服务器配置不合理或存在大量闲置资源,即使上架率很高也可能无法满足实际业务需求。因此,算力评估指标方面应将算力基础设施和算力资源利用情况统一考量,注重算效水平、智效水平、碳效水平等效率的综合评估,弥补现有评估体系过于注重算力单一方面性能指标的缺点,满足日益复杂多元的算力应用需求。4.2 评估体系构建原则 结合评估体系构建现状和建议,本报告在此基础上,致力于构建全面、实用的算力质量评估体系,客观评价算力质量发展水平,尝试提出高质量算力评估体系。评估体系评估对象主要为算力系统,在评价指标的筛选上强调以下六个原则:一是导向性原则,一是导向性原则,确保评估指标与政策目标和区域发展需求保持一致;二是系统性原则,二是系统性原则,要求评估体系全面覆盖高质量算力的关键特征,确保评价结果能够全面反映算力质量;三是针对性原则,三是针对性原则,强调选择与高质量算力特征紧密相关的指标,使评估更具针对性和准确性;四是全面性原则,四是全面性原则,确保评估体系综合考虑数据的可获取性和量化的可行性,以实现全面、高效的评价;五是可操作性原则,五是可操作性原则,要求评估体系 34 的设计既要理论合理,也要实际可行;六是可拓展性原则,六是可拓展性原则,要求评估体系具备适应未来技术迭代和政策变化的能力。这些原则共同确保高质量算力评估体系既符合当前需求,又能够灵活适应未来的发展。4.3 评估体系构建实践 4.3.1 评估体系 根据建立评估体系系统性、全面性等原则,征求专家意见,梳理高质量算力内涵、特征及关键影响因素,从算效水平、智效水平、碳效水平、可获得水平、可持续水平 5 个维度形成“五位一体”高质量算力评估体系,指标包括理论算效、实测性能、模算效率等 12 个指标。图 11“五位一体”高质量算力评估体系(来源:中国信通院)4.3.2 算效水平 算效水平主要通过理论算效、实测性能、资源利用率三大指标评算效水平主要通过理论算效、实测性能、资源利用率三大指标评估,反映实测计算性能估,反映实测计算性能和和算力资源利用率算力资源利用率。(1)理论算效:)理论算效:理论算效(CE)是算力(CP)与所有 IT 设备功耗的增值。数值越大,代表单位功率的算力越强,效能越高。计算 35 公式为:CE=CP/IT。理论算效的单位为 FLOPS/W,即单位功率的算力。提升算效可以同时降低 IT 设备本身的运行成本和制冷设备的运行成本,从而降低算力系统整体供电负担,降低整体的能耗。根据理论算效公式,可以通过提升算力输出或者降低能耗来提升算效。(2)实测性能:)实测性能:实测性能反映算力系统对特定 AI 业务的处理能力。将代表性 AI 应用负载的实测性能综合起来,最终得出算力系统的综合实测计算能力,通过几何加权平均的方式获得具体数值,有助于进行定量、对增性分析。通过实测性能评估可准确了解算力系统在实际运行中的性能表现,避免仅依赖理论计算或模拟结果导致的偏差。(3)资源利用率:)资源利用率:通过算力系统实际运行过程中的平均资源利用率来综合评估。如可通过 IT 负载率或 GPU 平均利用率来衡量。IT负载率可以反映算力系统 IT 设备的有效工作效率,是服务器总实际功率与总额定功率的增值,从设备层面衡量服务器的利用水平。GPU平均利用率可以确保 GPU 资源得到充分利用,减少额外的硬件投资需求,降低运营成本。4.3.3 智效水平 智效水平主要评估算力智效水平主要评估算力系统系统的人工智能业务支撑能力,体现在能的人工智能业务支撑能力,体现在能根据根据 AI 业务的需求业务的需求实现实现灵活自主、智能化的灵活自主、智能化的高效处理高效处理。通过模算效。通过模算效率率和智能化程度和智能化程度两大指标评估。两大指标评估。(1)模算效率:)模算效率:模算效率正增于模型精度与模型的计算效率,模型本身精度越高、在对应软件上对硬件性能利用率越高、推理及训练所需算力越小,模算效率越高。模算效率评测对象是大模型训练和 36 推理的整机系统,包括模型本身、软件框架、算力底座,用于反映被测试模型在硬件和软件框架下的系统性能。(2)智能化程度智能化程度:通过算力系统自动化水平和智能优化能力来评估。自动化水平衡量算力系统在任务调度、资源分配、故障恢复等方面的自动化程度。高自动化程度意味着算力系统能够减少人工干预,提高运维效率。智能优化能力衡量算力系统是否具备根据实时负载和性能数据进行自我优化的能力。具备智能优化能力的算力系统能够更好地适应业务变化,提高整体性能和效率。4.3.4 碳效水平 碳效水平追求最低碳排放情况下的最大化算力输出,主要通过全碳效水平追求最低碳排放情况下的最大化算力输出,主要通过全生命周期低碳管理能力和算力碳效两大指标来评估。生命周期低碳管理能力和算力碳效两大指标来评估。(1)全生命周期低碳管理:)全生命周期低碳管理:主要从算力的采购、设计、建设、运营、回收等全生命周期角度评估算力的低碳性。可通过算力系统碳足迹和全生命周期绿色发展战略来评估。算力系统碳足迹是指算力系统全生命周期过程中产生的温室气体排放总量,反映算力系统在整个生命周期中的环境影响程度。全生命周期绿色发展战略意味着算力系统的采购、设计、建设、运行维护直至最终退役和回收的全过程都要充分考虑绿色发展,保障全产业链节能减排。(2)算力碳效:)算力碳效:是兼顾算力 IT 设备的碳排放量和算力性能的综合指标,指设备使用周期内产生的碳排放与所提供的算力性能的增值。最新发布的数据中心绿色低碳发展专项行动计划提出到 2030 年底,全国数据中心单位算力碳效达到国际先进水平,未来算力碳效或 37 将成为算力系统设备设计、选型的重要指标。4.3.5 可获得水平 可获得水平考察算力是否能够满足普适应用需求和普惠使用成可获得水平考察算力是否能够满足普适应用需求和普惠使用成本要求。主要通过普适能力和普惠能力两大指标综合评估。本要求。主要通过普适能力和普惠能力两大指标综合评估。(1)普适能力:)普适能力:主要考量算力对多样化应用场景的广泛支撑能力,可根据内部业务支持、区域业务支持、全国范围内业务支持能力来分级评估。应用门槛低、使用灵活的普适算力有助于满足不同行业和领域的多样化算力需求,推动人工智能、大数据、物联网等技术与实体经济的深度融合。(2)普惠能力:)普惠能力:主要考量算力是否满足各行各业低成本使用需求,通过算力的市场价格优势进行综合评估。主要进行成本效益分析和定价策略分析,对增算力提供者的服务价格与其竞争对手的价格,评估其性价增。4.3.6 可持续水平 可持续水平考察算力可持续水平考察算力系统系统技术兼容、供应链完备、产业生态开放技术兼容、供应链完备、产业生态开放的的程度程度。通过技术兼容性、供应链完备程度、产业生态开放水平三大。通过技术兼容性、供应链完备程度、产业生态开放水平三大指标评估。指标评估。(1)技术兼容性:)技术兼容性:通过模拟实际应用场景,对算力系统进行兼容性测试,以验证其在协同工作时的稳定性和性能表现,进行分级评估。评估算力系统技术兼容性有利于确保不同系统、设备和应用之间能够高效地交互和协作,从而提升整体性能和用户体验。(2)供应链完备程度:)供应链完备程度:评估供应链中供应商的数量和质量,包 38 括供应商的稳定性、交货能力、质量控制等方面;评估合作伙伴数量与质量,如是否拥有广泛的合作伙伴网络,包括硬件供应商、软件开发商、服务提供商等。(3)产业生态开放水平:)产业生态开放水平:分析算力系统的标准化建设程度,如采用的技术标准是否与行业主流标准兼容。另外评估算力系统是否构建开放的平台生态系统等。产业生态开放有助于确保不同厂商的设备和技术能够无缝集成和协同工作。表 4 高质量算力评估体系指标说明 评估评估 维度维度 评估评估 指标指标 指标描述指标描述 算效水平算效水平 理论算效 算力系统中算力与所有 IT 设备功耗的增值,即“IT设备每瓦功耗所产生的算力”。实测性能 将 AI 应用负载的实测性能综合起来,加权平均,最终得出算力系统的综合实测计算能力。资源利用率 算力系统实际运行过程中的平均资源利用率,如 IT负载率、GPU 平均利用率。智效水平智效水平 模算效率 模算效率正增于模型精度与模型的计算效率,模型本身精度越高、在对应软件上对硬件性能利用率越高、推理及训练所需算力越小,模算效率越高。智能化程度 通过算力系统自动化水平和智能优化能力来评估。碳效水平碳效水平 全生命周期低碳管理 通过算力系统碳足迹和全生命周期绿色发展战略来综合评估。算力碳效 IT 设备使用周期内产生的碳排放与所提供的算力性能的增值。可获得水平可获得水平 普适能力 根据内部业务支持、区域业务支持、全国范围内业务支持能力来分级评估。普惠能力 综合评估算力系统市场价格优势。可持续水平可持续水平 技术兼容性 通过模拟实际应用场景,对设备和系统进行兼容性测试。供应链完备程度 评估供应链中供应商的数量和质量、合作伙伴数量和质量。产业生态开放水平 评估标准化建设程度及开放平台系统建设情况。(来源:中国信通院)39 4.4 评估体系构建意义“五位一体”高质量算力评估体系规范加速我国算力产业高质量“五位一体”高质量算力评估体系规范加速我国算力产业高质量发展。发展。在算力产业由“量”向“质”的关键阶段,算力发展面临大规模、高要求、异构化等多重挑战,如何准确评估算力的质量是算力建设者和使用者同时面临的问题,从算效水平、智效水平、碳效水平、可持续水平、可获得水平五个方面构建完整、准确的高质量算力评估体系,可规范加速算力产业高质量发展。从算效水平上,提升算力资源利用率和实测计算性能;从智效水平上,提升算力人工智能业务支撑能力;从碳效水平上,促进算力全生命周期节能降碳;从可获得水平上,推动算力应用普适普惠;从可持续水平上,促进算力技术、产业、生态良性发展。“五位一体”高质量算力评估体系为我国算力产业的技术创新与“五位一体”高质量算力评估体系为我国算力产业的技术创新与基础设施建设提供指引。基础设施建设提供指引。该评估体系涵盖算效、智效、碳效、可获得、可持续等算力系统建设运营关键因素,多维度客观评估我国算力质量情况。通过评估标准的建立,可帮助企业用户识别和优化资源配置,提高算力资源的使用效率,并且可激励企业进行技术研发和创新,以满足更高的评估标准,从而推动整个行业的技术进步。在算力相关项目的规划期、建设期、运营期等不同阶段,该评估体系可为算力实现高质量、全生命周期可持续发展提供指导,推动算力产业的标准化进程,为行业的长远发展奠定基础。4.5 评估体系应用建议(1)加快配套标准及工具研制,推动评估体系落地实施)加快配套标准及工具研制,推动评估体系落地实施 40 评估体系配套标准及工具的研制和使用是评估体系有效实施的关键,保障评估体系落地过程中有标准可依,有数据可查。完备的工具能够支持并辅助被测系统执行标准所规定的测试流程,确保测试实现公正性审核、过程监控、结果收集与管理发布。另外,在高质量算力评估体系使用过程中要健全算力指标数据采集及监测制度,明确数据采集测试的边界、内容、方法和时限,推动评估体系的落地应用。(2)开展典型应用场景评估测试,并拓展理论技术研究)开展典型应用场景评估测试,并拓展理论技术研究 高质量算力评估体系仍处于建设初期,存在巨大的发展空间,可在人工智能典型应用场景下开展先行先试,以评估结果作为产业高质量发展改进依据。另外,应在服务器等关键部件设计、制造、运行等各环节开展技术研究,丰富不同架构(X86、ARM 等)、不同业务场景下算力算效、算力智效、算力碳效的模型构建和测试分析方法,在理论上为算力产业高质量发展奠基。(3)评估算力质量相对水平,探索算力高质量发展新模式)评估算力质量相对水平,探索算力高质量发展新模式 高质量算力评估体系将参照业界算力相关评价规范,将算力高质量发展情况进行综合性分级,不同级别代表不同的算力高质量发展程度,直观反映高质量算力先进性。可将评估体系作为人工智能算力基础设施企业实现高水平、可持续发展的指南,并探索算力高质量发展挂钩贷款等新发展模式。如金融机构与政府合作建立算力高质量发展的监测和评估体系,引导算力行业朝着高算效、高智效、高碳效、可获得、可持续的高质量发展方向前进。(4)引导算力相关方积极参与,扩大评估结果影响力)引导算力相关方积极参与,扩大评估结果影响力 41 在相关机构的指导下,以权威第三方机构为主导,联合产业生产者、使用者、集成者、测试者等诸多参与方,组成测试工作组进行专题运作,加强人工智能高质量算力评估体系的应用推广。积极构建评价考核体系和应用结果奖励机制,引导社会资源、人力资源、债权资金、股权资金的持续投入。42
从快速致胜到持续增长成功渡过生成式AI发展转折点目录关于本指南03资源5704前言(由 Oliver Parker 撰写)05价值框架:如何优化生成式 AI 投资组合13可立竿见影创造业务价值的快速致胜方式47助力实现持续增长的最佳实践关于本指南Google 在搜索、数据库、硬件和 AI 领域积累了 20 余年的丰富内部研发经验。根据这些经验,我们总结出了一些生成式 AI 最佳实践,汇编成这份指南。其中不仅有 Google 顶尖 AI 专家的专业建议,还有 Google 主导的最新客户数据分析及第三方研究成果,可帮助组织领导者了解常见生成式 AI 用例在短期、中期和长期的价值杠杆。第一部分将概述一个简单的框架,用于评估生成式 AI 用例的风险与回报。高管层可以根据该框架,选择合适的用例组合来实现更多价值,所需时间预计为 6 个月至 3 年以上不等。第二部分将列出一些可立竿见影地创造业务价值的热门生成式 AI 用例,并分享 The Este Lauder Companies Inc.、Forbes、GA Telesis、GE Appliances 和 Turing 等全球组织的 C 级高管的见解。您可以借鉴他们的经验之谈,了解如何通过这些用例收获切实的业务成效。第三部分将分享四条最佳实践,有助于您找准入手点。03前言Oliver Parker-Google Cloud 全球生成式 AI GTM 副总裁身处生成式 AI 时代,企业领导者面临着棘手的挑战:如何带领企业穿越喧嚣,将生成式 AI 的价值落到实处。生成式 AI 的价值我们发现许多客户利用生成式 AI 取得了出色的成果,尤其是在以下三个关键领域。第一,提高知识工作者和开发者的效率。第二,提供更个性化、更具互动性的客户体验。第三,让许多后台流程实现自动化。例如,在工作效率方面,Turing 正积极推进软件开发流程的自动化,将开发者的效率提高了 30%以上。全球数百万公司员工正使用 Gemini for Google Workspace 更高效地完成工作。为了提升客户体验,Victorias Secret 正使用生成式 AI 来打造个性化的虚拟购物体验。在自动化方面,GA Telesis 正使用依托生成式 AI 技术的数据提取解决方案,自动合成采购订单并快速生成客户报价。正如这些例子所展现的,尝鲜者已开始看到价值,您也可以。我们面临的挑战是如何在投资时兼顾当下与未来。虽然突破性的创新让人向往,也是长远发展的必经之途;但我们需要脚踏实地,先聚焦于一些快速致胜的方法,将实实在在的价值收入囊中。问题是,该从哪里入手呢?04第 1 章价值框架:如何优化生成式 AI 投资组合0580的企业领导者表示,生成式 AI“将会提高收入”。11Salesforce,“New research:Over half of workers say generative AI will help advance their career,but most lack the skills”(新研究:超过半数的员工表示,生成式 AI 将有助于他们的职业发展,但大多数人缺乏相关技能),2023 年 7 月领导者和管理团队可以将这一框架作为切入点,了解如何以批判性思维看待生成式 AI 用例的短期/长期回报及复杂性。如果想打造最适合自家组织的生成式 AI 投资组合,领导者应遵循建立传统投资组合的原则,即一开始先构建业务用例。应仔细权衡风险与回报,考虑具有可衡量目标的独立里程碑,以评估组织近期和未来取得的成效。投资于全组织范围的生成式 AI 转型计划对取得长期成功至关重要。这些转型创新计划可以带来丰厚回报,例如开辟新的收入来源、增加市场份额以及建立全新的工作方式。不过,这些计划需要一段时间才能在整个企业落实,届时其成效提升可能会从渐进式转变为变革式。要在公司全面推进生成式 AI 转型,可能需要 3 年或更长时间。同时,组织可通过快速致胜方法,在短期内实现渐进式成效提升,甚至有望在实施的第一年就获得超过投资成本的收益。07价值低高高实现时间、复杂性和风险08快速致胜方法(6-12 个月)企业级智能(1-2 年)变革性创新(3 年以上)这个简单的框架可以帮助企业领导者根据潜在价值与部署风险对用例进行分类,从而为组织制定最佳的生成式 AI 路线图:生成式 AI 用例的 3 种价值分类快速致胜方法组织首先可以投资于常见的生成式 AI 用例,这样可以最大限度地降低风险,并有助于快速带来可衡量的回报。这个阶段的关注重点是可以提高效率的现行员工流程、可以降低运营成本的业务流程,或者可以受益于自助服务或深度个性化的现有客户流程。通常情况下,快速致胜方法可提升当前职能部门的效率或产出,立竿见影地体现出价值。它们可以作为生成式 AI 解决方案的“概念验证”,在不给关键业务运营带来巨大风险的情况下,有针对性地提高业务绩效。时间范围风险等级目标6-12 个月低提高员工工作效率,改进流程、资产和人员的成本效益09企业级智能从中期来看,能够在所有团队和流程中提高业务价值的快速致胜方法可以在内部推广。领导者可以组建焦点小组,在妥善管控风险的情况下,测试生成式 AI 在对外应用中的用例,以收集客户和用户反馈意见,并为需要较长时间才能带来实质回报的大型计划奠定基础。时间范围风险等级目标1-2 年低至中提高效率、加快上市速度、缩短数据分析时间、改善用户体验10变革性创新在前两个阶段所积累的资金和专业知识的基础上,企业领导者可以将生成式 AI 加速投入可创造竞争优势且目前还不存在的创新性用例。其中许多将定义下一代人机交互,如新的设备规格和新兴用例中的生成式 AI 体验。领导者应将重点放在善用公司资源,以及快速致胜方法创造的内部资本(如节省成本、提高效率和增强技能),达成业务拓展战略目标。这可能包括找出并锁定生成式 AI 用例最有机会为买家创造价值并取得竞争优势的小众市场、细分客户群或地域。时间范围风险等级目标3 年以上中至高业务增长(如收入增加、转化率提高、推出新产品或服务)11“成功有什么秘诀?现如今掌握了先发优势的企业多年来一直在迭代、试验和构建自己的生成式 AI 解决方案。”12Carrie Tharp-Google Cloud 副总裁第 2 章快速致胜方法即刻创造业务价值,赢在当下1333的高管已在积极使用生成式 AI,并预计它会“成为企业实现未来愿景的关键要素”2。2Google Cloud,“The state of generative AI adoption survey”(生成式 AI 应用现状调查),2023 年 10 月当今最优的生成式 AI 投资策略通常并不吸引眼球。相反,它们专注于改善现有流程、减少无谓的重复劳动和繁琐工作,以及增强开发者的实验能力。如果企业想在短期内获得切实的业务效益,关键是找出快速致胜方法,也就是能在最短时间内创造价值的低风险用例。15快速致胜方法的业务价值使用 Google AI 时,客户最常受益于工作效率的提高、业务的增长、客户体验的改善,以及成本效率的提升3。可持续性成本效益业务增长用户体验安全性3.8.1.0%受访者回答的百分比(%)12.1%5.1%工作效率52.917要想通过快速致胜方法创造价值,组织可以从三个关键领域入手。010203提高知识工作者和开发者的效率提供个性化的客户体验,改进互动方式实现后台流程和工作流程自动化18提高知识工作者和开发者的效率01开发者效率生成式 AI 可辅助代码开发、简化 DevOps 和自动执行非编码流程,帮助提高开发者效率。生成式 AI 可帮助软件工程师将代码开发速度提高 35-45%4快速致胜方法 119详细了解生成式 AI 如何提高开发者的工作效率。简化 DevOps自动执行非编码流程用?监控软件性能并调查问?总结并帮助修复安全发现结果用?使用 Enterprise Search 提高代码可发现?通过开发者聊天机器人,提供相关法规和业务信息,简化合规流程价?提高开发者的开发速?加速初始配置价?加快上市速?降低开发成?提高开发者效率快速致胜方法 120生成式 AI 可以对开发者效率产生立竿见影的影响。改进并加速代码开发用?自动执行开发者日常任?用自然语言解释代?提出测试方案建议并检测错?提供代码许可出处价?提高代码质?腾出时间处理具有战略性的工作010203我们对 Gemini Code Assist 的使用初体验非常满意,工作效率提高了约 33%。我们正在尝试索引编制和调试等新功能,希望它们能进一步帮我们提高工作效率。”Turing21观看此视频,了解 Turing 如何利用 Gemini for Workspace 将开发者的工作效率提高 30%以上。Kai Du-Turing 工程总监客户成效亮点Pfizer22了解详情Guy Delp-Pfizer 全球信息安全副总裁对于 Gemini 显著提升团队效率的潜力,我们倍感兴奋。只需用自然语言就能执行复杂的分析,这让新手分析师能更快上手,而经验丰富的分析师则能迅速在我们复杂的环境中快速追踪高级威胁。”客户成效亮点Jiva23客户成效亮点为帮助印度尼西亚和印度小农提升利润,Jiva 利用 Vertex AI 开发了一款应用,使用计算机视觉和图像处理技术找出作物病害及其原因,然后为缺乏相关知识的传统农民提供治疗措施建议。这款应用帮助农民提高作物产量达 50%,减少农业投入达 15%,最终增加利润率达 25%。Jiva 正是在 Google Cloud 的帮助下,将代码提交时间缩短至 15 分钟,大幅加快部署到生产环境的速度,才能创造如此出色的成果。有了 Google Cloud,我们不必扩大团队规模,就能覆盖更多地区。这就意味着,我们能够把钱花在刀刃上,为更多农民提供所必需的服务,并确保利润都能直接回馈给农民。”24Seamus Tardif-Jiva 业务发展负责人暨创始团队成员在营销中运用生成式 AI虽然营销的基本要素没变,但生成式 AI 现在能帮助以前所未有的规模提升创造力、生产力和影响力。5-15%生成式 AI 通过提高营销效率产生的财务影响5快速致胜方法 225个性化和媒体成效分析洞见与效果衡量用?网站内?品牌和效果导向型广告系?基于提示和机器学习技术,对客户群进行细分用?数据洞见和分?对话分析洞?流程助?客户服务聊天机器人价?提高客户转化?提升投资回报率/广告支出回报?提高客户忠诚度价?提高效?加速上?降低成本26生成式 AI 可以对营销产生立竿见影的影响。广告素材和内容制作用?文本到文本/图片?多渠道营销?网站素材资源/产品说明?本地化和翻?撰写创意简报价?更快实现价?增强广告素材制作方面的能力?加速渠道拓展010203快速致胜方法 2The Este Lauder Companies Inc.使用 驱动其 Este Lauder Language Assistant(ELLA)。这是一款供该品牌的管理层随时使用的内部生成式 AI 工具,可协助他们探索各种不同的应用场景,包括翻译、生成广告文案、总结会议要点等。Gemini 1.0 ProEste Lauder Companies Inc.27有了 ELLA,The Este Lauder Companies Inc.能够通过利益相关方的行动和直接反馈,确定哪些因素能够真正推动价值的实现。客户成效亮点了解详情Gemini 1.0 Pro28提供个性化的客户体验,改进互动方式02客户服务和销售现代化改造生成式 AI 在改善客户体验、提高运营效率和成本效益方面潜力巨大。在不同的互动渠道中,它都可提高客服和员工的工作效率、自助服务效率和解决率。 86%:利用 Google Cloud Contact Center AI,可将北美地区的收入提高 86%5 30-45%:在客服部门使用生成式 AI,可将工作效率提高 30-45%6-50%:利用生成式 AI,最多可将人工服务任务量减少 50%5快速致胜方法 129提高自助服务效率和解决率实现聊天和语音基础设施现代化改造增强洞察力和客户预测能力用?依托 AI 技术的虚拟客服提供全天候自助服务,能在不同对话主题之间流畅切换并处理补充问题,让客户更快地获得回?根据客户意图,改变内容生成方?利用多模态(文本和语音)增强对话体验用?智能潜在客户转?自动从自助服务渠道转接到人工客服,让人工客服能够通过高质量的回答,更快地解决客户问题用?衡量客户服务响应和质量指?通过客户细分实现 VIP 转送?全面了解客户,提供更加个性化的回?从高效客服互动中了解客户遇到的问题,然后根据集中式知识库提供建议回答价?借助 Google Cloud Contact Center AI 的 Dialogflow,客户放弃率最高可降低 50%?利用 Google Cloud Contact Center AI,可自动处理 60%与卖家无关的来电6价?通过采用 Google Cloud Contact Center AI 的智能潜在客户转送,转化率提高了 143%6价?一家全球大型电信公司在实施 CCAI Insights 的第一年内,共节省了 550 万美元。通过提高数字自助服务解决率和减少重复呼叫,大幅节省成本。30生成式 AI 可以对客户服务和销售产生立竿见影的影响。提高客服和员工的工作效率用?基于内部数据的知识助?汇总通话记录或电子邮?跨渠道连接客户体?实时转写(附带多语言翻译?智能回复和客服辅?建立内部客户服务(如内部服务台)价?使用 Google Cloud Contact Center AI 的 Agent Assist 后,每位客服处理的呼叫量增加了 28p1020304快速致胜方法 1Victorias Secret&Co.31Victorias Secret&Co.正利用 Google Cloud 的 AI 和生成式 AI 技术,为其全球客户大规模打造更加个性化、更具包容性的在线购物体验。该品牌正在探索一款与 Vertex AI 合作打造的依托生成式 AI 技术的全新对话型助理,根据买家的个人喜好和生活经历,为其提供量身定制的产品推荐和实用建议。无论客户是运动爱好者、哺乳期妈妈、乳腺癌切除术后的恢复者,还是单纯想买一件新文胸,都能通过这项助理服务满足需求。客户成效亮点生成式 AI 以极快的速度掀起变革之潮。为此,我们的做法是专注于构建最简可行产品,从反馈中学习,并不断前进。我们选择从客户体验入手,因为作为一个团队,我们知道这方面该怎么做才能做好。我告诉我的团队,在前进的过程中,最重要的是不断进步、学习并随时调整。”32Murali Sundarajan-Victorias Secret&Co.首席信息官GE Appliances33GE Appliances 与 Google Cloud 合作,利用其生成式 AI 帮助客户排查各种问题,同时更有效地利用自家电器产品。消费者只需向 SmartHQ 助手提出与已注册的联网电器相关的问题,它就会迅速给出答案(如滤芯更换建议、清洁提示)。客户成效亮点了解详情结合机器学习算法、机械车间知识和联网电器信息,我们得以打造出真正定制的集成式烹饪体验,远远优于工业专家或 AI 专家独立开发的效果。”34Kevin Nolan-GE Appliances 首席执行官在电子商务中运用生成式 AI如今,大多数消费者都希望从品牌方那里获得顺畅的个性化全渠道体验。同时,零售商也正努力应对不断攀升的经济压力和市场需求。由于行业比以往任何时候都需要更高的灵活性和运营效率,62%的零售和消费品行业高管有意采用生成式 AI 来制作产品摘要和营销内容,也就不足为奇了。8快速致胜方法 235对话式商务用?打造富有吸引力的个性化购物体验?帮助客户做出明智的购买决策价?增进互?增加购物车内商品数?提升忠诚?减少退货36生成式 AI 可以对电子商务产生立竿见影的影响。丰富目录和内容用?生成产品内容?利用聊天机器人加速运营价?减少手动任务花费的时?改善员工体?加快发布速?降低创意开发成?降低退货率0102快速致胜方法 2Forbes37Forbes 近期宣布推出 Beta 版 Adelaide。这是其专门打造的新闻搜索工具,可为访问者提供依托 AI 技术的个性化推荐,以及来自 Forbes 可信新闻报道的见解。Adelaide 提供搜索式和对话式服务,让 Forbes 的全球受众可以更轻松、更直观地发现内容。该工具专门根据 Forbes 的文章,针对用户的问题生成个性化的回答。客户成效亮点了解详情ForbesTM 旗下产品依托 AI 技术的分析洞见:你专属的 FORBES 资讯指南我想详细了解示例提示出于安全考虑,哪款豪华车最值得购买?Tesla 的业绩怎么样?AI 的未来发展方向是什么?Beta 版展望未来,我们要让受众群更好地了解 AI 如何成为有益的工具,并改善他们的生活。Adelaide 将彻底改变 Forbes 受众群接触新闻和媒体内容的方式,全程提供更加个性化、更具洞察力的体验。”38Vadim Supitskiy-Forbes 首席数字与信息官39如何入手就数字商务体验和关键用例的目标达成一致咨询 Google Cloud Consulting 团队或经认证的 Google Cloud 合作伙伴审核参考架构和实现核对清单激活 Google Cloud 合作伙伴或 Google Cloud Consulting 服务包,简化实现过程快速致胜方法 240实现后台流程自动化03面向未来的企业后台生成式 AI 极具发展潜力,能通过简化和/或自动执行复杂任务来提高员工的产出,从而为所有部门和行业的工作带来革命性的转变。只要组织把握这一转型机遇,凝聚员工向心力,而不是忽视员工,就能获得极大的益处;数据显示,提供了最佳员工体验的组织,其收入增速比其他组织高出 31%。9快速致胜方法 14142快速致胜方法 1各行业的工作时间中有 40%可利用大语言模型(LLM)提升效率1087%的高管预计生成式 AI 将增强(而非取代)现有岗位1140C从 6 个后台应用入手,与生成式 AI 集成采购合同管理旅行预订HR 帮助台销售与营销合规流程应付账款帮助降低赔偿风险、改进条款并降低供应链风险让员工以自然语言预订差旅行程,提升使用体验通过自助服务机器人,降低 HR 团队成本利用依托 AI 技术的辅助功能,增加销售机会可改进合规和风险流程的文件搜索效率/召回率可提高跨系统采购时应付账款账单/采购订单匹配的准确率010402050306快速致胜方法 1以一对一方式快速响应客户要求是我们业务的重要组成部分,也是我们独有的关键优势。随着业务发展,服务和零件相关查询的数量成倍增加,因此我们必须设法提高响应速度,同时不影响我们提供的个性化服务。Google Cloud 的生成式 AI 解决方案的准确性和 Vertex AI Platform 的实用性让我们信心十足地在业务核心领域实施这项尖端技术,并实现了我们的零分钟响应时间这一长期目标。GA Telesis44Abdol Moabery-GA Telesis 首席执行官客户成效亮点了解详情Culture Amp45客户成效亮点员工体验平台 Culture Amp 正在显著加快客户大规模响应员工反馈的速度,同时保护员工不受偏见和隐私问题影响。Culture Amp 使用 Vertex Al 对其生成式 Al 功能进行训练、建模和微调。其首个用例是将多达数十万条员工问卷调查意见归纳为不同的主题,并生成富有实用价值的分析洞见。这项工作通常需要中大型企业人力资源专员花费数百小时才能完成,但有了该平台,就能自动处理这一流程。美好工作,从此开始登录46借助 Vertex AI 提供的训练和建模功能,我们可以确保此类解决方案能够带来更直观、响应更迅捷的员工体验,同时不会浪费人力资源部门在复杂员工事务方面的专长,也不会破坏员工对雇主的信任。”Doug English Culture Amp 联合创始人兼首席技术官第 3 章助力实现持续增长的最佳实践47H的领导者正积极测试生成式 AI,并预计它能产生持续的价值2。2Google Cloud,“The state of generative AI adoption survey”(生成式 AI 应用现状调查),2023 年 10 月 49精益求精,专注提升现有能力。组织可以聚焦现有流程和能力的优化,提升在这些方面的效率、效力和生产力,从而实现持续增长。这样做不但能释放资源,还能打牢基础,让组织未来能更快地推动大规模生成式 AI 转型。如果您还未确定自己的用例,就不要组建相关的内部生成式 AI MLOps 平台团队。若要对优先事项严加取舍,则应在面向公众推出聊天机器人前,先开发出一些内部版本。举例来说,现阶段最适合推进的项目就是升级内部知识库,让员工能通过专门微调的模型获得数据和流程问题的相关答案。构建这类内部 AI 智能体才是组织首先该做的事。”Richard Seroter-Google Cloud 首席技术布道师兼开发者关系总监最佳实践 150最佳实践 2提升人才素质、培养团队技能,从而加快技术普及。将资源投入员工知识传授、入职培训及技能提升,能带来相当可观的价值,但往往不受组织重视。有了生成式 AI,原本埋头苦干的员工可以先行搜寻有用信息,做到事半功倍。比方说,常因文书工作而难以专心处理其他工作的职务,就非常适合使用生成式 AI。假如人力资源部门的所有员工都在处理文书工作,将无暇提供相关培训,引导员工培养所需技能,进而推动整个组织采用生成式 AI。这时,利用 AI 减少文书工作负担,就能让人力资源专员有更多时间帮助员工逐渐提高工作效率,更乐意投入工作。”Carrie Tharp-Google Cloud 副总裁51最佳实践 3积极探寻前瞻性指标。务必注意衡量方面的挑战。即使是在生成式 AI 相比现有实践有明显优势的领域,可能也难以通过量化指标来衡量提升幅度。在生成式 AI 采用之初,重要的是寻找先行指标来衡量其影响,而不是期待这项技术能立即提升效率或利润。例如,组织部署代码生成功能后,首先提升的通常是开发者满意度,接着才是各项效率指标。或者,使用生成式 AI 聊天机器人在漏斗上端改善客户信任和忠诚度后,可能需要过一段时间才能看到销售额和收入有所增长。衡量整个流程中的收益确实很难。领导层往往更看重易于衡量的漏斗下端指标。例如,对于采用薄利多销模式的零售商来说,获得客户信任并吸引他们转向高利润产品,本来就是较长的价值实现路径,相关成效衡量也因此更复杂。”Carrie Tharp-Google Cloud 副总裁52最佳实践 4做好长远规划,切忌浅尝辄止。快速致胜的方法虽能创造价值,但再先进的技术迟早也会普及。若不持续进步,取得的成果也难以久持。目前,在媒体领域,许多生成式 AI 用例可能涉及视频摘要、推荐视频、搜索特定视频片段等,但未来的用例可能不仅是分析或查找现有内容,还会根据观看习惯或要求,即时生成定制化内容。五年前,在线媒体服务可凭借优质的推荐算法脱颖而出。如今,这已成为消费者对所有在线媒体服务的基本要求。”Carrie Tharp-Google Cloud 副总裁为何要借助 Google Cloud 实现生成式 AI十多年来,我们一直运用 AI,力图从根本上提升 Google 产品和服务的实用性。我们的内部 AI 研究一直走在 AI 领域的前沿,帮助开发了生成式 AI 和众多 AI 技术,为每天服务于数十亿人的核心产品提供支持。得益于这一坚实的 AI 基础,以及 Google 在硬件、模型和安全领域的进步,Google Cloud 在推动 AI 实现“供大众使用,使人人受益”这一目标方面具有得天独厚的优势。有了我们统一的 AI 技术栈,客户可以更轻松地在 AI 优化型基础设施上训练和部署模型,访问和自定义来自 Google 和业界的一些最佳基础模型,利用集成式开发者平台构建高级 AI 智能体,以及借助 AI 协作工具提高工作效率。通过 Gemini for Google Cloud 和 Gemini for Google Workspace,Google Cloud 还可以帮助客户提升工作效率、获得竞争优势、更安全地工作,最终提高利润。Gemini 在 Google Workspace 和 Google Cloud 中随时随地为用户提供依托 AI 技术的助理功能,涵盖开发、运营、安全管理、数据分析、数据库和协作。从零售业到制造业,从医疗保健业到金融服务业等等,Google Cloud 正助力各行各业的组织推动下一个创新时代的到来,并将 AI 的承诺变为现实。Google Cloud 可帮助组织自信而快速地打造变革性的生成式 AI 体验。53Forrester Research Inc.-The Forrester Wave:AI 基础设施解决方案,2024 年第 1 季度以 Google 的规模高效地实现 AI 应用,是全球其他公司难以企及的壮举。Google 基于这些经验和底层架构,打造出 Google Cloud AI 基础设施。”54组织如何受益于我们的 AI 合作伙伴生态为让客户能充分选择所需的创新技术和解决方案,生成式 AI 需要一个开放的合作伙伴生态系统,来提供广泛的解决方案。我们值得信赖的合作伙伴社区针对各种 AI 计划提供专家指导和支持,帮助组织从实验阶段过渡到加速阶段,再到扩大规模阶段。我们不但通过 Partner Advantage 计划集结了十万多家公司,在生成式 AI 领域还有一众快速发展的新合作伙伴,让客户可以携手基础设施合作伙伴、模型开发者、业务应用提供商、数据提供商以及服务合作伙伴,共同推动 AI 转型。如今,我们的全球系统集成商已承诺为超过 15 万名顾问提供 Google Cloud 生成式 AI 生态系统方面的培训,并随时准备帮助您加速 AI 部署。55事不宜迟,即刻开启您的生成式 AI 旅程。与我们联系,立即预约生成式 AI 价值咨询。资源57Salesforce,“New research:Over half of workers say generative AI will help advance their career,but most lack the skills”(新研究:超过半数的员工表示,生成式 AI 将有助于他们的职业发展,但大多数人缺乏相关技能),2023 年 7 月1Google Cloud,Agent Assist7Google Cloud,“The state of generative AI adoption survey”(生成式 AI 应用现状调查),2023 年 10 月2Google Cloud,客户价值和转型团队,“Measuring the business value customers generate with Google AI”(衡量客户利用 Google AI 创造的业务价值),2024 年 2 月3KPMG,“Gen AI consumer retail report”(生成式 AI 零售和消费品报告),2023 年 6 月8McKinsey,“A CIO and CTO technology guide to generative AI”(面向首席信息官和首席技术官的生成式 AI 技术指南),2023 年 7 月4IBM,“The CEOs guide to generative AI:Customer&employee experience”(面向首席执行官的生成式 AI 指南:客户与员工体验),2023 年 8 月9McKinsey,“The Economic Potential of Generative AI(as%of total marketing spending)”(生成式 AI 的经济潜力,占总营销支出的百分比),2023 年 6 月5Accenture,“A new era of generative AI for everyone”(生成式 AI:人人可享的新时代),2023 年 5 月10 IBM,“Augmented work for an automated AI-driven world”(进入依托 AI 技术的自动化世界,实现增强型工作),2023 年 8 月11Google Cloud,“How Google Cloud improved customer support with Contact Center AI”(Google Cloud 如何利用 Contact Center AI 提升客户服务),2023 年 8 月6
1证券研究报告作者:行业评级:上次评级:行业报告:请务必阅读正文之后的信息披露和免责申明数据研究数据研究 科技专题科技专题强于大市强于大市维持2024年9月27日(评级)分析师 孙谦 SAC执业证书编号:S1110521050004分析师 黄海利 SAC执业证书编号:S1110522090003人工智能产业投资全景透视人工智能产业投资全景透视行业专题研究摘要摘要请务必阅读正文之后的信息披露和免责申明本报告利用执中数据,对人工智能产业的投资趋势进行了详尽分析,旨在通过交易数据揭示人工智能投资最新动态本报告利用执中数据,对人工智能产业的投资趋势进行了详尽分析,旨在通过交易数据揭示人工智能投资最新动态:2016年、2021年,政策支持和技术进步推动了行业融资的快速增长。2023年,ChatGPT的崛起点燃了生成式AI的热潮,投资者的视角变得更加理性,中期项目的融资比例上升。国际资本的步伐开始放缓,美元投资事件在中国AI市场上逐渐减少,而人民币投资则占据主导地位。北京稳居中国AI投融资的核心枢纽,东部沿海地区则不断涌现出代表性项目。历年来:语音识别和图像识别语音识别和图像识别等机器学习的单点技术,以其成熟度和广泛应用,成为投资者关注的重点。这些技术不仅是人工智能系统创新的重要基石,还吸引了大量资金的涌入。自ChatGPT问世以来,大模型大模型的应用前景愈加广阔,全球各国纷纷将其视为战略重点,推动了该领域的融资规模持续增长。自动驾驶的硬件与技术自动驾驶的硬件与技术因其高技术壁垒,直接影响系统的安全性与可靠性,展现出广阔的商业化前景,吸引了资本市场对技术领先企业的青睐。我们认为,这些投资不仅助力关键技术的突破,也为整个产业生态的长远发展奠定了基础。随着消费者对沉浸式体验的需求逐渐增加,增强现实增强现实领域的投资热情也在不断高涨。我们认为,VR/AR技术的体验质量高度依赖于硬件性能,这些硬件的创新是实现高质量体验的关键,因此该领域吸引了大量投资。2023年以来:AI投资格局发生了显著变化,ChatGPT的崛起掀起了AI技术竞赛,投资方向随之转变,算法、算力和数据领域融资活跃。国内科技企业纷纷加入大模型大模型的竞争,截至24年8月,中国已备案并上线的生成式AI大模型的数量已超过190个,用户数量超过6亿。AI芯片与算力解决方案芯片与算力解决方案领域正经历变革。自2020年美国对华为实施技术限制以来,对中国芯片行业的限制不断加剧。2023年,随着算力需求的持续增长,高端GPU供应紧张,价格上升。资本助力推动国产替代的快速发展。数据分析数据分析在这一背景下显得尤为重要。大模型和AI技术的发展高度依赖数据支持,而数据分析的深入应用反过来也助力了AI技术的优化和发展。全球制造业正向智能化和自动化转型,对工业视觉、自动化和机器人技术工业视觉、自动化和机器人技术的需求日益增长。这些技术在检测、质控、装配和物流等环节中发挥着重要作用,能够有效降低成本并提高效率。随着发达经济体劳动力成本的上升,企业对自动化技术的需求愈加迫切,工业自动化和机器人技术有望逐步取代人工,完成高强度和危险的工作,从而降低运营成本,提升竞争力。风险提示风险提示:第三方数据准确性风险,数据全面性风险,市场环境变化风险:第三方数据准确性风险,数据全面性风险,市场环境变化风险23历年人工智能行业投融资情况历年人工智能行业投融资情况资料来源:执中数据,天风证券研究所政策助力与技术进步推动融资增长政策助力与技术进步推动融资增长 2016年,国务院发布互联网 人工智能三年行动实施方案,为人工智能行业提供了重要政策支持。大量风险投资涌入,推动行业快速增长,当年融资额同比激增665%,融资事件数增长88%。2021年,新基建战略深入推进,新一代人工智能发展规划等政策相继出台,为行业注入新的政策支持。随着人工智能技术在智能制造、智慧城市等领域的成熟应用,企业融资需求大幅增加。政策利好与技术进步共同推动下,2021年融资金额同比增长84%,融资事件数增加25%,行业进入高速发展期。2023年,ChatGPT迅速引起公众关注,生成式AI成为科技新宠,人工智能热度持续。2023年以来投资主要集中于中等规模项目,融资金额过亿的事件中,1-10亿元人民币的融资事件数量较多。图:人工智能行业历年融资概况图:人工智能行业历年融资概况资金规模2021H12021H22022H12022H22023H12023H22024H1超30亿人民币020200210-30亿人民币55222301-10亿人民币293125142930175千万-1亿人民币91819164541千万-5千万人民币24231212463618低于1千万人民币4172113374未披露264327241218163204103总数3504263422882492831482021-2024上半年人工智能行业融资事件数规模分布(单位:件)上半年人工智能行业融资事件数规模分布(单位:件)111526931383867258618706686237766195321480.321.332.267.3323.2254.61417.93172.67313.27246.37267.72492.83284.28271.65155.67010020030040050060001002003004005006007008009001000融资事件数融资金额(亿人民币)42024上半年人工智能投资“量减质增”上半年人工智能投资“量减质增”0204060801002023-01 2023-02 2023-03 2023-04 2023-05 2023-06 2023-07 2023-08 2023-09 2023-10 2023-11 2023-12 2024-01 2024-02 2024-03 2024-04 2024-05 2024-06月均:月均:22.64亿元亿元月均:月均:25.95亿元亿元图:图:2023-2024H1 AI项目融资金额(亿元)项目融资金额(亿元)02040602023-01 2023-02 2023-03 2023-04 2023-05 2023-06 2023-07 2023-08 2023-09 2023-10 2023-11 2023-12 2024-01 2024-02 2024-03 2024-04 2024-05 2024-06月均:月均:24.67件件月均:月均:44.33件件图:图:2023-2024H1 AI项目融资事件数(件)项目融资事件数(件)资料来源:执中数据,天风证券研究所2024年上半年,年上半年,AI行业融资呈现行业融资呈现量减质增量减质增趋势。趋势。虽然项目月均融资事件数从2023年的44件降至25件,整体活跃度有所降温,但资本青睐优质企业和项目。期内月均融资金额达25.95亿元,高于2023年的22.64亿元。其中,月之暗面于24年2月获超10亿美元融资,MiniMax在24年3月获6亿美元融资,AI投资正从早期高速扩张过渡至更理性成熟阶段,资本更谨慎评估并支持具核心竞争力企业。图:图:Minimax、月之暗面、月之暗面2023年至今融资情况年至今融资情况5仍以早期阶段投资为主,近年来理性化趋势显现仍以早期阶段投资为主,近年来理性化趋势显现资料来源:执中数据,天风证券研究所人工智能融资趋于理性,中期阶段资金支持增强:人工智能融资趋于理性,中期阶段资金支持增强:过去三年,投资者对早期AI项目的兴趣有所降低,早期融资占比从2021年的57.52%下降至2024年上半年的44.59%。由此我们认为,21-24年上半年,中期阶段融资占比显著上升,一些AI项目进入扩展期后吸引了更多资金支持。2024上半年,早期阶段融资仍占主导地位:上半年,早期阶段融资仍占主导地位:早期阶段中,A轮融资最活跃(26起),天使轮和种子轮融资数量相近(各13起),显示资本为AI初创提供了较均衡的早期支持。中期B轮融资最为活跃(29起),反映出部分项目进入快速发展阶段。资本市场正采用更多样化的投资方式,如战略投资等,进一步支持人工智能项目的发展。资本市场正采用更多样化的投资方式,如战略投资等,进一步支持人工智能项目的发展。战略投资股权投资种子轮天使轮Pre-A轮Pre-A1轮Pre-A2轮A轮A1轮A2轮Pre-B轮B轮B1轮C轮C2轮C1轮其他类型早期阶段中期阶段图:图:2024上半年上半年AI项目融资事件数按融资轮次分布项目融资事件数按融资轮次分布452#%融资阶段划分:早期指种子、天使、Pre-A轮、A轮;中期:Pre-B轮、B轮、C轮;后期:D轮至上市前的阶段。图:历年图:历年AI项目融资事件数按融资阶段分布项目融资事件数按融资阶段分布19#%0%1%1%0XQSET#% 2# 21202220232024H1总体其他类型晚期阶段早期阶段中期阶段中期阶段23%早期阶段54%其他类型22%6资料来源:执中数据,中国证券报公众号,天风证券研究所注:本页图表仅统计已披露投资事件数据人民币主导地位的逐步确立:人民币主导地位的逐步确立:根据已披露数据,在22年略微下滑后,23年人民币在AI投资中的事件数达到142起,为近三年新高美元投资事件数显著下降美元投资事件数显著下降:从2021年的51起逐步减少至2024年上半年仅4起。这种趋势表明,美元资本在中国AI行业中的参与度正在大幅下降,或反映了国际投资者对AI项目的审慎态度有所增加,亦或是投资方向发生转移。值得注意的是,2024年大模型企业Minimax和月之暗面均获得了美元投资。相比之下相比之下,港元和新加坡元的投资事件数较少港元和新加坡元的投资事件数较少。表:表:2021-2024上半年人工智能人民币投资事件占比总体提升上半年人工智能人民币投资事件占比总体提升图:图:2021-2024上半年上半年AI行业累计投资事件币种与轮次分布行业累计投资事件币种与轮次分布16.51.42%4.59%1.24P.46c.77(.44$.57%港元美元人民币新加坡元总体其他类型晚期阶段早期阶段中期阶段人民币78.4%美元21.2%币种币种/年份年份2021202220232024H1港元1美元5131234人民币11510714239新加坡元1人民币在人民币在AI投资中的主导地位确立投资中的主导地位确立融资日期融资日期项目名称项目名称融资轮次融资轮次融资金额融资金额本轮估值本轮估值2024/1/19耀速科技天使轮千万美元未披露2024/2/19月之暗面A轮超10亿美金约25亿美金2024/3/4MiniMaxB轮6亿美元未披露2024/6/5深度原理种子轮近千万美元未披露2024/8/5月之暗面C轮3亿美元未披露表:表:2024年上半年中国年上半年中国AI项目美元融资一览项目美元融资一览单位:件单位:件7资料来源:执中数据,天风证券研究所中国中国AI产业投融资格局产业投融资格局:北京引领,东部沿海崛起北京引领,东部沿海崛起图图:2021-2024上半年中国各地区上半年中国各地区AI投资事件数量(单位:件)投资事件数量(单位:件)备注:省份依据融资公司注册地归属北京是中国北京是中国AI投融资的中心枢纽:投融资的中心枢纽:2021年至2024年上半年,北京共累计483起AI融资事件,占全国总量的24%。截至今年7月,北京新增13个融资规模过亿的人工智能项目。东部沿海地区是东部沿海地区是AI融资热点区域:融资热点区域:广东省和上海仅次于北京。同期AI融资事件数分别达375起和307起。其中,广东省在2024年上半年新增的44起AI融资事件更是居全国之首。此外,东部沿海的浙江省和江苏省也位列全国AI融资活跃度前五。这些地区凭借良好的产业基础和创新生态,在吸引大额AI融资方面显现出明显优势。4833753072612577546384327北京市广东省上海市浙江省江苏省安徽省四川省山东省湖北省福建省2021202220232024H1省份过亿融资事件数量北京市13上海市4广东省2江苏省4浙江省3福建省1山东省1表:表:2024年上半年年上半年 AI亿级融资规模事件地区分布一览(单位:件)亿级融资规模事件地区分布一览(单位:件)8资料来源:执中数据,天风证券研究所2024上半年融资金额过亿的人工智能项目地区分布上半年融资金额过亿的人工智能项目地区分布北京北京代表项目:月之暗面、深度原理、百川智能、面壁智能、爱诗科技、星动纪元、雷科智途、生数科技、超星未来、LiblibAI、耀速科技、的卢深视上海上海代表项目:MiniMax、复睿智行、雅通科技、鲸鱼机器人江苏省江苏省代表项目:后摩智能、霞智科技、卓宇智能、华美浩联浙江省浙江省代表项目:Rokid、联汇科技、连信数字广东省广东省代表项目:雷鸟创新、影目科技历年来人工智能细分赛道融资活跃度历年来人工智能细分赛道融资活跃度PK资料来源:执中数据,捷通华声官网,依图科技官网,Rokid官网,小派科技官网,天风证券研究所 机器学习单点技术机器学习单点技术:语音识别和图像识别等单点技术项目的融资最为活跃。语音识别和图像识别等单点技术项目的融资最为活跃。代表性案例包括捷通华声、云知声和依图科技等企业,我们认为,这些技术经过多年发展已趋成熟,或成为人工智能系统化创新的基础,有望增强投资者的信心。同时,语音识别和图像技术的广泛应语音识别和图像技术的广泛应用场景有望带来更大的市场规模和收入潜力用场景有望带来更大的市场规模和收入潜力。上游硬件和基础设施上游硬件和基础设施:硬件和计算能力的瓶颈是行业发展的关键制约因素硬件和计算能力的瓶颈是行业发展的关键制约因素。代表性企业如燧原科技、中昊芯英和寒武纪等,投资这些领域或意味着对未来生态系统的控制权,因此资本更加青睐此类投资。Rokid、小派科技等AR/VR公司融资活跃。我们认为,我们认为,AR/VR技术或在技术或在娱乐、教育、医疗、制造等多个行业具有广泛应用潜力娱乐、教育、医疗、制造等多个行业具有广泛应用潜力。VR/AR硬件作为底层支撑技术,成为资本关注的重点。自动驾驶与自动驾驶与AIGC:自动驾驶技术在交通运输、汽车、物流、农业和公共交通等多个领域前景广阔自动驾驶技术在交通运输、汽车、物流、农业和公共交通等多个领域前景广阔,踏歌智行、小马智行等自动驾驶公司融资活跃。此外,技术的进步提升了生成式AI内容的质量。我们认为,多样化的应用场景促使大量项目成长并吸引大量资金,加速技术研我们认为,多样化的应用场景促使大量项目成长并吸引大量资金,加速技术研发和商业化进程,发和商业化进程,来画视频和旷视科技等企业在此方面有着广泛的跨行业应用和降本增效的潜力,有望成为资本布局领域。表:成立以来融资活跃公司赛道分布概览表:成立以来融资活跃公司赛道分布概览备注:融资活跃的公司特指成立至2024H1以来融资事件数5次及以上的公司赛道赛道活跃融资事件活跃融资事件活跃公司数活跃公司数活跃项目代表活跃项目代表语音识别与处理11917捷通华声、云知声图像识别与处理10012依图科技、应用拍拍AR/VR硬件9413Rokid、灵犀微光、小派科技AI芯片与算力解决方案8311燧原科技、中昊芯英、寒武纪自动驾驶技术与解决方案709踏歌智行、天瞳威视、小马智行生成式AI与内容创作6610来画视频、旷视科技910历年来人工智能细分赛道资本吸引能力历年来人工智能细分赛道资本吸引能力PK资料来源:执中数据,天风证券研究所 大模型:大模型:研发和训练需要庞大的计算资源和海量数据,使该领域对资金支持的需求较大。由于大模型的下游应用广泛,我们认为,掌握我们认为,掌握该技术的企业或具备在多场景中保持领先的潜力,有一定几率获得显著的规模经济和市场领导地位,进而吸引大量资本注入。该技术的企业或具备在多场景中保持领先的潜力,有一定几率获得显著的规模经济和市场领导地位,进而吸引大量资本注入。Chat GPT成功以来,科技公司与各国政府对大模型的战略重视度进一步提升,全球科技巨头竞相投入,进一步推动了整个赛道的融资规模。自动驾驶硬件与技术自动驾驶硬件与技术:硬件和感知技术是实现自动驾驶的关键基础。它们决定了车辆对环境的感知精度和反应速度,直接影响到自动驾硬件和感知技术是实现自动驾驶的关键基础。它们决定了车辆对环境的感知精度和反应速度,直接影响到自动驾驶系统的安全性和可靠性。驶系统的安全性和可靠性。自动驾驶未来或广泛应用于物流运输、乘用车、公共交通等多个领域。其广阔的应用空间,推动了资本市场其广阔的应用空间,推动了资本市场的投入。的投入。另一方面,我们认为,自动驾驶领域具有较高的技术壁垒,资本市场或更倾向于大规模投资那些在技术上具有领先优势的公司,资本市场或更倾向于大规模投资那些在技术上具有领先优势的公司,希望能在未来的激烈市场竞争中占据主导地位希望能在未来的激烈市场竞争中占据主导地位。我们认为,资本大量涌入自动驾驶硬件和感知技术领域,不仅是对单一公司的投资,更不仅是对单一公司的投资,更是对整个产业生态的长期布局。这些投资不仅支持关键技术的突破,也为自动驾驶产业的未来发展奠定了基础。是对整个产业生态的长期布局。这些投资不仅支持关键技术的突破,也为自动驾驶产业的未来发展奠定了基础。增强现实:增强现实:消费者对沉浸式体验需求的增长,推动了资本对内容创作和平台开发的投资热情消费者对沉浸式体验需求的增长,推动了资本对内容创作和平台开发的投资热情。我们认为,VR/AR技术的体验质量很大程度上取决于硬件的性能,如高分辨率显示器、低延迟传感器、轻量化设计等。这些硬件创新是实现优质这些硬件创新是实现优质VR/AR体验的关键,吸引投资人体验的关键,吸引投资人的驻足的驻足。表:成立至今吸引资本赛道概览表:成立至今吸引资本赛道概览赛道赛道募资超募资超10亿事件数亿事件数募资募资1-10亿事件数亿事件数吸引资本项目代表吸引资本项目代表大模型815月之暗面、MiniMax、百川智能、智谱AI自动驾驶硬件与感知技术62黑芝麻、地平线自动驾驶技术与解决方案312天瞳威视、驭势科技、轻舟智航AI芯片与算力解决方案214瀚博半导体、燧原科技货运自动驾驶2-智加科技AR/VR内容与体验115PICOAR/VR硬件-18Rokid语音识别与处理-13云知声、声通科技2023-2024H1人工智能投融资新风向人工智能投融资新风向资料来源:执中数据,中国电子报微信公众号,国家监察委员会,证券时报、天风证券研究所表:表:2023-2024H1活跃赛道与资金吸引力趋势活跃赛道与资金吸引力趋势赛道赛道活跃公司融资事件活跃公司融资事件活跃公司数活跃公司数活跃项目代表活跃项目代表大模型319MiniMax、面壁智能、西湖心辰AI芯片与算力解决方案2910燧原科技、中昊芯英、后摩智能数据分析2010国信数据AR/VR硬件207莫界科技、细红线、仙瞬科技工业视觉199中科融合工业自动化与机器人146加速进化、矩控新辰23年随着年随着ChatGPT的崛起,掀起了的崛起,掀起了AI技术竞赛的浪潮,技术竞赛的浪潮,AI产业的投资方向也发生了显著变化,算法、算力和数据成为最活跃的融资赛道。产业的投资方向也发生了显著变化,算法、算力和数据成为最活跃的融资赛道。大模型:大模型:国内科技企业百模大战。截至24年8月,中国已备案并上线的生成式AI大模型超过190个,注册用户超过6亿。AI芯片与算力解决方案:芯片与算力解决方案:自2020年美国对华为的技术限制以来,逐步扩大到对中国芯片行业的全面限制。2023年,随着算力需求的持续增长,高端GPU供应紧张,价格上升。各类资本助力,推动国产替代快速发展。数据分析:数据分析:大模型和AI技术的发展依赖数据支持,数据分析的深入应用反过来也推动了AI技术的优化。工业视觉、工业自动化与机器人:工业视觉、工业自动化与机器人:我们认为,随着全球制造业向智能化和自动化转型,对工业视觉、自动化和机器人技术的需求增加。这些技术在检测、质控、装配和物流等方面发挥作用能够降本增效。随着发达经济体劳动力成本上升,企业对自动化技术的需求迫切,工业自动化和机器人技术有望逐步减轻人工在高强度、重复性和危险工作中的负担,从而降低运营成本,提升企业竞争力。赛道赛道募资超募资超10亿事件数亿事件数募资募资1-10亿事件数亿事件数活跃项目代表活跃项目代表大模型610MiniMax、百川智能、智谱AI、月之暗面AI芯片与算力解决方案13燧原科技AR/VR硬件9Rokid、细红线语音识别与处理6云知声、声通科技AR/VR内容与体验5当红齐天、XRSPACE自动驾驶技术与解决方案5小马智行、踏歌智行、驭势科技备注:融资活跃的公司特指2023-2024H1融资次数2次及以上的公司1112资料来源:执中数据,天风证券研究所中外人工智能赛道中外人工智能赛道D-PreIPO项目概览项目概览图:中国与海外图:中国与海外D PreIPO轮次公司赛道分布轮次公司赛道分布10744243111132121211人 工 智 能 应 用生 物 科 技 与 健 康 科技智 慧 交 通增 强 现 实工 业 自 动 化机 器 学 习数 据 科 学计 算 机 视 觉物 联 网自 然 语 言 处 理信 息 安 全D-PREIPO轮次公司数量海外中国项目名称最近融资日期融资金额(亿美元)属地融资轮次主要业务领域特色UiPath2021/7/1020海外股权投资机器人流程自动化将RPA与AI结合,实现复杂任务的自动化Scale AI2024/5/2110海外F轮AI数据标注与管理提供高质量数据标注,提升AI模型性能Trax2021/4/86.4海外E轮零售计算机视觉数字化店内货架,优化库存管理与运营效率Cohere2024/7/225海外D轮自然语言处理(NLP)开发大语言模型,提升文本生成与分类能力Neuralink2023/11/282.8海外D轮脑机接口技术研发植入式设备,实现人脑与计算机的直接通信DataRobot2021/6/292.7海外F轮自动化机器学习(AutoML)平台使企业用户无需深厚技术即可构建预测模型Verbit2021/11/242.5海外E轮AI语音转写与字幕服务结合机器学习和人工校对,提供高精度转写服务Exscientia2021/4/282.25海外D轮AI驱动的药物发现与开发使用AI加速新药研发,优化分子设计与候选药物筛选图森智途2021/1/22未披露中国战略投资自动驾驶卡车技术专注于长途货运自动驾驶技术,在中美均有业务燧原科技2023/12/8未披露中国股权投资AI芯片与自动驾驶解决方案多样化产品SKU,普惠算力2023-2024上半年人工智能活跃投资机构上半年人工智能活跃投资机构TOP10投资机构投资机构主要投资主要投资AI项目项目主要投资轮次主要投资轮次主要投资地区主要投资地区红杉中国月之暗面(月之暗面(2)、人生旷野、无问芯穹无问芯穹、深言科技深言科技、睿维视、Graphcore、彼真科技、智谱AI、幂律智能幂律智能、魔珐科技股权投资、A轮、Pre-A轮北京市、上海市、江苏省真格基金月之暗面月之暗面、耀速科技、无问芯穹无问芯穹、蛙声科技蛙声科技、维悟光子、瀚博半导体瀚博半导体天使轮、C轮北京市、上海市、浙江省IDG资本小度科技、智臻智能股权投资、C轮上海市联想创投细红线(3)、星动纪元、reInventAI、OpenCSG、蛙声科技蛙声科技、随幻科技天使轮、A1轮、C轮北京市、上海市、浙江省金沙江创投煋海图、无问芯穹无问芯穹、LiblibAI天使轮、A轮上海市、北京市、江苏省松禾资本MIRA股权投资广东省腾讯投资百川智能(2)、月之暗面月之暗面、燧原科技(2)、蘑菇车联(2)、无问芯穹、深言无问芯穹、深言科技、科技、MiniMax(2)、智谱AI(2)A轮、股权投资、C轮北京市、上海市、广东省经纬创投细红线、无问芯穹、蛙声科技、细红线、无问芯穹、蛙声科技、光轮智能、和光同耀、细红线(细红线(2)、瀚博半导瀚博半导体体天使轮、Pre-A轮、C轮北京市、上海市、浙江省英诺天使基金加速进化、原粒半导体(2)、深空交响种子轮、天使轮、A轮北京市线性资本北京深度原理科技有限责任公司、LING灵宇宙、彼真科技、幂律智能幂律智能种子轮、天使轮、股权投资北京市、上海市注:加粗代表23-24H1多家投资机构参与该项目投资括号内数字代表23-24H1该投资机构参与投资该项目的次数资料来源:执中数据,天风证券研究所13风险提示风险提示1.1.第三方数据准确性风险:第三方数据准确性风险:本报告基于执中数据,其数据的准确性和及时性可能受到信息来源、数据处理方法等因素的影响,因此可能存在偏差或误差。2.2.数据全面性风险:数据全面性风险:本报告仅基于披露交易的相关信息进行统计分析,未涵盖所有可能影响分析结果的因素,数据的全面性可能受到限制。3.3.市场环境变化风险:市场环境变化风险:市场环境和政策法规的变化可能对数据的适用性和分析结果产生影响,本报告无法涵盖所有可能的未来变化。1415请务必阅读正文之后的信息披露和免责申明股票投资评级自报告日后的6个月内,相对同期沪深300指数的涨跌幅行业投资评级自报告日后的6个月内,相对同期沪深300指数的涨跌幅买入预期股价相对收益20%以上增持预期股价相对收益10%-20%持有预期股价相对收益-10%-10%卖出预期股价相对收益-10%以下强于大市预期行业指数涨幅5%以上中性预期行业指数涨幅-5%-5%弱于大市预期行业指数涨幅-5%以下投资评级声明投资评级声明类别类别说明说明评级评级体系体系分析师声明分析师声明本报告署名分析师在此声明:我们具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,本报告所表述的所有观点均准确地反映了我们对标的证券和发行人的个人看法。我们所得报酬的任何部分不曾与,不与,也将不会与本报告中的具体投资建议或观点有直接或间接联系。一般声明一般声明除非另有规定,本报告中的所有材料版权均属天风证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)及其附属机构(以下统称“天风证券”)。未经天风证券事先书面授权,不得以任何方式修改、发送或者复制本报告及其所包含的材料、内容。所有本报告中使用的商标、服务标识及标记均为天风证券的商标、服务标识及标记。本报告是机密的,仅供我们的客户使用,天风证券不因收件人收到本报告而视其为天风证券的客户。本报告中的信息均来源于我们认为可靠的已公开资料,但天风证券对这些信息的准确性及完整性不作任何保证。本报告中的信息、意见等均仅供客户参考,不构成所述证券买卖的出价或征价邀请或要约。该等信息、意见并未考虑到获取本报告人员的具体投资目的、财务状况以及特定需求,在任何时候均不构成对任何人的个人推荐。客户应当对本报告中的信息和意见进行独立评估,并应同时考量各自的投资目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专家的意见。对依据或者使用本报告所造成的一切后果,天风证券及/或其关联人员均不承担任何法律责任。本报告所载的意见、评估及预测仅为本报告出具日的观点和判断。该等意见、评估及预测无需通知即可随时更改。过往的表现亦不应作为日后表现的预示和担保。在不同时期,天风证券可能会发出与本报告所载意见、评估及预测不一致的研究报告。天风证券的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。天风证券没有将此意见及建议向报告所有接收者进行更新的义务。天风证券的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。特别声明特别声明在法律许可的情况下,天风证券可能会持有本报告中提及公司所发行的证券并进行交易,也可能为这些公司提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。因此,投资者应当考虑到天风证券及/或其相关人员可能存在影响本报告观点客观性的潜在利益冲突,投资者请勿将本报告视为投资或其他决定的唯一参考依据。THANKS16
DONGXING DONGXING SECURITIESSECURITIES分析师刘航联系方式:021-25102913执业证书编号:S1480522060001分析师张永嘉联系方式:010-66554016执业证书编号:S1480523070001分析师刘蒙联系方式:010-66554034执业证书编号:S1480522090001分析师石伟晶联系方式:021-25102907执业证书编号:S1480518080001行业研究行业研究东兴证券股份有限公司证券研究报告东兴证券股份有限公司证券研究报告端侧智能行业:端侧智能行业:人工智能人工智能重要应用,产品落地爆发在即重要应用,产品落地爆发在即人工智能系列报告人工智能系列报告东兴科技团队2024年9月27日P2摘要摘要语言学习平台语言学习平台端侧智能具备多重优势,前景广阔,是端侧智能具备多重优势,前景广阔,是AI的重要落地场景。的重要落地场景。端侧智能是在终端设备一侧进行智能化处理和决策,将人工智能算法和计算能力直接部署在边缘设备上。其优势包括增效(低延迟、脱机可用、分布式计算)、降本(节能高效、成本效益)、安全(稳定、数据安全)、个性化等。当前主要落地场景包括 AI PC、AI 手机、AI 可穿戴设备、AI 智能家居、AI 智能汽车、AI 工业设备等,市场前景广阔,政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道。政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道。政策端:近年来,国家出台了一系列利好政策,推动人工智能行业的发展。技术端:处理器、内存、电池、散热、软件等技术的进步助力端侧 AI 落地,如 NPU 异构方案为 AI PC 提供充足算力,轻量化模型让本地部署成为可能,端云结合赋能手机功能落地等。行业催化:苹果发布 iPhone16 系列,全系适配 Apple Intelligence;华为发布三折叠新品,全联接大会召开,AI 为重头戏,这些新动作有望大幅提振市场情绪。生态效应显著,把握高通、华为两大主线。生态效应显著,把握高通、华为两大主线。高通生态方面,高通依托先发优势和专利在通信芯片方面构筑壁垒,通过专注芯片研发、捆绑销售以及抓住移动互联网发展机遇实现份额提升,开放生态合作进一步强化壁垒,在手机、物联网、汽车等领域实现技术迁移,展现端侧智能优势。华为生态方面,华为作为全球领先的 ICT 基础设施和智能终端提供商,坚持技术驱动,围绕鸿蒙、鲲鹏、昇腾、云计算等业务构筑开放生态。华为持续推进“全面智能化”战略,积极把握生成式 AI 同终端产品深度结合的创新浪潮,在端侧智能方面保持开放生态。投资建议:投资建议:我们认为随着华为全联接大会、苹果秋季发布会、Meta Connect 2024等大会的召开以及以人工智能为卖点的产品陆续问世,消费者对端侧智能的认知及接受度将逐步提高,具备先发优势及较强产品力的企业将受益行业发展,实现业绩增长。从竞争优势与发展确定性的维度我们推荐高通产业链与华为产业链两条主线,高通方面,推荐与其深度绑定、全面合作的中科创达,同时认为德赛西威、商汤、移远通信、华勤技术等公司有望受益于行业发展;华为方面,在当前全球环境不确定性加剧、国内推进科技自立自强的大背景下,华为作为国内科技领域的绝对龙头兼具信创与新质生产力发展的双重逻辑,华为的鸿蒙、欧拉操作系统与鲲鹏、昇腾算力基础设施协同加速发展,在该逻辑下,我们认为软通动力、中软国际、科大讯飞、润和软件、拓维信息、常山北明等公司有望受益于行业发展。风险提示:风险提示:行业竞争加剧;海外地缘政治影响;华为新产品发布节奏低于预期;华为新技术研发进度低于预期;人工智能协同作用不及预期等。P3目录目录端侧智能:人与人工智能交互的更优窗口端侧智能:人与人工智能交互的更优窗口政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道生态效应显著,把握高通、华为两大主线投资建议与风险提示东兴科技端侧智能行业报告东兴科技端侧智能行业报告P41 端侧智能:人与人工智能交互的更优窗口端侧智能:人与人工智能交互的更优窗口语言学习平台语言学习平台端侧智能是指在终端设备一侧进行的智能化处理和决策。端侧智能是指在终端设备一侧进行的智能化处理和决策。它将人工智能算法和计算能力直接部署在边缘设备上,如智能手机、PC、智能家居、可穿戴设备、汽车、工业传感器等,使这些设备能在本地进行数据处理和分析,无需将大量数据传输到云端进行处理。这些终端通过内置的AI算法和硬件支持,实现了语音识别、图像处理、自然语言理解、预测分析等功能,提升用户体验和设备性能。端侧智能区别于传统端侧智能区别于传统AI的关键的关键在于,AI终端采用大模型端侧部署或端侧部署与云端部署相结合的模式,而非完全依赖云端大模型。在AI终端上,云端大模型为端侧提供支持,复杂计算任务可以在云端完成,然后将结果传输到端侧设备。而端侧大模型在本地设备上运行,负责相对简单的任务,实现更快速的响应和更好的隐私保护。云端大模型云端大模型运行在数据中心或云计算平台上的大型模型,通常拥有强大的计算能力和大量的存储资源,能够处理大规模数据,进行复杂的计算和训练,提供强大的AI服务,但存在定制化程度低、隐私无法保证、使用必须联网等缺陷。图图:AIAI终端的关键技术特征终端的关键技术特征资料来源:about云,东兴证券研究所端侧大模型端侧大模型运行在本地设备上的模型,通常较小,但经过优化适应设备的计算和存储限制,特征是能够在本地设备上快速响应,提升隐私保护和数据安全,减少对网络连接的依赖。图图:云端大模型与端侧大模型对比云端大模型与端侧大模型对比资料来源:华为AI终端白皮书,东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P51.1 端侧智能的优势端侧智能的优势语言学习平台语言学习平台资料来源:东兴证券研究所制表整理表表:端侧智能的优势端侧智能的优势优势类型优势类型具体优势具体优势描述描述增效增效低延迟低延迟AI 终端设备在本地处理数据,降低处理延迟,实现更快响应时间,在自动驾驶、智能家居和工业控制等即时反馈场景作用明显。脱机可用脱机可用AI 终端设备在无网络连接情况下仍能独立运行,确保在网络不稳定或断开时持续提供智能化服务,提高系统整体可靠性。分布式计算分布式计算与边缘计算架构结合,实现大规模分布式处理,多设备、多节点环境下协同工作,增强整体系统计算能力与效率。降本降本节能高效节能高效本地执行计算任务,减少与云端数据交互,降低能源消耗,提升整体系统能源效率,优化资源利用,减少对外部计算资源依赖。成本效益成本效益本地处理数据,减少对云端资源依赖,降低与云计算相关的带宽和存储成本,对大规模部署企业成本效益显著。安全安全稳定稳定调度本地大模型,避免因云端服务波动导致工作流中断,减少对云端模型依赖,使工作流程更稳定可控。数据安全数据安全本地处理敏感数据,避免上传至云端,降低数据泄露风险,增强隐私保护,在涉及个人信息和商业机密应用中尤为重要。个性化个性化个性化个性化本地对用户行为细致分析,精准了解用户需求,提供个性化服务,更好适应用户独特偏好和需求。端侧智能依靠技术特性在多方面具备显著优势。端侧智能依靠技术特性在多方面具备显著优势。增效方面,低延迟使得其在自动驾驶等即时反馈场景作用明显;脱机可用确保在无网络时也能持续提供智能化服务;分布式计算与边缘计算架构结合,实现多设备协同工作,增强系统计算能力。降本方面,节能高效可降低能源消耗,成本效益显著是因为减少了对云端资源的依赖,降低了带宽和存储成本。安全方面,稳定的特性可避免因云端服务波动中断工作流;数据安全能降低数据泄露风险。此外,端侧智能还具有个性化优势,可本地分析用户行为,精准了解需求,提供个性化服务,更好地满足用户独特偏好和需求。东兴科技端侧智能行业报告东兴科技端侧智能行业报告P61.2 端侧智能当前主要落地场景端侧智能当前主要落地场景语言学习平台语言学习平台资料来源:东兴证券研究所制表整理表表:AI终端主要品类及市场情况终端主要品类及市场情况品类品类定义定义市场渗透率市场渗透率产品成熟度产品成熟度技术难度技术难度市场接受度市场接受度进入难度进入难度产品成本产品成本AI PC内置AI 大模型、搭载AI 芯片、系统深度融合AI 的新一代PC较高中等较高较高较高中等AI手机手机内置AI 大模型、装配AI 芯片、OS 深度融合AI 的新一代手机较高中等较高较高较高中等AI可穿戴设备可穿戴设备搭载AI 技术、端云结合的可穿戴设备,如AI 眼镜、AI 手表等较低较低较高中等中等中等AI智能家居智能家居搭载AI 技术的智能家居产品,如扫地机器人、AI 控制平台等较低较低较高中等中等中等AI智能汽车智能汽车搭载AI驾驶、AI座舱管理等AI功能的新一代汽车中等中等较高中等中等较高AI工业设备工业设备可以在端侧进行数据采集和分析,用于工业自动化领域的传感器较低中等较高中等较高较高东兴科技端侧智能行业报告东兴科技端侧智能行业报告P71.2 端侧智能当前主要落地场景端侧智能当前主要落地场景语言学习平台语言学习平台资料来源:前瞻产业研究院、腾讯、网易、同花顺、上观、东兴证券研究所制表整理表表:AI终端主要品类创新方向与主要参与者终端主要品类创新方向与主要参与者品类品类增量类型增量类型技术及应用创新方向技术及应用创新方向主要参与者主要参与者AI PC短中期进入高速增长阶段个人知识库、本地大模型、NPU GPU CPU异构算力、轻量化模型、边缘计算、端云结合、AI OS、创新交互模式、本地化训练、ARM架构.国外:国外:英特尔、AMD、苹果、高通、戴尔、惠普等国内:国内:联想、华为等AI手机手机个人智慧式助理、轻量化端侧中小模型、NPU Soc、散热要求、内存要求、快速识图、人脸识别、AI影像、手机价值链重塑国外:国外:苹果、三星、谷歌等国内:国内:华为、小米、荣耀、OPPO、vivo 等AI可穿戴设备可穿戴设备中长期具备稳定增量AI AR、智能眼镜、Risc-V架构、全场景使用、硬件AI国外:国外:苹果、Meta、三星等国内:国内:华为、vivo等AI智能家居智能家居AI管家系统、边缘计算中心、AI家电、家居机器人国外:国外:苹果、亚马逊、谷歌、三星等国内:国内:小米、华为、科大讯飞、海尔等AI智能汽车智能汽车智能驾驶、智能座舱、智能网联国外:国外:特斯拉、英伟达、高通等国内:国内:华为、蔚来、小鹏、理想、地平线等AI工业设备工业设备温度传感器、压力传感器、位移传感器等国外:国外:ABB、霍尼韦尔、西门子等国内:国内:华为、海尔卡奥斯、拓斯达等东兴科技端侧智能行业报告东兴科技端侧智能行业报告P81.3.1 端侧智能行业空间及展望端侧智能行业空间及展望PC、手机、手机语言学习平台语言学习平台资料来源:AIPC产业白皮书,IDC,东兴证券研究所图图:AI PC:出货量与渗透率齐飞,:出货量与渗透率齐飞,2024成爆发元年成爆发元年AI终端具有广阔市场前景。依托终端具有广阔市场前景。依托PC、手机、可穿戴设备、家居、汽车等多个品类,手机、可穿戴设备、家居、汽车等多个品类,AI终端在短、中、长期均有增长曲线。终端在短、中、长期均有增长曲线。AIPC方面,方面,传统PC渗透率已接近天花板,AIPC带来智能化体验或创造新增长点。IDC 预测,AI PC 在中国 PC 市场中新机的装配比例将在未来几年中快速攀升,将于 2027 年达到 85%,成为 PC 市场主流。随着行业龙头在2024年发布新一代AIPC,2024年AIPC出货量占比将由不足10%跃升过半,成为AI PC爆发元年。AI 手机方面,手机方面,根据中国报告大厅预测,2024年AI手机的渗透率预计将达到16%,预计2026年AI手机出货量超过4.7亿部,渗透率将达到38%,AI大模型与智能手机结合有望驱动新一轮换机周期,引领行业发展趋势。图图:AI手机:伴随手机市场回暖,稳步快速增长手机:伴随手机市场回暖,稳步快速增长资料来源:中国报告大厅,东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P9语言学习平台语言学习平台资料来源:全球AI可穿戴市场报告,东兴证券研究所图图:全球全球AIAI可穿戴设备市场规模(十亿美元)可穿戴设备市场规模(十亿美元)AI可穿戴设备方面,可穿戴设备方面,预计市场规模将从24年的419亿美元增长至28年的1207亿美元,CAGR达30.3%。预测期的预期增长可以归因于消费者对可穿戴设备的兴趣激增、与智能手机的集成增加、医疗保健应用程序的扩展、远程患者监测的增加、生物识别认证的集成、智能服装解决方案的增长以及老年人护理可穿戴设备的开发。预测期内预计的主要趋势包括灵活显示技术的进步、传感器技术进步、小型化技术创新、与AR的集成、人工智能驱动的可穿戴助手以及5G连接的集成。AI智能家居方面,智能家居方面,2023年全球智能家居市场规模达1238亿美元,预计到2032年市场将达3,456亿美元,CAGR为12.1%。在智能手机日益采用、高速互联网的广泛使用、对能源效率的日益关注和技术进步(如物联网和人工智能的整合)的推动下,市场正在经历稳步增长。图图:全球智能家居市场规模预测(十亿美元)全球智能家居市场规模预测(十亿美元)资料来源:全球AI家居市场报告,东兴证券研究所1.3.2 端侧智能行业空间及展望端侧智能行业空间及展望可穿戴设备、家居可穿戴设备、家居东兴科技端侧智能行业报告东兴科技端侧智能行业报告P10语言学习平台语言学习平台AI汽车汽车方面,方面,根据IDC预测,我国乘用车市场中新能源车市场规模将在2028年超过2,300万辆。随着以比亚迪为首的新能源品牌对产品的布局在更加广泛的价位段全面铺开,以及小米、智界等品牌的强势入局,中国乘用车市场电动、智能化的进程继续稳定推进。随着新能源汽车市场规模的增长,依靠汽车供应链厂商使用AI提高生产力、辅助驾驶与智驾发展等因素,AI工业设备方面,工业设备方面,2019年全球制造业人工智能市场规模为81.4亿美元,预计到2032年将达到6951.6亿美元,期间CAGR达37.7%。这一显著增长表明人工智能技术在制造业中的采用不断增加。人工智能技术的进步提高了行业的效率、生产力和决策能力,显著降低人力与管理成本,提升生产效率和生产质量,制造业人工智能渗透率预期短中期内呈指数级上升。当前“工业4.0”概念被逐渐接受,其主张通过信息物理系统实现“智能工厂”,动态配置生产方式,人工智能是实现关键,同时具身智能领域探索逐渐深入,或成为人工智能覆盖制造业全场景的关键技术。亚太地区庞大的制造业将为端侧AI落地提供广阔空间。图图:汽车领域人工智能市场规模(十亿美元)汽车领域人工智能市场规模(十亿美元)资料来源:GMI,东兴证券研究所1.3.3 端侧智能行业空间及展望端侧智能行业空间及展望汽车、工业设备汽车、工业设备图图:亚太地区制造业人工智能市场规模预测亚太地区制造业人工智能市场规模预测资料来源:Fortune Business Insights,东兴证券研究所资料来源:Fortune Business Insights,东兴证券研究所图图:亚太地区具身智能市场规模预测亚太地区具身智能市场规模预测东兴科技端侧智能行业报告东兴科技端侧智能行业报告P11目录目录端侧智能:人与人工智能交互的更优窗口政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道生态效应显著,把握高通、华为两大主线投资建议与风险提示东兴科技端侧智能行业报告东兴科技端侧智能行业报告P12政策文件政策文件主要内容主要内容发布时间发布时间国家层面国家人工智能产业综合标准化体系建设指南(2024版)加强人工智能标准化工作,推动产业高质量发展2024年6月关于打造消费新场景培育消费新增长点的措施打造电子产品消费新场景。加大柔性屏、超级摄影、超级快充、人工智能助手、端侧大模型、跨屏跨端互联等软硬件功能开发,增强人机交互便利性。支持智能穿戴设备在通信娱乐、运动健身、健康监测、移动支付等领域应用,开拓柔性可穿戴、环境自适应智能纺织品应用领域。2024年6月教育部“人工智能赋能行动”促进智能技术与教育教学(AI for education)、科学研究(AI for Science)、社会(AI for Society)的深度融合,为学习型社会、智能教育和数字技术发展提供有效的行动支撑。2024年2月工业和信息化部等七部门关于推动未来产业创新发展的实施意见发展适应通用智能趋势的工业终端产品,支撑工业生产提质增效,赋能新型工业化。发展量大面广、智能便捷、沉浸体验的消费级终端,满足数字生活、数字文化、公共服务等新需求。打造智能适老的医疗健康终端,提升人民群众生命健康质量。突破高级别智能网联汽车、元宇宙入口等具有爆发潜能的超级终端,构筑产业竞争新优势。2024年1月地方层面深圳市推动智能终端产业高质量发展若干措施鼓励智能终端品牌企业、整机代工企业开放供应链、打通上下游,与核心元器件、零部件、模组等上游供应链企业加强合作、联合攻关。2024年5月广东省关于人工智能赋能千行百业的若干措施目标到2027年全省人工智能产业底座进一步夯实,算力规模过60EFLOPS,全国领先的算法体系和算力网络体系基本形成;智能终端产品供给丰富,在手机、计算机、家居、机器人等8大门类,打造百款以上大规模使用的智能终端产品,人工智能核心产业规模过4400亿元。2024年5月杭州市拱墅区与浙大城市学院共建边缘智能创新研究院边缘智能技术能实现数据在本地进行存储、处理,并且可以加入人工智能技术,提高数据隐私和安全性,避免数据传输的瓶颈和延迟。研究院计划通过五年建设,成为国家级科技创新平台,成为支撑技术创新、产业发展和人才培养的新高地。2024年4月2.1 政策端:利好频出,推动行业发展政策端:利好频出,推动行业发展资料来源:中国政府网,新浪财经、教育部、深圳市工信局、广东省政府、杭州市政府、东兴证券研究所表表:端侧智能领域今年中央与地方主要政策及行动端侧智能领域今年中央与地方主要政策及行动东兴科技端侧智能行业报告东兴科技端侧智能行业报告P132.2 技术端:处理器、内存、电池、散热、软件等进步助力端侧技术端:处理器、内存、电池、散热、软件等进步助力端侧AI落地落地项目项目核心创新点核心创新点具体内容具体内容处理器NPU CPU GPU 异构算力方案端侧AI 需要处理器提供算力支持,根据标准,NPU 算力达 40TOPS 才能够在本地部署大模型,异构方案为AI 落地贡献充足算力内存新一代 LPDDR(LPDDR5X/T)本地运行AI 要求更大内存。运行 13B 参数模型需要 16GB 以上内存,三星 LPDDR5X 具有最大 32GB 的内存容量,运行速度达到 10.7GT/s电池更大电池容量、更快充电速度端侧AI 的算力激增导致功耗上升,要求更大容量电池和更快速充电,iPhone 16 Pro Max电池容量已达4685mAh,安卓阵营realme快充速度已上探至 320W散热VC 均热板、石墨烯散热膜端侧AI 运行时处理器能耗高,产生大量热量,要求更高效散热,手机厂商扩大蒸汽室面积,并探索更高效散热方案软件AI OS 系统级接入AI端侧AI 本地部署要求从底层重构操作系统,新一代系统如 HarmonyOS 使AI 能力全面下沉 OS,为上层服务应用提供原子化、控件级AI 能力资料来源:钛媒体、anandtech、快科技、nextpit、intel、华为AI终端白皮书,东兴证券研究所过去,处理器、内存、电池、散热以及软件等因素曾严重限制了端侧智能的发展。过去,处理器、内存、电池、散热以及软件等因素曾严重限制了端侧智能的发展。处理器性能不足,难以快速处理复杂的智能任务;内存容量有限,无法承载大量数据的运算需求;电池续航能力弱,难以支持长时间的智能运行;散热不佳会导致设备过热降频,影响性能发挥;而软件的不完善也使得智能应用的体验大打折扣。但随着技术的不断进步,主要问题正逐步得到解决。如今,强大的处理器能够高效处理各种任务,大容量内存让数据存储和运算更加从容,新型电池技术提升续航能力、加快充电速度,依托VC 均热板、石墨烯散热膜等的散热设计确保设备稳定运行,软件也在不断优化升级,为端侧智能的发展铺平道路。表表:端侧智能层面主要技术进步端侧智能层面主要技术进步东兴科技端侧智能行业报告东兴科技端侧智能行业报告P14硬件方面,硬件方面,NPU异构方案为异构方案为AI PC提供充足算力提供充足算力软件方面,轻量化模型让本地部署成为可能软件方面,轻量化模型让本地部署成为可能异构方案指异构方案指CPU NPU GPU协同运用,提供强劲并行计算能力,以协同运用,提供强劲并行计算能力,以适配本地运行适配本地运行AI的算力需求。的算力需求。NPU是神经网络处理单元,能够快速进行大量矩阵计算,专用于处理神经网络相关任务,如深度学习推断和训练,可作为AI算力的重要来源。根据英特尔定义,AIPC需要满足NPU算力大于40TOPS,才能够胜任本地LLM的运行和训练任务。有厂商表示,大部分AI PC芯片将在今年下半年推出,但搭载新款NPU的笔记本电脑要等到2024年底或2025年初。预计在2025年杀手级应用推出后,将推动软件和硬件性能同步,从而有更大的机会增加AI PC的出货量。厂商厂商芯片名称芯片名称NPU算力算力AMDAMD Ryzen AI 300 50TOPSINTELINTEL Lunar Lake 48TOPS高通Snapdragon X Elite45TOPSAPPLEM438TOPS轻量化模型涌现,轻量化模型涌现,AIGC应用本地运行成为可能。应用本地运行成为可能。传统主流LLM参数量在千亿甚至万亿以上,需要数据中心运行,强能力伴随高能耗,难以落地端侧部署。轻量化模型参数量较少(常见如3B,7B),但经过优化可以完成特定任务,达到低能耗高性能的效果。端侧AI部署需要轻量化模型。目前轻量化模型已有较为成熟的产品:厂商厂商模型名称模型名称参数量参数量MetaLlama-3-8b8bMicrosoftPhi-33.8b、7b、14bGoogleGemma2b、7bMistral Mistral Nemo12b系统级系统级AI应用结合轻量化模型,打造应用结合轻量化模型,打造AI PC核心体验。核心体验。微软Copilot、Apple intelligence等系统级AI应用将会结合大语言模型创造全新人机交互体验,提供颠覆性的功能。2.2.1 PC技术:技术:NPU异构方案异构方案 轻量化模型部署轻量化模型部署资料来源:tomshardware、amd、高通、anandtech、apple、53ai、google、mistral,东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P15 端侧:自研高斯大模型云端:谷歌 Gemini Pro高通:骁龙高通:骁龙8Gen3骁龙8Gen3搭载的NPU性能较上代提升98%,算力达到45TOPS,SoC总算力达到73TOPS支持100亿参数大模型联发科:天玑联发科:天玑9300支持330亿参数大模型支持端侧LoRA内存硬件压缩技术浮点数算力是上代两倍APPLE:A17 proNPU浮点数算力是上代两倍NPU峰值算力为35TOPS2.2.2 手机技术:头部玩家押注手机技术:头部玩家押注AI,端云结合赋能功能落地,端云结合赋能功能落地端云结合是端云结合是AI手机大模型部署的主流解决方案。手机大模型部署的主流解决方案。端侧大模型负责算力要求较低的AI工作,如翻译、图片编辑、本地搜索;头部手机厂商大多选择自研轻量化的本地模型,端侧模型优势点在于低延迟、低成本、信息安全、个性化等,云端大模型负责算力要求高的AI工作,如文生图、视频编辑、在线智慧搜索。手机厂商通常接入参数量巨大的云端大模型,云端模型优势点在于功能强大、算力高,通过端云结合,根据任务要求分配端侧/云端大模型,达到速度与性能相对平衡厂商厂商自研大模型自研大模型三星高斯大模型小米MiLM荣耀魔法大模型vivoAndesLMOPPO蓝心华为盘古大模型GoogleGemini Nano图:三星端云结合示例及主流芯片厂商性能情况图:三星端云结合示例及主流芯片厂商性能情况资料来源:澎湃、钛媒体、腾讯、东兴证券研究所资料来源:芯智讯、量子位、cpumonkey、东兴证券研究所表:主流手机厂商自研大模型情况表:主流手机厂商自研大模型情况东兴科技端侧智能行业报告东兴科技端侧智能行业报告P16AI赋能可穿戴设备,技术创新贡献强劲增长动力。赋能可穿戴设备,技术创新贡献强劲增长动力。AI技术的发展带来可穿戴设备的全新交互方式,例如Meta与雷朋合作开发的智能眼镜通过“AI AR”技术,使用户实现与周围环境的实时交互。同时随着芯片制程进一步精进、能耗降低,AI模型可在体积较小的手表、戒指、吊坠等领域进行部署。助手、通知、健康分析等陪伴类功能丰富了配饰使用场景,提升了设备价值量,助推品类渗透与相应市场的发展。2.2.3 可穿戴设备技术:创新交互方式,提升设备价值量可穿戴设备技术:创新交互方式,提升设备价值量图:全球图:全球AI可穿戴设备可穿戴设备2023年分产品市场份额年分产品市场份额资料来源:fbinsight、东兴证券研究所资料来源:华尔街见闻、eet、搜狐、网易、三星、vivo、东兴证券研究所图:部分图:部分AI可穿戴设备示例可穿戴设备示例类型类型品牌品牌产品名称产品名称产品特点产品特点AI眼镜/头显Meta雷朋合作眼镜使用“AI AR”技术,可实现与周围环境实时交互Orion AR眼镜Meta AI可以在上面运行,理解用户在现实世界中看到的东西,帮助进行有用的可视化Meta Quest 3S VRMeta Quest 3S共享与Quest 3相同的混合现实功能和快速性能,但价格更低AppleApple vision pro内置 M2、R1芯片,将现实世界投影到用户眼中AI手表华为WATCH GT 3 Pro全方位健康监测与AI智能助手VIVOWatch GTAI 速记,AIGC 表盘,AI 提醒AI配饰三星Samsung Ring基于 AI 分析和传感器数据检测健康状态FriendFriend 吊坠全天监听佩戴者,通过 AI 语言模型互动东兴科技端侧智能行业报告东兴科技端侧智能行业报告P17智能家电智能家电如智能洗衣机、智能空调、智能扫地机器人等,可以通过WIFI等方式实现远程控制,互联互通。AI使得智能家电能够以人的需求为中心提供服务。智能安防智能安防如智能门锁、智能监控、智能家庭摄像头等,可以远程控制。AI能够提升安防的可靠性和安全性。智能照明智能照明如智能灯具、智能开关等,AI可以自动识别场景,调控灯具,节能高效。智能环境智能环境各智能家居通过传感器感知家庭环境,做出调整。AI可以使家居调节环境的作用更好发挥。2.2.4 智能家居技术:提升系统性与灵活性智能家居技术:提升系统性与灵活性图:全球智能家居图:全球智能家居2022年分产品市场份额年分产品市场份额资料来源:fbinsight、东兴证券研究所图:图:AI赋能智能家居四大品类,智能家居由单品走向互联赋能智能家居四大品类,智能家居由单品走向互联智能家居市场受到人工智能与物联网技术催化焕发新活力。智能家居市场受到人工智能与物联网技术催化焕发新活力。在传统智能家居时代,智能家居以单品的形式出现为主,此时的智能家居从单品层面有一定的智能性,但是没有形成系统的智能,个性化程度、灵活性不高。但随着人工智能与物联网技术的进步,行业逐步进入AI智能家居时代。AI家居以系统的形式出现为主,通过物联网技术和AI本地部署,实现全部智能家居的统筹配合,达到1 12的效果。资料来源:东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P18硬件:智能汽车搭载高算力芯片硬件:智能汽车搭载高算力芯片随着智能驾驶水平的提高,对算力的要求不断增长;如L5级别的自动驾驶最低算力要求为500TOPS。芯片厂商生产高算力车规芯片,可用于自动驾驶与AI应用,车企推出装配高算力芯片的智能汽车。新能源车企高端产品线存在一定的算力冗余随着新能源汽车对智能化的要求不断提高,将AI大模型接入整车已经成为行业趋势车厂与科技公司均发力自研AI大模型,以期提高智能化水平蔚来蔚来NomiGPT:端云融合架构,多模态感知,支持第三方API调用,搭载情感引擎和长期记忆能力小鹏小鹏AI天玑大模型:集成感知大模型、规控大模型、生活助理、出行助理理想理想Mind GPT:训练数据总量超过3万亿tokens,多模态认知模型,采用taskformer架构广汽广汽广汽AI大模型平台:AI大模型平台成为全场景应用的入口,重塑智能汽车场景交互范式华为华为千悟引擎大模型:以华为云盘古大模型、MindSpore异思计算框架和昇腾AI基础硬件平台等技术为基础底座。百度百度智舱大模型 2.0:采用全新MoE架构,可支持本地化部署,支持车企高效定制品牌特色商汤商汤日日新SenseNova 5.0:基于超过10TB tokens训练、覆盖数千亿量级的逻辑型合成思维链数据科大讯飞科大讯飞星火大模型:基于“讯飞星火 汽车”模式,创造性地将大模型与汽车产业深度整合2.2.5 智能汽车技术:汽车具备充足算力,大模型催化智能汽车技术:汽车具备充足算力,大模型催化AI功能部署功能部署资料来源:小鹏、汽车之心、车家号、蓝鲸财经、东兴证券研究所图:部分厂商车端大模型布局图:部分厂商车端大模型布局资料来源:腾讯、智驾最前沿、东兴证券研究所软件:车厂与科技公司发力车端软件:车厂与科技公司发力车端AI大模型大模型图:部分新能源车型算力图:部分新能源车型算力东兴科技端侧智能行业报告东兴科技端侧智能行业报告P192.2.6 工业设备技术:计算机视觉与自然语言处理是两大核心工业设备技术:计算机视觉与自然语言处理是两大核心计算机视觉赋予工业计算机视觉赋予工业AI观察、检测能力观察、检测能力自然语言处理促进工业自然语言处理促进工业AI更好融入生产与管理更好融入生产与管理计算机视觉(Computer Vision)指让计算机和系统能够从图像、视频和其他视觉输入中获取有意义的信息,并根据该信息采取行动或提供建议工业AI受益于CV技术进步,可以更好的执行工业场景任务1)认知工厂环境,在工厂中移动,与操作对象进行物理互动2)检测并识别产品缺陷,防止瑕疵品流入市场,提高良品率3)收集工厂信息,为ERP系统提供信息流,提高生产效率自然语言处理(NLP)使用机器学习使计算机能够理解人类语言并与人类交流,应用场景广泛工业AI受益于NLP技术进步,可以更好融入生产与管理1)监控、控制生产过程,进行生产规划2)感知能源使用量、员工工时、机器运转数量及效率3)作为生成式AI提供生产管理建议4)作为客户服务助理减少前台人力成本计算机视觉赋予工业计算机视觉赋予工业AI观察、检测能力观察、检测能力自然语言处理促进工业自然语言处理促进工业AI更好融入生产与管理更好融入生产与管理硬件层面硬件层面硬件方面有望保持较高的市场规模硬件方面有望保持较高的市场规模。AI硬件由处理器(通常是GPU)、逻辑电路等组成,运行人工智能软件。人工智能需要独特的处理单元(如NPU等),增加对硬件的需求。且人工智能相关硬件价值量较高,工业AI需求增加有望带来AI硬件量价双升人工智能服务或将呈指数级增长。人工智能服务或将呈指数级增长。人工智能的高度变化的发展和部署正在为人工智能服务创造巨大的机遇。人工智能服务提供集成各种人工智能和认知解决方案和工具来提供服务。随着硬件算力逐渐满足应用层要求,相关软件适配将会成为满足工业定制化要求的刚需图:人工智能有望在软件、硬件两方面渗透制造业图:人工智能有望在软件、硬件两方面渗透制造业图:全球图:全球AI在制造业在制造业2019年分领域市场份额年分领域市场份额资料来源:fbinsight、东兴证券研究所资料来源:东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P202.3 行业催化:苹果、华为、行业催化:苹果、华为、Meta新动作提振市场情绪新动作提振市场情绪苹果苹果WWDC与新品发布会:与新品发布会:发布新一代发布新一代iPhone,全系适配,全系适配Apple Intelligence6月11日,苹果召开WWDC 2024,发布“Apple Intelligence”,苹果走自研本地大模型加云端的策略,本地模型基于苹果强大的 M 系列芯片,超出本地处理能力的问题可以借助云端大模型解决,也可以利用OpenAI 的 GPT-4o。9月10日,苹果召开新品发布会,发布iPhone16系列,硬件方面iPhone 16的芯片升级为3纳米制程A18,A18的“16核神经网络引擎针对大型生成式模型进行优化,运行机器学习模型的速度,相比A16仿生芯片提升最高可达2倍。”资料来源:机器之心pro、财联社、搜狐、华为、东兴证券研究所华为新品发布会与全联接大会:华为新品发布会与全联接大会:发布发布AI赋能三折叠手机,推进全面智能化赋能三折叠手机,推进全面智能化Meta Connect:廉价廉价VR 先进先进AR,AI对设备持续赋能对设备持续赋能9月10日,华为发布全球首部三折叠智能手机Mate XT非凡大师,该手机以三折叠为主要创新点,AI方面,全新升级的小艺深度融合 HarmonyOS,搭载盘古大模型技术,能实现自然流畅对话交互,智能协助完成各种任务9月19-21日,华为全联接大会在上海举行,华为在大会上分享了对于智能化的观察、思考、战略和实践,并从七个方面进一步解读全面智能化(All Intelligence)战略。会上华为还全新发布了系列行业智能化创新产品和解决方案,持续推动AI技术与行业场景深度融合。9月25日,Meta公司在Connect年度开发者大会上尽展AI与VR实力,推出了新一代更便宜的混合现实头显设备Quest 3S、去年推出的Quest 3降价决策,以及首款Orion 全息AR智能眼镜的原型机。Meta还发布了最新多模态LLAMA 3.2人工智能模型,能够同时理解图像和文本。东兴科技端侧智能行业报告东兴科技端侧智能行业报告P21目录目录端侧智能:人与人工智能交互的更优窗口政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道生态效应显著,把握高通、华为两大主线生态效应显著,把握高通、华为两大主线投资建议与风险提示东兴科技端侧智能行业报告东兴科技端侧智能行业报告P22语言学习平台语言学习平台高通(Qualcomm)是全球3G通信技术和无线通信的规则制定者。虽然第三代无线通信的技术CDMA早在越南战争时期就为美军使用,并且全世界掌握该技术的人非常多,但是将CDMA用于手机通信的最早解決方案(CDMA2000)是由高通公司提出,CDMA2000很快便成为了国际标准。高通公司通过专利保护几乎堵死了任何绕过其专利的解决方案,进而达到了主导3G手机市场的目的。3.1 主线一:高通生态主线一:高通生态依托先发优势和专利在依托先发优势和专利在通信芯片方面构筑壁垒通信芯片方面构筑壁垒专注芯片、捆绑销售、乘移动互联网专注芯片、捆绑销售、乘移动互联网发展实现份额提升发展实现份额提升图:高通核心竞争优势图:高通核心竞争优势开放生态合作进一步强化壁垒开放生态合作进一步强化壁垒手机方面技术迁移实现端侧智能优势手机方面技术迁移实现端侧智能优势资料来源:浪潮之巅,高通,东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P23语言学习平台语言学习平台3.1.1 高通依托先发优势和专利在通信芯片方面构筑壁垒高通依托先发优势和专利在通信芯片方面构筑壁垒早期布局与技术积累:早期布局与技术积累:高通成立于 1985 年,在移动通信领域起步早,积极投入到前沿技术的研发中。在2G 时代高通就专注于码分多址(CDMA)技术的研究,为后续的技术发展奠定了坚实基础。这种早期的布局使高通在通信技术的发展潮流中始终处于领先地位,积累了丰富的经验和专利。在 3G 时代,CDMA 技术成为重要标准之一,高通凭借其先发优势和深厚的技术积累,迅速成为该领域的主导者,掌握了大量核心专利。这不仅为其带来丰厚的专利授权收入,还在市场竞争中构筑强大的技术壁垒。强大的专利组合:强大的专利组合:高通在通信芯片领域拥有广泛而强大的专利组合,涵盖了从基础通信原理到具体芯片设计的各个方面。这些专利包括但不限于 CDMA 技术、4G 和 5G 技术中的关键技术,如载波聚合、毫米波技术等,以及 WiFi 和蓝牙等无线连接技术。例如在 5G 领域,高通的专利涵盖了网络架构、信号处理、射频技术等多个关键领域。这使得其他竞争对手在进入通信芯片市场时,很难绕过高通的专利壁垒,不得不支付高额的专利授权费用,从而巩固了高通在通信芯片市场的领导地位。图:图:2022年基带芯片市场份额年基带芯片市场份额资料来源:techinsight,芯智讯,东兴证券研究所资料来源:公司财报,新浪财经,东兴证券研究所图:高通图:高通2024年二季度分业务财务情况年二季度分业务财务情况东兴科技端侧智能行业报告东兴科技端侧智能行业报告P24语言学习平台语言学习平台3.1.2 专注芯片、捆绑销售、乘移动互联网发展实现份额提升专注芯片、捆绑销售、乘移动互联网发展实现份额提升专注芯片研发与创新:专注芯片研发与创新:高通一直专注于通信芯片的研发和创新,不断投入大量资源提升芯片的性能和功能。其芯片产品涵盖了基带芯片、射频芯片、应用处理器芯片等多个领域,为移动设备提供了完整的解决方案。例如高通的骁龙系列芯片以其强大的性能、低功耗和优秀的集成度,受到了全球众多手机厂商的青睐。捆绑销售策略:捆绑销售策略:高通曾采用基带芯片和处理器绑定出货的销售策略。这种策略使得手机厂商在选择高通的基带芯片时,往往也需要同时采购高通的处理器。该战略在高通发展初期一定程度扩大了其市场份额。抓住移动互联网发展机遇:抓住移动互联网发展机遇:随着移动互联网的快速发展,智能手机等移动设备的需求呈爆发式增长。高通敏锐地抓住了这一机遇,不断推出适应市场需求的芯片产品,满足了移动互联网时代对高速数据传输、低功耗和强大处理能力的要求。资料来源:Counterpoint,新浪科技,东兴证券研究所图:图:2023Q1-2024Q2全球智能手机芯片份额全球智能手机芯片份额东兴科技端侧智能行业报告东兴科技端侧智能行业报告P25语言学习平台语言学习平台3.1.3 开放生态合作进一步稳固壁垒开放生态合作进一步稳固壁垒广泛的产业合作:广泛的产业合作:高通积极与全球的运营商、手机厂商、设备供应商、应用开发商等建立广泛的合作关系,共同推动移动通信技术的发展和应用。高通凭借在5G移动连接、高性能低功耗计算以及终端侧AI领域的积累和优势,携手产业伙伴推动5G从手机,扩展到汽车,到PC,到XR,到物联网,到工业互联网等应用。开放的生态合作模式使高通能更好地了解市场需求,及时调整产品策略,提高产品竞争力。例如高通与手机厂商合作,共同开展 5G 试验和商业部署,同时高通还与运营商合作,优化网络性能,提升用户体验。广泛的产业合作不仅扩大了高通的市场影响力,还进一步稳固了其在通信芯片市场的壁垒。同时高通通过技术授权的方式,将其先进的通信技术分享给其他企业,同时也从专利授权中获得了丰厚的收入。资料来源:第十三届中国知识产权年会,东兴证券研究所图:高通底层技术积累图:高通底层技术积累东兴科技端侧智能行业报告东兴科技端侧智能行业报告P26语言学习平台语言学习平台3.1.4 手机方面技术迁移,实现端侧智能优势手机方面技术迁移,实现端侧智能优势高通将在手机通信芯片领域积累的技术优势,逐渐迁移到端侧智能领域,为智能设备提供强大的计算和通信能力。高通将在手机通信芯片领域积累的技术优势,逐渐迁移到端侧智能领域,为智能设备提供强大的计算和通信能力。物联网设备方面高通正在实现XR设备、可穿戴设备和消费电子产品的下一代体验。对于工业物联网,高通正在帮助其客户加快数字化转型战略,通过提供端到端、随时可部署的解决方案来转变、优化和创新客户的业务。汽车方面,高通在座舱域控芯片方面具备绝对优势,今年上半年以66.7%的市场份额稳居国内市场首位,同时随着舱驾一体的发展趋势,其智驾域控方面渗透率也在稳步提升。PC相比较而言是高通的薄弱环节,与英特尔有一定差距,但今年9月4日高通推出骁龙X Plus 8核平台,扩展其骁龙X系列产品组合,布局Windows 11 AIPC领域,同时近期也向竞争对手英特尔发起收购要约,整体体显出高通在PC与端侧智能领域的发展决心。图:高通当前部分业务布局图:高通当前部分业务布局资料来源:公司官网,东兴证券研究所图:图:2024年年1-6月座舱域控芯片装机量排行月座舱域控芯片装机量排行资料来源:盖世汽车,东兴证券研究所图:图:2024年年1-7月智驾域控芯片装机量排行月智驾域控芯片装机量排行资料来源:盖世汽车,东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P27语言学习平台语言学习平台3.2 主线二:华为生态主线二:华为生态华为作为全球领先的ICT(信息与通信)基础设施和智能终端提供商,坚持技术驱动技术驱动,近十年累计投入的研发费用超11100亿元,公司2023年研发费用支出达1647 亿元,占全年收入的23.4%,在全球共持有有效授权专利超过14万件。同时华为围绕鸿蒙、鲲鹏、昇腾、云计算等业务构筑开放生态开放生态,面向生态伙伴和开发者,加速开放平台能力,持续优化开发体验,使能创新,共创价值。截至2023年底,累计发展超过46,000家生态伙伴,开发创新应用超过36,600个,加速金融、能源、交通、制造、医疗、教育等行业创新。技术实力、开放生态与灵活的发展策略为华为在国内乃至全球构造强劲产品力与品牌力。过去五年,华为打造了面向通用计算的鲲鹏和面向AI计算的昇腾两大计算产业,为世界构建新的选择。目前,鲲鹏已经广泛服务于众多行业核心业务场景;openEuler操作系统成为中国新增服务器OS市场份额第一,占比36.8%,全球已服务150多个国家的用户;昇腾打造了开放易用的全系列全流程工具链,加速模型和应用的创新。图:华为个人及家庭业务主要产品图:华为个人及家庭业务主要产品资料来源:华为官网,东兴证券研究所图:华为企业业务主要产品、服务及解决方案图:华为企业业务主要产品、服务及解决方案资料来源:华为官网,东兴证券研究所东兴科技端侧智能行业报告东兴科技端侧智能行业报告P28语言学习平台语言学习平台3.2 华为持续推进“全面智能化”战略华为持续推进“全面智能化”战略华为副董事长徐直军表示人工智能已成为对行业影响最大深远的技术,未来的智能化企业将具备六个A的特征:Adaptive User Experience(自适应体验)、Auto-evolving Products(自演进产品)、Autonomous Operation(自治的运营)、Augmented Workforce(增强的员工)、All-Connected Resources(全量全要素全联接)、以及AI-Native Infrastructure(智能原生基础设施)。华为如何推进“全面智能化(All Intelligence)”战略,包括:架构创新,提供可持续算力解决方案;华为云面向AI全栈升级,赋能行业智能化;构建鸿蒙原生智能,打造全场景智慧体验;以自动驾驶网络,重塑网络体验和运维;打造自动驾驶解决方案,以安全和体验为中心,最终实现无人驾驶;共筑生态,打造统一的开发者平台,实现共赢发展;倡导和践行智能向善,增强人类、社会和环境的福祉。资料来源:华为迈向智能世界白皮书2024,东兴证券研究所图:未来的智能化企业将具备“六个图:未来的智能化企业将具备“六个A”的特征”的特征东兴科技端侧智能行业报告东兴科技端侧智能行业报告P29语言学习平台语言学习平台3.2 华为积极把握生成式华为积极把握生成式 AI 同终端产品深度结合的创新浪潮同终端产品深度结合的创新浪潮端侧端侧智能最终将实现以智能最终将实现以AI为中心的全新操作系统。为中心的全新操作系统。AI 技术在终端产品落地时,一般经历“应用层集成AI”、“系统层融合AI”、“以AI 为中心的全新 OS”三个阶段,从单点特性的智能增强,到AI 能力全面下沉 OS,直至实现以AI为中心的全新 OS。统一的AI 子系统底座使得 OS 各个组件内部和彼此之间都能够灵活高效地使用AI 技术;此外内置于 OS 内的系统级AI Agent 出现,使得原生智能 OS 不仅仅是一个操作系统,更是能够深度理解用户、自主闭环用户任务的、智慧的、常驻的超级智能体。华为通过端云协同构筑真正强大的全局化智能,同时,端云协同一体的芯片、算子、模型的设计,还可以释放更强大的硬件资源。以华为端云协同解决方案为例,AI 计算生态同栈,端云模型同源,为业务带来极致性能体验。资料来源:华为AI终端白皮书,东兴证券研究所图:华为在端侧智能方面进展图:华为在端侧智能方面进展资料来源:华为AI终端白皮书,东兴证券研究所图:华为通过端云协同构筑全局化智能图:华为通过端云协同构筑全局化智能东兴科技端侧智能行业报告东兴科技端侧智能行业报告P30语言学习平台语言学习平台3.2 华为在端侧智能方面保持开放生态华为在端侧智能方面保持开放生态生态在AI 终端中占据着非常重要的一环,推动了应用和服务的多样化发展。通过建立开放的生态系统,开发者可以轻松接入和利用AI 能力,从而快速开发出创新的应用和服务,满足用户的多样化需求。总体上,华为AI 终端基于“分层开放、全流程价值赋能”的原则助力鸿蒙AI 生态开发。资料来源:华为AI终端白皮书,东兴证券研究所图:华为在端侧智能方面保持开放生态图:华为在端侧智能方面保持开放生态资料来源:华为全联接大会,东兴证券研究所图:华为重要合作伙伴图:华为重要合作伙伴东兴科技端侧智能行业报告东兴科技端侧智能行业报告P31目录目录端侧智能:人与人工智能交互的更优窗口政策、技术、需求多维共振叠加新品刺激,行业步入发展快车道生态效应显著,把握高通、华为两大主线投资建议与风险提示投资建议与风险提示东兴科技端侧智能行业报告东兴科技端侧智能行业报告P32投资建议投资建议语言学习平台语言学习平台我们认为随着华为全联接大会、苹果秋季发布会、Meta Connect 2024等大会的召开以及以人工智能为卖点的产品陆续问世,消费者对端侧智能的认知及接受度将逐步提高,具备先发优势及较强产品力的企业将受益行业发展,实现业绩增长。从竞争优势与发展确定性的维度我们推荐高通产业链与华为产业链两条主线高通产业链与华为产业链两条主线,高通方面,高通方面,推荐与其深度绑定、全面合作的中科创达中科创达,同时认为德赛西威、商汤、移远通信、华勤技术德赛西威、商汤、移远通信、华勤技术等公司有望受益于行业发展;华为方面,华为方面,在当前全球环境不确定性加剧、国内推进科技自立自强的大背景下,华为作为国内科技领域的绝对龙头兼具信创与新质生产力发展的双重逻辑,华为的鸿蒙、欧拉操作系统与鲲鹏、昇腾算力基础设施协同加速发展,在该逻辑下,我们认为软通动力、中软国际、科大讯飞、润和软件、拓维信息、常山北明软通动力、中软国际、科大讯飞、润和软件、拓维信息、常山北明等公司有望受益于行业发展。东兴科技端侧智能行业报告东兴科技端侧智能行业报告P33风险提示风险提示行业竞争加剧;行业竞争加剧;海外地缘政治影响;海外地缘政治影响;华为新产品发布节奏低于预期;华为新产品发布节奏低于预期;华为新技术研发进度低于预期;华为新技术研发进度低于预期;人工智能协同作用不及预期等。人工智能协同作用不及预期等。东兴科技端侧智能行业报告东兴科技端侧智能行业报告P34分析师及研究助理简介分析师及研究助理简介分析师简介分析师简介刘航刘航复旦大学工学硕士,2022年6月加入东兴证券研究所,现任电子行业首席分析师兼科技组组长。曾就职于Foundry厂、研究所和券商资管,分别担任工艺集成工程师、研究员和投资经理。刘蒙刘蒙计算机行业分析师,清华五道口金融硕士,2020年加入东兴证券。2021年新浪财经金麒麟计算机行业新锐分析师团队核心成员,覆盖云计算、信息安全、人工智能、元宇宙等细分领域。张永嘉张永嘉计算机行业分析师,对外经济贸易大学金融硕士,2021年加入东兴证券,主要覆盖基础软件、数据要素、金融科技、汽车智能化等板块。石伟晶石伟晶首席分析师,覆盖传媒、互联网、云计算、通信等行业。上海交通大学工学硕士。8 年证券从业经验,曾供职于华创证券、安信证券,2018 年加入东兴证券研究所。分析师承诺分析师承诺负责本研究报告全部或部分内容的每一位证券分析师,在此申明,本报告的观点、逻辑和论据均为分析师本人研究成果,引用的相关信息和文字均已注明出处。本报告依据公开的信息来源,力求清晰、准确地反映分析师本人的研究观点。本人薪酬的任何部分过去不曾与、现在不与,未来也将不会与本报告中的具体推荐或观点直接或间接相关。东兴科技端侧智能行业报告东兴科技端侧智能行业报告P35风险提示及免责声明风险提示及免责声明免责声明免责声明本研究报告由东兴证券股份有限公司研究所撰写,东兴证券股份有限公司是具有合法证券投资咨询业务资格的机构。本研究报告中所引用信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告中的信息或意见并不构成所述证券的买卖出价或征价,投资者据此做出的任何投资决策与本公司和作者无关。我公司及报告作者在自身所知情的范围内,与本报告所评价或推荐的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,我公司及其所属关联机构可能会持有报告中提到的公司所发行的证券头寸并进行交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。本报告版权仅为我公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制和发布。如引用、刊发,需注明出处为东兴证券研究所,且不得对本报告进行有悖原意的引用、删节和修改。本研究报告仅供东兴证券股份有限公司客户和经本公司授权刊载机构的客户使用,未经授权私自刊载研究报告的机构以及其阅读和使用者应慎重使用报告、防止被误导,本公司不承担由于非授权机构私自刊发和非授权客户使用该报告所产生的相关风险和责任。风险提示风险提示本证券研究报告所载的信息、观点、结论等内容仅供投资者决策参考。在任何情况下,本公司证券研究报告均不构成对任何机构和个人的投资建议,市场有风险,投资者在决定投资前,务必要审慎。投资者应自主作出投资决策,自行承担投资风险。东兴科技端侧智能行业报告东兴科技端侧智能行业报告P36行业评级体系行业评级体系公司投资评级公司投资评级(A股市场基准为沪深股市场基准为沪深300指数指数,香港市场基准为恒生指数香港市场基准为恒生指数,美国市场基准为标普美国市场基准为标普500指数指数):以报告日后的6个月内,公司股价相对于同期市场基准指数的表现为标准定义:强烈推荐:相对强于市场基准指数收益率15以上;推荐:相对强于市场基准指数收益率1515之间;中性:相对于市场基准指数收益率介于-5 5之间;回避:相对弱于市场基准指数收益率5以上。行业投资评级行业投资评级(A股市场基准为沪深股市场基准为沪深300指数指数,香港市场基准为恒生指数香港市场基准为恒生指数,美国市场基准为标普美国市场基准为标普500指数指数):以报告日后的6个月内,行业指数相对于同期市场基准指数的表现为标准定义:看好:相对强于市场基准指数收益率5以上;中性:相对于市场基准指数收益率介于-5 5之间;看淡:相对弱于市场基准指数收益率5以上。P37感谢观看,欢迎交流感谢观看,欢迎交流东兴证券研究所东兴证券研究所北京北京上海上海深圳深圳西城区金融大街5号新盛大厦B座16层 虹口区杨树浦路248号瑞丰国际大厦23层 福田区益田路6009号新世界中心46F邮编邮编:100033邮编邮编:200082邮编邮编:518038电话电话:010-66554070电话电话:021-25102800电话电话:0755-83239601传真传真:010-66554008传真传真:021-25102881传真传真:0755-23824526
www.CEC CONTROL ENGINEERING CHINA 1 2024中国工业AI发展洞察与展望白皮书 Insights and Prospects of Industrial AI Development in China White Pape 20242024 年 9 月 独家发布2 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望卷首语今天,席卷而来的 AI 技术浪潮,正在深刻地改变着各行各业的面貌,为国计民生广泛提供支撑的工业领域也不例外。随着计算能力的不断提升、算法的不断优化以及数据获取和处理能力的日益增强,AI 正逐步渗透到工业生产的每一个环节,从制造、物流到维护和质量控制,全面推动着传统工业体系向智能化、自动化的未来模式转型。当前,AI 在制造业中的应用进展可谓日新月异。通过机器学习和数据分析,AI 已经在生产过程实时监控、设备故障预测、生产流程优化等方面得到了诸多应用。例如,通过对传感器数据的分析,AI 可以提前识别出设备的潜在问题,进行预防性维护,减少停机时间,提高生产效率,从而降低人力成本,并提高生产的连续性。除此之外,在物流与供应链、质量控制与检测等生产环节,工业AI 也将大有所为。更让人欣喜的是,AI 不仅在具体的生产环节中发挥着重要作用,还在推动整个工业生态系统转型升级的过程中展现出巨大潜力。通过与物联网(IoT)、云计算、大数据等技术的深度融合,AI 正在构建一个智能化的工业互联网平台,使得设备、系统和人之间的互联互通成为可能。例如,智能工厂中的设备可以通过物联网技术实现互联,实时上传运行数据到云端,由 AI 进行分析和处理,形成闭环的智能管理系统,提升整个生产体系的响应速度和灵活性。当然,我们也必须看到,工业 AI 在带来巨大机遇的同时,也仍有一系列问题亟待解决和改善。首先,面对在安全可靠性及连续性方面具有极高要求的工业场景,如何提高AI 算法的适用性仍然道阻且长。其次,AI 作为一种前沿数字化技术,其应用的普及也天然伴随着对信息数据安全和隐私保护的更高要求。此外,长期来看,AI 的广泛应用,也将对劳动力需求结构产生深远影响,需要社会和产业在技能培训和职业结构转型方面做出相应的调整和转型。不积跬步,无以致千里。尽管发展迅猛,但方兴未艾的工业 AI 的发展仍然处于起步阶段,需要我们不断结合产业实际,持续为其找到更加广阔的发展空间。而面对 AI 带来的深刻变革,广大工业厂商和用户自身亦须不断创新、勇于探索,才能在这场波澜壮阔的工业革命中始终立于不败之地。我们相信,假以时日,工业 AI 必将在新型工业化体系中承担起更加关键的作用,为构建人与科技水乳交融的美好未来而不断作出新的贡献。www.CEC CONTROL ENGINEERING CHINA 3 中国工业AI发展洞察与展望2024 年工业 AI 应用现状与趋势调查今天,随着技术的迅猛发展和创新,AI 技术逐渐开始融入到各种各样的工业场景当中,并逐步实现具体的应用落地。与此同时,越来越多的工业用户也认识到了AI 技术今后在工业领域将要起到的关键作用,并将相关的技术准备或培训等举措提上日程,试图抓住这波创新技术趋势带来的可观机遇。为了让各行各业的广大用户了解 AI 在工业领域的最新发展态势,更好地制定自身在 AI 方面的投资和应用策略,我们面向读者发起了以下这一针对工业 AI 发展现状的问卷调查,并对调研结果加以分析,希望为广大受众提供有益参考,并促进工业 AI 实现更加迅速和精准的发展。本次调查共收回有效问卷共 632 份,参与调查的用户覆盖机械制造、电子制造、汽车制造、食品饮料、冶金、电力、石油、化工、新能源等行业,有行业最终用户(占56%)、系统集成商(28%)和自动化供应商(16%),具有典型的样本分布。问题 1.您所在的企业属于哪一类企业?选项百分比A.机器制造商 21.52%B.生产企业 53.59%C.系统集成商 18.57%D.软件服务商6.33%问题 2.您在公司从事哪一类岗位?选项百分比A.研发人员41.35%B.质量8.44%C.生产运营30.38%D.物流&采购相关5.06%E.战略与决策层7.17%F.市场与销售7.59%问题 3.您对于 AI 的认知是怎样的?4 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望选项百分比A.完全不了解 9.70%B.对 AI 概念有一定了解 65.40%C.用过 GPT 等大模型 13.92%D.会使用机器学习和大数据分析方法 7.59%E.会开发 AI 应用3.38%【问题 1-3 解读】可以看到,借助于今天信息时代的各种传播方式,工业界各个领域、各个岗位的从业人员都已经对工业 AI产生了关注的兴趣,并拥有了不同程度的了解。然而,真正会使用 AI 工具来进行分析和应用开发的人群仍然比例不高。当然我们相信,相对各行各业的社会大众人群而言,工业领域人士深入接触和使用 AI 工具的比例仍然是非常高的,这也让我们看到了工业 AI 未来发展的广阔前景。问题 4.您关注 AI 是出于什么样的目的和需求?选项百分比A.从企业自身的技术战略规划 17.72%B.AI 将成为未来竞争的关键 28.27%C.AI 主要是作为工具24.05%D.AI 将改变产业,必须有技术储备 27.00%E.科研项目与课题申请 2.53%选项百分比A.尚未有相关计划 36.29%B.对 AI 潜力调研阶段 32.91%C.已经在部分应用上对 AI 进行验证21.94%D.AI 已经进入实际现场应用阶段 8.02%E.组建 AI 团队,制定 AI 路线图0.84%F.其它0.42%【问题 4 解读】面对新兴的技术趋势,人们常常会产生一种“害怕错过”(FOM,即 Fear Of Missing)的心态,这种心态会促使人们对新技术进行主动关注和研究。谈到关注 AI 的出发点,28.27%的受访者认为“AI将成为未来竞争的关键”,27%的受访者认为“AI 将改变产业,必须有技术储备”。事实上,这两个选项具有类似的含义,它们均是受访者对 AI 技术抱有 FOM 心态的集中体现,这也是目前一种较为普遍的心态。与此同时,“从企业自身的技术规划”来聚焦 AI 的受访者占比则相对较低,也揭示了国内业界对待 AI 整体略显被动的心态。能够将 AI 和企业自身技术战略规划相结合,在现阶段尤为难得。问题 5.您公司目前在 AI 相关技术研发应用方面的状态是怎样的?选项百分比F.其它0.42%www.CEC CONTROL ENGINEERING CHINA 5 中国工业AI发展洞察与展望【问题 5 解读】目前,有 21.94%受访者的企业已经在部分应用上对 AI 进行了验证,而 AI 进入实际现场应用阶段的受访者所在企业达到了 8.02%。而真正从策略和规划层面出发、组建 AI 团队并制定 AI 路线图的受访者所在企业还仅仅不到 1%。从这一结果可以看到,AI 目前在工业领域的实际现场应用和规模化应用尚处于初始阶段。在此基础上,结合受访者对 AI 的关注都是属于 FOM 阶段,显示出 AI 在工业的应用在整体上仍属于前期了解阶段,并未进入实质性应用阶段。问题 6.您公司目前在对 AI 应用最大的关注点在哪里?选项百分比A.缺陷检测与良率提升 30.80%B.生产调度效率与排程 45.57%C.预测性维护 43.88%D.机器人视觉导引 24.89%E.如何降低人员消耗 29.96%F.降低能耗22.36%G.控制参数优化 20.25%H.其它0.84%【问题 6 解读】关于 AI 的应用场景,选择比例最高的“生产调度与排程”实际上是一个约束条件下的效率最优问题。对于复杂产品、长流程生产而言,排程的准确度、精确度以及时间粒度,都决定了生产系统的效率。在大规模生产阶段,这个排程是很容易实现的;生产排程在今天变得越来越重要的原因,恰恰在于“产品变化”越来越频繁,生产的柔性要求与日俱增。位列其后的两个选项“预测性维护”、“缺陷检测与良率提升”,显然也与工厂对于运行效率和良品率的追求有关,这些仍然是制造业的基准性需求。其它较常见的需求还包括对于人员、能耗以及控制参数进行优化,这些都是企业迫切解决成本效率挑战的体现。问题 7.目前从企业决策的角度,采用 AI 的主要障碍有哪些?选项百分比A.缺乏 AI 与业务/产品技术之间的认知 48.10%B.对 AI 投资回报不清晰,因此无预算支撑 47.68%C.缺乏数据积累来支撑 AI 方案的实现 35.86%D.缺乏数据标准与规范,数据难以支撑 AI 应用32.07%E.没有合适的人才和团队 20.68%F.缺乏针对工业场景的 AI 工具平台19.83%G.对数据安全的忧虑 13.08%H.其它0.42%6 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望【问题 7 解读】任何企业投资研发一个技术应用,都会有清晰的回报需求。对 AI 的投资是否有回报,在很多时候尚无法有效评估,这也是 AI 应用被阻碍的原因之一。同时,企业一旦缺乏 AI 的应用基础,也很难专门为AI 方案进行数据准备,或进行数据治理的规划。“数据治理”本身就是一个随着大数据、信息化、AI 等技术的发展而被关注的话题。显然,大多数企业仍然缺乏对数据治理的基本概念,以及在这方面的专业实践。聚焦于人才、工具平台和数据安全等方面的担忧,同样是 AI 应用的阻碍之一。目前,最为紧俏的人才可能并非负责 AI 编程的技术性人才,而是拥有横向集成能力,从而可以在管理、AI 应用、业务三者之间构建完整关联并制定 AI 战略的管理人才。因此,一旦将 AI 视为企业发展的驱动源或推进器之一,就需要进行有序、有组织的战略规划,而非孤立、随意地开展 AI 方面的工作。要厘清 AI 该如何发展,还需要引入专业的咨询企业,辅助企业来构建数据治理结构、技术战略与路径,以及业务发展的完整框架。问题 8.从技术实现视角,您觉得 AI 应用中的哪些问题比较突出?选项百分比A 数据采集的策略和内容定义 48.52%B.数据清洗与特征提取的难题 37.55%C.语义交互规范24.05%D.合适的算法和模型选择 39.24%【问题 8 解读】从反馈的第一板块来看,数据采集的策略和定义、合适的算法和模型选择、数据清洗与特征提取的难题,这三个问题都与 AI 的工业应用紧密相关,它们共同构成了解决品质、效率、成本等问题的关键。要解决这些问题,需要工程上的拆分,针对品质、效率、成本建立相应的因果、相关模型。首先在因果性的机理模型方面,然后是在相关性的数据建模方面,通过两者的结合,我们可以定义出所需的参数、数据采集的精度、时间粒度、单位、格式,以及选择相应的算法和模型训练数据的基本方法、流程。这样,我们才能更好地利用数据来训练和优化模型,使其成为可用于实际推理的可用模型。语义规范、稳定与可靠、实时性问题是工业 AI 与商业 AI 相比的显著区别点。语义规范是因为在处理“信息”时,如果信息的语义规范标准不统一,处理就会遇到难题。为了解决这个问题,我们可以参考 OPC UA 作为一个广泛被工业应用的语义互操作规范,将其作为与 AI 集成方面的接口。然而,OPC UA 规范的成熟性以及如何构造与其 AI 工具/平台间“简单”的接口也是我们需要考虑的问题。实时性、稳定性是与 AI 构成的应用架构可持续运行的运行时系统相关。在AI应用架构中,从实时的采集、分析、推理构成的工业 AI 闭环中,其架构流程应该是一个自动被构造的过程。控制系统有其自身的运行时系统,那么它与 AI 系统间能否形成匹配的 Runtime 机制?这也是我们需要考虑的问题。总的来说,要解决这些问题并实现 AI 的工业应用,需要制定规范和标准,建立匹配的接口和规范,并确保系统的实时性和稳定性。这对于大型集团企业来说可能选项百分比F.实时性的问题 23.63%G.稳定与可靠性32.07%H.可解释性问题 8.02%I.模型场景复用难题 10.55%J.其它0.42%www.CEC CONTROL ENGINEERING CHINA 7 中国工业AI发展洞察与展望选项百分比A.简单易用,适合工业场景的工具 60.76%B.机理与数据结合 29.11%C.可解释性 AI25.74%D.人-机结合方面的能力 46.41%E.小样本算法与模型 17.72%F.可靠与稳定31.22%G.实时推理 8.44%H.其它0.42%选项百分比A.对物理模型的知识 39.24%B.软件工程规范能力 37.55%C.对 AI 工具和算法的边界的理解49.37%D.对复杂系统问题的拆解与架构能力 52.74%E.产品思维与用户价值理解 31.65%【问题 9 解读】可以看到,大部分受访者认为,简单易用、适合工业场景的工具是工业所需的 AI 关键点,这是符合常识的判断。毕竟,对于生产制造型企业来说,其核心在于自身的业务或产品和技术,而 AI 作为一种辅助工具,必须能够提供一个易用的平台。否则,会给AI的应用带来障碍,因为如果要为企业配置 AI 团队,请一批数据科学、机电工程相关的博士、专家来做这件事情,对大型企业来说可能比较难,更不用说大多数的中小型企业了。在工业 AI 应用中,对于数据采集的配置和定义(可可行,但对于 AI 企业和自动化企业来说,如何实现更为规范和标准的接口,如何自动构造 AI 应用架构,如何确保其可持续运行等问题仍然需要我们进一步探索和研究。问题 9.您认为工业需要什么样的 AI,以匹配工业场景的特殊性?能来自 I/O)、通信网络的配置、数据的清洗、标定、数据特征的定义、训练模型选择及其参数定义、评估、优化等流程中的“可视化”和“提示”,应该有一个能够自动构造、配置、优化的流程型工具,帮助非 AI 专业工程师进行 AI 的开发。对于自动化企业来说,可以在其系统配置 AI 的插件,以便与编程平台进行“耦合”,以实现 AI 任务与控制任务之间的动态交互,或者依据人工确认,构成应用流。人机结合、机理与数据结合也是工业用户希望达到的应用场景。人机结合的目的是挖掘隐藏在人脑中的“经验”这种非显性知识。人机结合也重视发挥人在方向的直觉性判断、非结构性思考方面的能力,同时结合机器本身的“算力”强项来发挥作用。与此同时,机理与数据结合也是工业 AI 比较看重的,出于工业对确定性和可解释性的需求,工业机理更能直观、准确地描述机械、电气、工艺之间的相互作用关系。然而,工业机理模型在准度(相关性的方向性)和对关系描述的精确性方面需要不断的迭代,这时候则需要 AI的数据方法来帮助实现这种迭代。这些结合方式是符合AI 在工业应用的实际情况和需求的。问题 10.培养 AI 人才,应关注哪些关键能力?8 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望【问题 10 解读】在这个问题中,“对复杂系统问题的拆解与架构能力”在 52.74%的反馈者中得到了认同,这表明工业领域的人员对于工业的基本能力需求具有共识。这种能力实际上是通过长期工程开发、实践形成的解决问题的“套路”,即把复杂的、模糊的、不确定的工业现场问题解析为具有确定的、可被测量和控制的独立问题,然后对其进行模块化的开发、测试验证,再进行重组。拆分模块需要具有独立性和完备性,即能够在编程上形成高内聚、低耦合的模块的能力。第二个选项“对 AI 工具和算法边界的理解”,这也是一个重要的能力,它不仅涉及技术视野、格局方面的洞察力,还植根于大量的工业实践。为了不同任务而可选用的 AI 的方法、模型、算法组合非常多样,而且有很多在实践中不断优化的算法。这种理解有助于选对方法和工具,并有效开展工作。对物理模型的理解也属于这个范畴,对物理对象及其数学模型的掌握同样是基本功。除此之外,“软件工程规范”和“产品思维与对客户价值理解”属于业务层面的能力,即对项目经理、产品经理的能力需求。他们需要能够规划整个项目,进度、质量控制,并能够完成自身业务目标或外部客户的应用需求。问题 11.您计划如何实现未来的 AI 战略?选项百分比A.与自动化企业合作 56.54%B.自建团队 15.61%C.与大学合作 11.39%D.与 AI 公司合作16.46%【问题 11 解读】56.54%的受访者选择了与自动化公司合作。这可能与目前自动化企业都在积极推进 AI 战略,同时拥有较好的数据源和对工业机理的理解有关。因此,受访者认为可以与自动化公司在原有的任务基础上进一步加强合作,以将自动化系统升级为更为智能的系统。对于大型企业,或者对于业务转型有清晰理解并已制定了清晰的 AI 发展战略的企业来说,他们可能更倾向自建团队。然而对于那些意愿度不高的企业,可能与大学在工业 AI 方面的表现有关。尽管大学在计算机和电子信息方面有很强的实力,但他们聚焦的商业 AI 方向可能并不适用于工业,这可能是其未被首先考虑的原因之一。问题 12.您如何看待生成式 AI(如 GPT、各类大模型)在工业领域的应用?选项百分比A.还不适合工业应用 9.28%B.可用作辅助编程工具 29.54%C.可用作知识库或智能客服25.32%D.可用作精准分析和预测服务 20.25%选项百分比F.项目质量与进度掌控 13.08%G.其它0.42%www.CEC CONTROL ENGINEERING CHINA 9 中国工业AI发展洞察与展望选项百分比E.可以替代人作智能决策 5.49%F.还不好说10.13%【问题 12 解读】对于大模型的应用,大部分受访者认为它可作为辅助编程工具,这是比较可行的选择。其次,它也被视为一个知识库,便于检索或用于客户服务。这是受访者对AI 的一种普遍认知。至于其能否作为精准分析与预测服务的提供者,例如在预测性维护或质量预测等领域,仍存在一定的争议。与此同时,仍有大约十分之一的人认为它不适合工业应用,尽管这部分观点不能被忽视,但随着时间推移,一些可能出现的实际案例有助于打消这样的顾虑。问题 13.您认为未来几年内 AI 在工业领域得到广泛应用?选项百分比A.1-3 年内 21.10%B.3-5 年内 47.68%C.5-10 年 24.05%D.10 年以后7.17%【问题 13 解读】有接近半数的人倾向于认为 AI 大规模应用将在接下来的 3-5 年里趋于实现,显示出人们更看好中长期规划,而非短期计划。这在一定程度上与技术采用成熟度等级(TRL-Technology Readiness Level)相关,在工业 AI领域,该技术的成熟度尚未达到较高水平,仍处在初步发展阶段。因此,对中长期的应用预期是比较合理的。还有一部分人(超过 31%)将目光投向了未来 5-10年甚至更长远的未来,这部分人对于长期应用 AI 在工业领域抱有很高的期望。总的来说,人们对 AI 在工业领域的应用预期明显更偏向于中长期。【后记】在本次问卷调查的模型设计和收敛过程中,得到了贝加莱工业自动化(中国)有限公司技术传播经理宋华振等专家、学者的支持和指导,在此特别表示感谢!我们衷心地希望,在未来关于工业 AI 的探讨和交流中,能够有更多业界的有识之士集智汇策,共同描绘出工业 AI 发展的美好前景。10 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望工业 AI 应用实践案例施耐德电气在本地生产中压变频器,并提供柜体集成。在变频器上电前,需要进行线路检查,包括柜内器件核查、线缆插接检查、部分位置的万用表通断测量等工作。此前,操作人员在进行相关工作时,需要花费大量时间进行打印、查找、翻阅图纸等准备工作。例如,检查一台中压变频器柜机需要查阅 100 多页图纸,需要 137 分钟以上,且大部分工作依赖于人工视觉检查和手工记录,容易出现误差和漏查。现场操作人员希望通过应用 AI 技术,提高这一过程的自动化水平和准确度。要实现这一应用的落地,需要在以下方面应对挑战。首先,变频器柜的生产分布在不同的岛位,需要在各个岛位均进行部署;且每个订单都有一定的定制性,采用按订单工程(ETO)方式生产,数据库复杂;最后,算法分割要求高,电柜中线缆排列紧密,纵深和朝向不同,存在重叠和遮挡,需要高精度的算法和应用结合,数据标记要求高。施耐德电气部署的中压变频器柜 AI 视频智能检测技术路线中,在智能检测方案设计,分为模型训练和 AI 推理应用两部分。首先,通过对现场的多角度图片进行识别和标记,并在云端进行训练,训练后的结果会推送到工厂本地服务器上。在 AI 模型应用过程中,现场操作员接收到系统中需要进行变频器柜查线的工作请求时,通过平板电脑对现场进行视频拍摄,系统会自动调用边缘侧(EW.服务器上的模型进行元器件识别。如果拍摄质量不佳,系统会提示操作人员重新拍摄。系统获得图像信息后,会自动判断接线结果是否合格并展示识别结果,明确指出操作员需要如何修改线缆接线。这一创新的工业 AI 应用,通过实现云、边、端协同,在平板上集成了订单管理、设计文件自动解析、装配规划引导、装配检查和报告生成等功能。操作人员只需要通过平板拍摄视频,即可自动显示装配错误位置,大幅减少了每台机器上电前的准备时间,提高了数据准确性,帮助工程师更快地完成装配作业。中压变频器柜AI视频智能检测应用案例实际工业应用场景的检验,始终是考验和磨砺新技术的一块“试金石”,对于方兴未艾的工业AI同样如此。在这里,我们尝试以一组采用AI技术对产品进行辅助检测的实际案例为引导,帮助您初探AI在工业领域的典型应用价值。www.CEC CONTROL ENGINEERING CHINA 11 国内某橡胶厂一丁苯橡胶装置氨气制冷压缩机组为某进口品牌大型双螺杆制冷冰机。该机组采用容量调节滑阀和内容积比调节滑阀组合式的连续无级控制方式,原控制方式采用橇装单片机系统,其控制程序具有保密性、画面简单、功能不透明、问题诊断困难等问题,特别是大型双螺杆压缩机特有的内压缩过程内容积比控制技术,更是成为制约控制系统升级改造的一大瓶颈,国内同型号机组的多次改造尝试均未成功。面对这一挑战,中控技术团队针对客户的改造需求,利用工业 AI 建模工具成功解锁了螺杆压缩机内容积比滑块控制的“黑匣子”难题,实现了容量与内容积比双连续无级可调的大型复杂双螺杆压缩机控制技术的突破,彻底解决了大型复杂螺杆压缩机就地控制盘的“黑匣子”与信息孤岛问题。在 此 次 改 造 中,中 控 采 用 T9100 压 缩机 控 制 系 统 替 换 了 原 厂 家 配 套 的 单 片机 就 地 控 制 柜,满 足 了 客 户 对 于 工 厂关 键 机 组 运 行 安 全 性 和 稳 定 性 的 要 求。改造后,系统控制策略清晰、算法透明,有助于客户理解和掌握螺杆压缩机的能量滑阀及内容积比滑块控制功能、调节原理。系统画面美观、功能全面,数据记录与历史趋势完备,提升了客户使用体验,并为机组运行异常原因分析提供了可靠手段。同时,专业控制算法与软件包还实现了螺杆压缩机组的全自动启停控制与高度自动化运行,实现了完全可视化、透明化的机组数字化改造。工业AI助力石化橡胶厂压缩机组“黑匣子”控制系统改造案例加药混凝沉淀是水厂重要的工艺环节,也是保证水质、提高经济效益的关键环节,但在行业内却是难点问题,而破解这一难题的关键在于实现多变量、大滞后、强耦合系统控制。罗克韦尔智能加药投加系统将 AI 与大数据、先进控制深度结合,在提升水质、提高产率、降低能耗、减少污染、保障安全方面优势显著,不仅可根据水质变化对加药量进行实时调节,实现全厂药剂的精确投加,加药量的节省,能有效降低重金属对水的二次污染,保障百姓用水安全。更一改以往依赖人工经验的加药模式,实现无人化、安全、自动加药,同时大大提升水厂的数字化水平。通过大数据 人工智能 先进控制的深度结合,罗克韦尔自动化智能加药投加系统Pavilion MPC 可根据水质变化对加药量进行实时调节,实现全厂药剂的精确投加,加药量的节省,能有效降低重金属对水的二次污染,保障百姓用水安全。该系统一改以往依赖人工经验的加药模式,实现无人化、安全、自动加药,同时大大提升水厂的数字化水平,并在提升水质、提高产率、降低能耗、减少污染、保障安全方面收效显著。以珠海水务集团唐家水厂为例,该水厂负责珠海城区供水,日供水能力可达 12 万吨/日。作为中国首个采用罗克韦尔自动化智能加药投加系统 Pavilion MPC 的自来水厂,唐家水厂出厂水浊度波动减少了 50%,余氯波动减少了 45%,药物节省了 20%以上。此外,受益于这一系统,加药混凝沉淀环节还实现了全自动加药,不需要任何人工介入也能正常工作。智能加药投加系统以AI助力智慧水务12 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望工业 AI 先锋企业一览作为一家全球领先的自动化和数字化解决方案供应商,西门子已在工业 AI 领域耕耘超过 50 年。目前,西门子已经拥有多款应用 AI 技术的产品和方案,并在全球的一些工业场合得到了应用。2024 年 9 月,西门子发布了工业时序数据基础模型。2024 年 4 月,西门子在德国汉诺威展会上,展示了其全球第一款工业工程设计生成式 AI 产品 Industrial Copilot,目前这款工具已经在德国舍弗勒的产线上启用。在中国,西门子本土研发了生成式人工智能产品 SiePA Xssistant 和 ChatGMC。SiePA AI 助手 Xssistant,基于生成式 AI 技术,能够与用户进行实时、自然的交互。无论是问题咨询、任务下达还是状态报告,都能实现快速响应和高效沟通,降低流程工业中用户对 AI 应用(即 SiePA)的入门门槛,实现高效、便捷的设备资产管理。同时基于知识增强的 LLM(Q-R-A 框架),AI 助手Xssistant 具备强化的上下文理解能力、任务解决能力和泛化能力,能够根据领域专业知识为维修工程师生成实用且专业的解决方案。基 于 生 成 式 AI 的 智 能 问 答 助 手ChatGMC,能 够 理 解 并 回 答 用 户 提 出 的GMC 相关产品和方案问题。ChatGMC 通过对 GMC 专有知识库的学习,具备了提供高一致性和较高准确性的技术支持的能力。对于不同客户提出的问题,ChatGMC 都能基于统一的知识库和算法,尽可能提供专业准确的回答,从而确保客户体验的一致性,避免了因人的经验,知识,情绪带来的回答差异。SiePA 是西门子基于 AI&机理模型的设备预测性维护软件平台,融合工业 AI 与行业经验,以机器学习和自然语言处理等先进的人工智能技术为工具,内置常见工业设备模型、AI 模型模版与检测维修措施,帮助企业固化相关经验,建立起一整套完整的预测性运维体系。充分利用工厂的历史数据,对在运行的设备进行状态评估并及时预测预警、智能诊断、提供修复和维修方案。SIMATIC Robot Pick AI 是西门子一款基于深度学习的预训练视觉软件,适用于机器人分拣产品的相关应用领域。部署简单,开箱即用,它能够在运行时对任意物品的吸盘抓取点做出精确可靠的决策,无需额外的基于 CAD 的训练。该软件通过使用标准 API 的用户友好界面,无需额外的开发工作,它能够兼容任意品牌的 6 轴机器人和多种品牌的 3D 相机。并且可快速轻松的集成到 SIMATIC 平台和 TIA Portal 工程框架中。凭借现成的模块化解决方案,使行业合作伙伴能够独立构建新一代高级分拣机器人系统,能够帮助客户提高相关流程的效率,实现成本节约。【西门子】www.CEC CONTROL ENGINEERING CHINA 13 中国工业AI发展洞察与展望作为全球产业技术领导者,施耐德电气时刻关注人工智能技术的发展,并积极推动其在自身和用户侧各个场景中的应用落地。施耐德电气从自身的业务拓展和工厂生产出发,成功落地了知识管理和生产质量检测两大 AI 应用场景。在知识管理的 AI 应用场景当中,施耐德电气的 LEXIUM 18 及伺服控制方案智能问答机器人应用了无监督学习,通过随机森林和聚类算法,对样本资料进行自动分析和归类,并建立在线知识库。在使用过程中,操作员只需在对话框中描述应用场景和现场参数,智能机器人便可自动匹配,并生成 BOM 清单,从而实现快速配置,并助力操作员快速检索错误代码描述和处理方法。在生产质量检测的 AI 应用场景当中,施耐德电气的中压变频器柜 AI 视频智能检测应用可以对现场的多角度图片进行识别和标记,并在云端进行训练;现场操作员接收到系统中需要进行变频器柜查线的工作请求时,通过平板电脑对现场进行拍照,系统会自动调用模型进行元器件识别,自动判断接线结果是否合格,并指导操作员修改线缆接线。此外,施耐德电气针对不同行业用户的需求,通过融合机器视觉、设备根因分析、强化学习、自然语言推理和模式识别等技术,落地五大 AI 应用场景:工艺 AI 优化:在油气化工领域,施耐德电气利用严格机理的数字孪生模型与强化学习应用相结合,帮助用户优化装置操作的标准操作程序(SOP)。通过探索新的操作方式,缩短装置瞬态操作时间,减少产品物料损失和能源消耗。AI 智能报警分析:在化工和电力领域,施耐德电气的智能报警助手 AI 模块,可基于关联分析帮助用户找寻报警根因,并自行生成根因分析策略,帮助操作人员缩短分析和解决问题的时间。设备预测性维护:对于食品饮料、水泥等行业中的大量旋转设备,施耐德电气通过结合振动机理和大数据学习进行联合分析,建立设备正常状态模型,帮助用户提前预警早期故障,避免非计划停机。智能识别软 PLC:在离散生产工厂,施耐德电气通过 EcoStruxure 开放自动化平台能够直接通过 IT 技术集成机器视觉算法,以软 PLC 控制多个设备,从而降低总体硬件成本,减少人工操作,实现自动化判断。公辅设备能源优化:在汽车、数据中心、半导体等行业,施耐德电气基于冷站负荷预测与全局优化控制技术,能够动态调节并优化冷站控制策略,帮助用户实现节能减碳和智能化运营。【施耐德电气】14 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望和利时创建于 1993 年,是全球智能化系统解决方案主力供应商。自创立以来,和利时始终坚持自主创新研发,为用户提供定制化的整体解决方案、稳定可靠的产品和全生命周期的服务,帮助用户提升市场竞争力。依托强有力的产品技术能力,和利时始终引领着国内工业自动化行业的技术发展方向,每年承担工程项目数千项,业务广泛涵盖炼化、化工、精细化工、油气、电力、新能源、食品制药、冶金建材等众多领域。为响应国家双碳战略,培育可持续发展的新质生产力,依托和利时在 AI 技术方面的积极探索和广泛布局,多次成功落地于用户现场。从生产控制、数据监视采集、数字孪生、生产管理等方向不断布局,目前已形成了可为企业转型升级提供支持的 HiaPlant 数智一体化解决方案,以一种模式、形成五大能力、赋能 N 种行业,重构企业“未来核心力”。目前该一体化方案持续深化,成功实现了 AI 技术在生产过程中的多项重要应用,包括预测性维护、生产全局优化、设备全生命周期管理、数字孪生、智慧运营等方面,开发了 AI 大模型、AI 大数据、AI 机器视觉等应用模块。AI 大模型:通过 AI 大模型,运用人工智能技术,实现自动问答、数据分析、自动化决策,提升智能化管理水平,为企业和用户提供高价值服务。AI 大数据:通过 AI 大数据,依托智能模型训练,实现工艺流程优化、故障预测维护、能源管理优化,推动产业升级。AI 机器视觉:通过 AI 机器视觉,融合智能视觉算法与控制技术,赋能 DCS 控制系统,替代人工肉眼观察模式,实现生产设备、环境监测、视觉分析辅助控制,提升技术应用场景精准性。和利时以科技力量助力用户实现高效生产、精益生产和智慧生产,用 AI 技术赋能,形成新质生产力,以用户价值为导向,使工业充满智慧,让运营更加卓越!【和利时】作为工业自动化、信息化和数字化转型领域的全球企业之一,罗克韦尔持续推动工业自动化技术和 AI 模型及应用的创新融合,已将 AI 深度融入 Rockii Net-Zero 净零解决方案等。罗克韦尔也正协同英伟达、微软等伙伴,共同拓展 AI 在制造业中的应用。罗克韦尔 FactoryTalk Analytics LogixAI 软件可帮助 OT(运营技术)专业人员通过 Soft Sensor 应用程序的开箱即用、无代码边缘机器学习功能,提升产品质量和产量。近期,罗克韦尔又宣布将生成式人工智能(GenAI)规范性工单添加至 Fiix 资产风险预测器软件中,进而打造出旗下首款可完整预测并规范维护的解决方案。罗 克 韦 尔 面 向 中 国 市 场 需 求 定 制 的Rockii Net-Zero 净零解决方案,通过充分发挥 AI 潜能,可助力实现更加智能的节能优化分析与运行策略优化,进而达成更加精准且高效的能源管理。同时,罗克韦尔智能加药投加系统(Pavilion MPC)将 AI 与大数据、先进控制深度结合,在提升水质、提高产率、降低能耗、减少污染、保障安全方面优势显著。【罗克韦尔自动化】www.CEC CONTROL ENGINEERING CHINA 15 中国工业AI发展洞察与展望依托在行业知识、数据积累、应用场景和专业算法等领域的优势,中控技术正加快向工业 AI 公司的战略转型,以“AI 安全”“AI 质量”“AI 低碳”“AI 效益”的智能化解决方案,探索工业 AI 创新发展之路。2024 年 6 月,中控技术面向全球重磅推出软件定义、全数字化、云原生的新一代通用控制系统 UCS(Universal Control System)Nyx,彻底颠覆了延续近 50 年的传统集散控制系统的技术架构。同时,Nyx 深度融合了 Al 技术,充分实现数据预测和自适应控制等,大幅提升装置运行的效益,解放生产力。此外,中控技术推出的流程工业首款工业时序大模型 TPT,成为工业数据价值挖掘最强有力的智能引擎。TPT 是基于中控技术自研的生成式 AI 算法框架,以及不同行业海量生产运行、工艺、设备及质量数据等融合训练而成。目前,TPT 已经在氯碱、热电、石化等装置上取得了突破性应用。中控技术还重点投入了“AI 机器人”业务领域,在 2024 年 3 月、8 月分别发布了人形机器人整机领航者 1 号和 2 号。未来。中控技术将不断强化在数字技术尤其是工业AI 领域的产品技术创新能力,赋能全球流程工业用户的数智化转型和可持续发展。【中控技术】贝加莱作为 ABB 机器人离散自动化业务领域机械自动化事业部,一直致力于将前沿技术应用于智能的机器开发。在 2022 年 7月新建成的全球创新中心,就旨在聚焦于 AI技术的研发并将其融入到产品与系统中。贝加莱很早就开始面向数字智能方面的技术布局。早在 2016 年,贝加莱就开始面向未来的数字化集成的通信架构 OPC UA FX的研发,以打造数据高速公路。在控制器方面,贝加莱开始开发基于 Linux PLC,以与智能技术代表的开源社区紧密融合。在其智能机器视觉中也与 AI 芯片厂商及机器视觉软件厂商合作,将深度学习技术融入到智能视觉(SmartCamera)的产品,并与控制与驱动系统形成整体的应用平台。在未来的ACOPOS 驱动系统、Codian 机器人系统、ACOPOS trak和ACOPOS 6D的输送技术中,都将集成 AI 来实现系统的自我优化,变得更为聪明。在最新的工程平台 Automation Studio Copilot 版本中也将会融合生成式 AI用于工程开发的过程,为自动化工程开发效率带来便利。2024 年初,贝加莱收购了一家在过去数年里一直为贝加莱提供 AI 研发服务的 AI 工程公司 Meshmind,彰显了贝加莱在 AI 方面的投资决心。2023 年,贝加莱的企业使命与愿景重新定义为“智能自动化,更美好的未来”。这充分表明贝加莱将智能技术融入自动化,为产业带来更好未来的企业使命。【贝加莱】16 CONTROL ENGINEERING CHINA www.CEC 中国工业AI发展洞察与展望费斯托作为自动化元件供应商深耕自动化各行业多年,与客户语言相通,深刻了解客户的生产工艺流程、挑战和痛点。Festo推出的人工智能解决方案 Festo AX(Festo Automation eXperience)将自动化和行业领域知识与人工智能和高级分析技术相结合,利用人工智能、物联网和边缘计算等技术,使 Festo AX 更加适配各种工业应用场景。Festo AX 可以帮助客户改进维护流程,将以前计划外的工作变成计划内的工作。预测设备故障,及早启动维护流程,避免计划外停机;同时还致力于帮助客户进一步提高产品质量,降低能耗,帮助客户实现可持续发展。近期,费斯托还推出了 Festo AX 平台下的气动执行器预测性标准包,让客户可以自助式实现人工智能预测性维护。目前该软件包在汽车、机床、食品包装行业已获得广泛的使用。AI 模型的引入进一步优化了客户在关键工艺段维护过程。较之前客户在关键工艺段采用的预防性维护,FestoAX 基于过程数据的预测性维护方案真正做到了各元件的物尽其用。后续,费斯托还计划推出基于FestoAX 平台的电动执行器的预测性维护标准包,以及在线实时能耗监测标准包等。【费斯托】研华在人工智能领域的布局由来已久,不仅很早就与英伟达建立了合作关系,还基于英伟达的 GPU 技术形成了从 AI 加速模组、AI 开发套件到工业硬件平台在内的全系列 AI 解决方案。2023 年,AI 大模型浪潮来袭,研华布局英伟达 GPU 全系列计算平台,包括传感器、开发板到 AI 推理系统、边缘云解决方案以及 AI Box 边缘解决方案。当前,研华正积极打造全栈式 AI 产品体系,全面布局 Edge AI 产品,并将这些产品输出到各行各业,为各行各业数智化转型提供源源不断的动力。如今的研华,已经从 AI 模组、AI 板卡、AI 边缘服务器、AI 服务器,乃至行业解决方案进行了全面 AI 化,包括与生态伙伴进行方案联合共创,例如研华携手创新奇智打造的 AIoT 边缘智能解决方案,实现了针对工厂锡渣回收场景的自动安全管控。除去与英伟达、英特尔、AMD 等一直保持深度合作外,研华还将与昇腾联合打造从模组、开发板到 AI 系统的全栈 Edge AI 国产产品体系。2024 年,研 华 正 式 对 外 公 布 了“Platform Orchestration Sector”企业战略,即以全面的硬件产品体系为基础,工业软件、AI 融合为行业 know how 和行业服务载体,产业驱动为导向,最终提供更具行业独有价值的智能化解决方案,并将之作为研华面向当下人工智能时代制定的转型战略。【研华科技】www.CEC CONTROL ENGINEERING CHINA 17 中国工业AI发展洞察与展望AVEVA 是公认的工业人工智能领导者,在提供专用人工智能方面拥有超过 18 年的经验。AVEVA 的人工智能解决方案建立在可信且安全的数据平台上,结合精准聚焦需求的可视化功能来增强企业协作,并拥有无需编程的用户体验,确保了近乎即时的投资回报率。通过提供专用人工智能,AVEVA 在人工智能市场脱颖而出,为工业应用量身定制的解决方案。例如,AVEVA 工业人工智能助手结合了大型语言模型(LLM)、生成式人工智能(GenAI)和正在申请专利的人工智能技术来分析客户数据、发现问题并帮助解决问题。AVEVA 预测分析工具可以最大限度地提高资产可靠性,通过自动模型构建功能减少错误并确保一致性,并实现更快的结果和投资回报。AVEVA 高级分析工具可以通过基于云的无代码功能,实现生产效率最大化,最大限度地减少浪费、优化能源使用并提供最佳工艺条件。AVEVA 视觉 AI 助手可以通过实时摄像头反馈,进行 AI 质量控制和异常检测,并采用深度学习来训练机器学习模型,并提高态势感知能力、设备正常运行时间并防止机器故障。AVEVA 预测性资产优化则可以结合预测分析、实时模拟和优化,大幅降低运营风险。【AVEVA】2024 年 3 月底,东土科技发布国内首个工业 AI 控制器NewPre 3102 智能控制器。东土科技工业 AI 控制系统的成功研发,不仅标志着工业 AI 领域的一个重大突破,也预示着工业生产未来的发展方向。工业 AI 智能机器人控制系统基于东土科技 NewPre 3102 智能控制器打造,此款控制器是国内首个实现工业 AI 的智能控制器,内嵌鸿道 Intewell 工业操作系统和 MaVIEW工业软件,通过 AI 大模型将人类自然语言指令转换成机器人的运动命令,由人类语言来控制机器人工作。这套控制系统基于Intewell 工业操作系统,提供 1ms 控制周期,满足机器人实时运动控制任务。Intewell 工业操作系统为智能控制系统提供了控制、计算和云服务融合统一的承载平台,实现了智能控制器同时隔离运行实时与非实时任务,不仅提升了通信效率,也保障了在严苛的工业环境下的系统稳定性和可靠性。MaVIEW 工业软件则支持逻辑控制、机器人控制多种业务开发,并与具备推理和理解能力的大模型技术相结合,实现了基于语义的实时运动控制。东土智能机器人控制系统使机器人实现了从传统的自动化向智能化的转变,凸显了中国企业的研发能力在工业AI 领域的国际领先地位。【东土科技】18 CONTROL ENGINEERING CHINA www.CEC 足够的数据与基于可靠模型的分析,是任何一项优秀工业 AI 工具的基础,作为全球工业传感领域的专家,ifm 公司拥有天然的技术优势。来自 ifm 公司的 moneo 工业物联网平台提供了一个易操作、高可靠、见效快的工业 AI 创新工具moneo Data Science Toolbox。这款工业 AI 应用兼具人工智能的“亲和力”与工业应用的可靠性,让客户能够快速上手,快速实现灵活、智能、高效、低成本的智能制造目标。moneo Data Science Toolbox 借助人工智能方法,训练基于历史数据的数学模型,并将其用于长期对比测量值和预计目标值。通过额外计算目标变量的动态预期范围,还可以长期评估目标变量的测量行为并自动指示相应的偏差。客户无需数据科学专业知识,通过工具简单的 5 步向导,适合生产和维护经理使用;工具自动提供数据和进行质量检查,无需复杂的数据预处理,并自动建立模型和验证监测精度;客户还可自定义警告和警报,以及设置异常情况的检测灵敏度。【易福门】倍福是一家专注于自动化新技术的德资企业,创立于 1980 年,总部位于德国威尔市。作为全球自动化技术的驱动者,倍福定义了自动化领域的许多标准,是国际标准的制定者和推动者。近期,在快速发展的工业 AI 领域,倍福也进行了一系列创新。例如,倍福为其 TwinCAT XAE 开发环境开发出了一款 TwinCAT Chat 客户端,这样就可以在开发 TwinCAT 项目过程中很方便 地 使 用 OpenAI 公 司 的 ChatGPT 等 大型语言模型(LLM),以提高控制程序的编程效率。它还为直接支持提供了优化潜力。TwinCAT Chat 客户端能够自动完成 AI 支持方式的编程,如创建或添加功能块代码,甚至能够重构优化代码和编写文档。客户端在 TwinCAT XAE 中实现,与各个大型 语 言 模 型(LLM)云(例 如,ChatGPT基于微软的 AzureTM)连接,提供一个用户 界 面,并 通 过 Automation Interface与 PLC 开发环境通信。这可以通过 Visual Studio 中相应的聊天窗口实现,同时特别针对 TwinCAT 3 用户对 LLM 的功能进行了优化,即广泛补充了 TwinCAT 特定的内容。TwinCAT Chat 的开发旨在将 LLM 深度集成到控制开发环境中,与传统的在网页浏览器中使用 ChatGPT 相比,可以为用户带来明显的益处。由于它无缝集成了通信和代码交换,因此能够大大简化开发过程。LLM的基本初始化已专门针对 TwinCAT 的要求进行了定制,因此用户可以直接提出具体问题。此外,生成的代码可以轻松传输,这不仅能够节省开发人员的时间,还能避免手动传输代码时出现的错误。为实现与 TwinCAT Chat 的高效交互,可使用简单的一键式预测请求,这些请求专门用于改进用户的工作流程。目前正在进行的其它开发工作,还包括自动创建 TwinCAT HMI 控件,以及连接各种倍福文档系统的聊天机器人界面。【倍福】20 CONTROL ENGINEERING CHINA www.CEC 扫码关注控制工程网微信 发现更多专业内容扫一扫可下载 本白皮书电子版
2024 年深度行业分析研究报告 目目 录录 1.OpenAI 发布 o1 系列大模型,AI 大模型进入新纪元.4 2.o1-mini 同期发布,低价高速背景下细分领域性能优异.11 3.全新的推理.
36KR RESEARCH2024年具身智能产业发展研究报告大模型赋能,人形机器人引领具身智能新浪潮36氪研究院2024.08236Kr-2024年具身智能产业发展研究报告历经概念萌芽、理论发展、技术突破等发展阶段,具身智能正在逐步走向产业应用。具身智能的产业发展历经多个阶段,自1950年代图灵提出人工智能可能的发展方向为其概念奠定基础后,1980至1990年代经历早期探索与理论发展,罗德尼布鲁克斯和罗尔夫普费弗等人的研究提供了重要理论支撑。2000年代初,具身智能研究开始融合跨学科方法和技术,进入跨学科融合与技术突破阶段。近年来,具身智能受到广泛关注,正逐步走向产业应用。具身智能因技术成熟度差异在商业化落地上存在异步性。在机器人领域,通用型机器人如轮式、四足机器人已凭低成本和广泛适用性在工厂、物流、医疗等领域实现初步商业化。而人形机器人等高端智能体面临更大商业化挑战,高昂的研发成本、复杂的制造工艺及不成熟的市场应用限制了其大规模商业化。专家预测,未来三到五年内人形机器人技术有望实现质的飞跃。人形机器人作为具身智能的典型产品,已在商业化试水阶段,未来五年有望规模化应用。人形机器人在产业应用上取得显著进展,在制造、新能源、医疗等多领域的应用需求不断上升。多家企业已发布人形机器人产品或迭代版本,并取得技术突破。但目前仍面临规模化挑战,这主要归因于技术难度大、制造成本高昂及商业化难度高。业界预测,随技术瓶颈克服、产业链完善及成本降低,人形机器人市场有望快速增长,2035年中国市场规模有望达到3,000亿元*。报告摘要案例分析公司寒武纪专注于人工智能芯片产品的研发与技术创新汇川技术专注于工业自动化控制与驱动技术广和通无线通信模组和AIoT解决方案供应商本末科技专注于直驱电机和机器人整机技术擎朗智能聚焦具身智能服务机器人的商业化应用云迹科技专注于AI、具身智能的研发、应用及平台建设1*数据来源:中国人形机器人产业大会人形机器人产业研究报告,36氪研究院整理*注:案例顺序为按章节及企业首字母排序目录 CONTENTS具身智能产业发展概况定义与研究范畴产业发展历程产业发展现状资本分析01具身智能产业链分析具身智能产业图谱具身智能产业链构成分析02具身智能发展趋势展望跨模态交互自适应学习与人类协作05具身智能主要产品分析人形机器人非人形具身智能产品典型公司分析04具身智能核心零部件与软件集成分析芯片传感器电机(含伺服电机)03AI算法云服务典型公司分析 定义与研究范畴 产业发展历程 产业发展现状 资本分析具身智能产业发展概况01351.1 定义与研究范畴具身智能是一种基于物理身体进行感知和行动的智能系统,强调机器与环境的交互能力根据中国计算机学会(CCF)专家的定义,具身智能(Embodied ArtificialIntelligence,EAI)是指一种基于物理身体进行感知和行动的智能系统,其通过智能体与环境的交互获取信息、理解问题、做出决策并实现行动,从而产生智能行为和适应性。人形机器人作为具身智能的典型代表,被视为实现具身智能的最佳载体之一。人形机器人不仅具备感知和决策能力,还能通过机械臂、轮子等执行器与物理世界互动,完成复杂任务。这种结合感知、决策和行动的能力,正是具身智能的核心特征。此外,由于人类设计的世界主要基于人类的生理结构,人形机器人的外形与人类相仿,具备更多的关节和灵活度,使得其与物理世界互动的隐性成本最小化,能够更自然地融入人类环境并执行各种任务。尽管人形机器人在实现具身智能方面具有显著优势,但并非所有具身智能系统都必须采用人形机器人的形态。具身智能的实现方式多种多样,可以根据具体任务和环境需求选择合适的智能实体形态。例如,在家庭中行驶并与人进行交互的宠物机器人、L4 自动驾驶车等,本质上都具备“具身”和“智能”两种属性。在众多具身智能的实现方式中,基于人形机器人在技术实现、应用前景以及与人类社会的融合潜力等方面的独特优势,本报告将人形机器人作为研究重点。4图示:具身智能的主要产品类型参考资料:36氪研究院根据公开资料整理具身智能机器人自动驾驶载具工业机器人服务机器人人形机器人商用车乘用车具身智能Robotaxi、Robobus、干线物流、末端物流、港口、矿山、环卫等应用场景配送、导览、陪伴、安防等无人机eVTOL61.1 定义与研究范畴具身智能主要依赖于本体、智能体、数据和学习进化框架四大核心要素具身智能作为人工智能领域的一个重要分支,其核心在于智能体通过物理身体与环境的交互来实现感知、理解、决策和行动。一般认为,具身智能包括四大核心要素:本体、智能体、数据和学习进化框架。本体是具身智能的物理基础,承担执行感知和任务的实际功能。本体的设计需广泛考虑环境适应性,包括感知、运动和操作执行能力,同时兼顾成本、可靠性和耐用性。智能体,作为具身于本体之上的智能核心,负责感知、理解、决策和控制等核心工作。通过与环境的交互,智能体获取信息,理解问题,并做出决策,最终控制本体完成任务。其技术实现通常基于深度学习、强化学习等先进算法,能够处理复杂的传感数据,提取信息,并生成控制指令。数据是智能体进行感知、理解和决策的基础,泛化的关键在于数据的质量和数量。学习进化框架则是具身智能实现持续进步和适应性的关键。它允许智能体通过与环境的交互来不断学习新知识、优化决策策略并提高任务执行效率。学习进化框架的技术实现通常包括强化学习、进化算法等多种技术,这些技术使得智能体能够在不断变化的环境中不断适应和进化。5图示:具身智能的四大核心要素参考资料:36氪研究院根据公开资料整理03040201智能体智能体需要能够理解和解释来自环境的复杂信息,以便做出适当响应,涉及机器学习、深度学习、强化学习等技术数据数据可能来自本体的传感器,如摄像头、麦克风、触觉传感器等,也可能来自外部环境的其他数据源本体本体设计需要考虑到智能体的运作环境,人形机器人的本体包括四肢、头部、躯干等,自动驾驶汽车本体则是车辆本身及其传感器和执行机构学习进化框架学习进化框架的设计需要考虑智能体的长期发展目标,以确保其在不断变化的环境中的适应性和竞争力。涉及监督学习、无监督学习、强化学习等算法71.2 产业发展历程具身智能产业历经概念萌芽、理论发展、技术突破等发展阶段,现正逐步走向产业应用具身智能的产业发展历程可以追溯到1950年代的概念萌芽阶段,当时,图灵在其论文中提出了人工智能可能的发展方向,为具身智能的概念奠定了基础。随后,经历了1980年代至1990年代的早期探索与理论发展,罗德尼布鲁克斯和罗尔夫普费弗等人的研究为具身智能提供了重要理论支撑。进入2000年代初,具身智能研究开始融合跨学科的方法和技术,如机构学、机器学习、机器人学等,形成了相对完整的学科分支,标志着其进入了跨学科融合与技术突破阶段。2010年代中期,深度学习技术的快速发展为其注入了新的发展动力。2020年以来,具身智能受到科技界和产业界的广泛关注,众多科技巨头及高等学府纷纷投入相关研究。如今,具身智能作为人工智能的重要分支,正逐步走向产业应用,推动专用机器人向通用机器人发展。61950-1980概念萌芽1950年,艾伦图灵提出人工智能可能的发展方向,为具身智能奠定基础,这被视为具身智能概念的萌芽1981-2000理论发展与早期探索罗德尼布鲁克斯和罗尔夫普费弗等学者提出行为主义智能和身体化智能理论2001-2010跨学科融合与技术突破具身智能研究开始融合跨学科的方法和技术,如机构学、机器学习、机器人学等,形成了相对完整的学科分支2011-2020深度学习推动与快速发展深度学习等技术的快速发展推动了具身智能研究进入新阶段,研究人员开始利用虚拟物理环境和计算能力设计和训练智能系统2021-至今产业应用拓展与持续发展具身智能受到科技界和产业界的广泛关注,微软、谷歌、英伟达等科技巨头以及高等学府开展相关研究。2023年,具身智能作为人工智能发展的一个重要分支,成为科技界的新风向标,人形机器人等具身智能产品开始亮相。未来将推动通用机器人发展和人工智能技术的创新图示:具身智能的产业发展历程参考资料:36氪研究院根据公开资料整理81.3 产业发展现状具身智能产品因技术成熟度差异而存在商业化落地的异步性技术创新是驱动具身智能飞速发展的核心引擎。在深度学习、计算机视觉、自然语言处理及机器人等技术的共同推动下,具身智能在感知、决策和执行等关键环节取得了突破性进展。特别是大模型的崛起,为具身智能赋予了更强大的数据处理与学习能力,使其能够更精准地解析复杂环境并高效响应多样化的任务需求。在硬件方面,尽管我国伺服电机、工业机器人等已具备国际竞争力,但在高性能计算单元、精密传感器及耐用机械结构的研发与集成上,仍存在提升空间。同时,软件算法的持续优化以及软硬件间的协同优化,也是推动具身智能迈向新高度的关键所在。商业化方面,具身智能因技术成熟度差异而存在落地异步性的特点。在机器人领域,一方面,通用型机器人如轮式机器人、四足机器人等,凭借其相对较低的成本和广泛的适用性,已经在工厂、物流、医疗等领域实现了初步商业化应用。这些机器人能够在结构化或半结构化环境中高效完成任务,为企业带来实实在在的效益。另一方面,人形机器人等高端智能体则面临着更大的商业化挑战。尽管其在交互能力、通用性等方面具有显著优势,但高昂的研发成本、复杂的制造工艺以及尚不成熟的市场应用都让其在大规模商业化应用的进程上存在着不确定性。因此,目前人形机器人的主要用途仍局限于展示和科研领域,距离真正的商业化应用还有相当长的距离。业界认为,技术瓶颈是当前人形机器人无法大规模应用的主要原因之一。尽管人工智能技术在近年来取得了显著的进步,但在推动人形机器人全面商业化方面仍未达到临界点。专家预测,未来一到两年内可能会有小范围的技术突破,而三到五年内则有望实现质的飞跃,这将为人形机器人的商业化应用提供有力的技术支撑。在自动驾驶领域,政府大力支持L3及以上自动驾驶系统的商业化应用,特别是在Robotaxi和无人配送等场景中的应用,多个试点项目在智能驾驶示范区内运行。791.3 产业发展现状具身智能技术不断创新,国内外知名企业积极布局具身智能产业在各大企业的推动下正快速发展,技术不断创新,应用场景日益广泛。从软硬件解耦技术到人形机器人的研发与应用,再到与大模型的深度融合,具身智能正逐步成为人工智能领域的重要分支。在2024年世界人工智能大会上,展示了18台高水平的国产人形机器人,代表了当前中国在该技术领域的最高成就。其中,“青龙”作为全尺寸通用人形机器人,首次亮相便受到广泛关注。此外,特斯拉、谷歌、英伟达、OpenAI、小米、优必选、华为、科大讯飞等国内外多家知名企业均在具身智能领域积极布局,并已取得显著进展。8企业名称技术研发市场应用基于大模型研发Open AI大模型研发,如ChatGPT、GPT-4等。这些大模型具备强大的自然语言处理能力和多模态感知能力,为具身智能的发展提供了重要支撑。OpenAI的大模型技术已经广泛应用于多个领域,包括智能客服、内容创作、游戏AI等。通过投资合作等方式,与多家机器人企业合作。谷歌基于大模型进行RT1、RT2等相关探索,风格百花齐放,注重基础技术创新。谷歌的AI技术已经广泛应用于多个行业,包括医疗、金融、教育等。华为华为推出盘古具身智能大模型,并与乐聚机器人公司合作,共同探索“华为盘古大模型 夸父人形机器人”应用场景,打造通用具身智能解决方案,建设“人形机器人 ”开放生态平台人形机器人“夸父”可以识别物品、问答互动、击掌、递水等。除了人形机器人,盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人,让它们帮助人类去从事危险和繁重的工作。科大讯飞推出科大讯飞机器人超脑平台,以视听融合的多模感知交互和基于大模型的机器人大脑,通过软硬件一体的方式构建机器人新交互。科大讯飞的多模态交互系统已被广泛应用于数字人一体机、商用及家用服务机器人等多种设备中,其在智能家居、智慧零售、教育等领域的赋能作用尤为突出。基于硬件研发英伟达依托算力优势构建模型训练和仿真平台,为具身智能创新提供基础设施支持。同时,作为算力底座和通用大脑的提供者,助力其他企业实现具身智能技术的突破和应用。英伟达的GPU芯片和AI计算平台已经广泛应用于多个行业,包括自动驾驶、智能制造、医疗影像分析等。小米在智能驾驶领域投入显著,专注于全栈技术自研,从硬件到软件,从感知系统到决策算法,均坚持自主研发。同时,研发四足机器人和人形仿生机器人CyberOne,并对外投资具身智能公司。支持多种应用场景,如家庭助理、陪伴机器人、教育辅助等。基于自动驾驶研发特斯拉在自动驾驶和智能汽车领域迭代出相对完整的智能系统,并向人形机器人拓展。推出人形机器人“擎天柱”(Optimus)。人形机器人“擎天柱”仍处于研发和测试阶段,尚未大规模商业化应用。但已经展示了在多种场景下的潜力,包括家庭服务、工业生产等。基于人形机器人研发优必选聚焦于人形机器人核心技术的研发,拥有全栈式研发技术,包括机器人运动规划和控制、伺服驱动器、计算机视觉、语音交互、SLAM导航、视觉伺服操作、人机交互、机器人操作系统应用框架ROSA等。优必选的人形机器人已经进入产业化落地阶段,广泛应用于养老、商用服务、教育、家庭陪伴、物流、工业等领域。图示:部分大公司在具身智能领域的主要布局数据来源:36氪研究院根据公开资料整理101.3 产业发展现状具身智能市场规模不断扩大,2026年有望突破万亿规模随着中国科技的飞速发展、数字化转型的加速,以及人工智能技术的不断突破和创新,具身智能的市场规模呈现出显著的增长态势。据36氪研究院测算,具身智能的市场规模已从2018年的2,923亿元增长至2023年的7,487亿元,年复合增长率达到20.7%。这一显著增长不仅反映了技术进步和市场需求的双重驱动,还预示着未来具身智能行业的巨大潜力。从技术层面看,人工智能算法的不断成熟和大模型技术的突破为具身智能的发展提供了强大的技术支撑,使得具身智能可以在更多领域实现深度应用,从而提高生产效率、优化用户体验,进一步推动市场规模的扩大。从市场需求层面看,随着社会对智能化解决方案的需求日益增长,具身智能作为一种创新的技术形态,正逐渐渗透到工业、医疗、物流、交通等多个领域。这种广泛的应用场景将为具身智能带来持续的增长动力。预计未来五年,具身智能的市场规模将持续增长,有望在2026年突破万亿规模。9图示:中国具身智能行业市场规模预测(单位:亿元)数据来源:36氪研究院根据公开资料整理与测算8931,2261,7022,3582,8943,3013,8324,5025,2906,2002,0302,0722,3453,0803,6474,8025,2295,8456,3282018201920202021202220232024e2025e2026e2027e2,9233,2984,0475,4386,5417,4878,6349,73111,13512,528机器人自动驾驶CAGR=20.7GR=17.61.4 资本分析具身智能成为热门赛道,特别是机器人领域,进入发展快车道,资本热度不断上升在AI大模型的带动之下,具身智能正在成为今年最火的赛道之一,特别是机器人领域,进入了发展快车道。据IT桔子数据,2019年2023年,中国机器人行业投融资案例从2019年的37起增长至2023年的103起,投资金额从19.83亿元增长至97.39亿元,年复合增长率为38.8%。2024年1-7月,行业共发生78起投融资案例,投融资金额53.62亿元,预计延续增长态势。从融资轮次来看,机器人行业投资的主流趋势依然倾向于早期阶段,因为相较于成长期,早期投资的项目可选择度更高。但已有一部分企业开始崭露头角,展现出成长态势。值得注意的是,战略投资逐年增多,已由2018年的4%增长至2023年的14%。目前,众多互联网企业及传统企业正跨界涉足机器人领域,它们通过战略投资的方式获取新技术、开拓新市场或强化供应链管理,以期提升自身的竞争力。从单笔融资金额来看,百万级别的事件占比不断被压缩,由2018年的23%降至2023年的12%。同时,单笔交易金额在亿级别的事件在当年的占比不断增加,这表明行业发展逐渐成熟,投资偏好趋向于集中投资优质项目。10图示:2023年机器人行业投融资事件轮次分布和金额区间分布数据来源:IT桔子,36氪研究院整理*注:早期融资包含种子轮、天使轮及 A 轮(含 Pre-A、A、A );成长期为 pre-B 轮、B 轮、B 轮、C 轮、C 轮;中后期为 D 轮至上市前的阶段59.0$.0.0%4.0.0T.02.0%1.0%早期投资成长期投资中后期投资战略投资百万及以下千万级别一至十亿十亿级以上 具身智能产业图谱 具身智能产业链构成分析具身智能产业链分析021113具身智能产业图谱上游基础设施与原材料传感器控制器芯片2.1 具身智能产业图谱12注:具身智能产业图谱由36氪研究院梳理,只列出部分企业为代表,未覆盖全产业中游软件开发与系统集成下游主要产品与应用场景主要产品工业制造服务业医疗康复通信模组能源管理电机(含伺服电机)AI算法操作系统中间件云服务应用场景交通出行公共安全教育娱乐人形机器人非人形具身智能产品14具身智能产业是一个融合了先进技术、复杂系统集成和多元化应用场景的综合性产业。其产业链结构可清晰划分为上游、中游和下游三个部分。上游环节是具身智能产业的基础,主要包括芯片、传感器、控制器、电机(含伺服电机)、通信模组、能源管理等。这些核心组件是构建具身智能所必需的“硬件”基础。其中,芯片作为具身智能的“心脏”,主要提供强大的计算能力,支持复杂的算法运行。传感器则负责收集外部环境的多维数据,如视觉、听觉、触觉等,是实现具身智能感知功能的基础。控制器对传感器收集的数据进行高效处理,并发出精确的控制指令,指导执行机构完成相应的任务动作。电机是将电能转化为机械能的关键部件,驱动各种执行机构的运动,其中伺服电机作为核心部件,根据控制器指令实现对运动的精确控制,完成精准定位和操作。通信模组负责设备之间的数据传输和通信,确保系统各部分之间的协同工作,实现信息的无缝流转。能源管理为整个系统提供稳定的能源供应,包括高性能电池、先进的电源管理系统等。上游环节是整个产业链的基础,为中游和下游提供了必要的硬件支撑。这些基础设施的质量、性能和可靠性直接影响到中游产品的整体性能和下游应用的实际效果。中游环节是产业链的技术核心,涉及AI算法、操作系统、云服务以及中间件的开发与集成。这一环节的工作是将上游的硬件组件“激活”,通过编程和系统集成,使其能够执行复杂的智能任务。AI算法是具身智能的“大脑”,负责处理和分析数据,做出决策;操作系统为智能设备提供统一的软件平台,支持各种应用程序的运行和管理;云计算提供数据存储、处理和分析能力,支持大规模的数据处理和智能应用;中间件则起到连接不同系统和组件的桥梁作用。中游环节是整个产业链的技术核心,不仅负责实现智能设备的各项功能,还为下游应用提供技术支持和解决方案,推动整个产业链的创新和发展。具身智能产业链上游奠定硬件基础,中游打造技术核心2.2 具身智能产业链构成分析1315下游环节是产业链的最终输出端,涵盖了机器人、自动驾驶载具等主要产品,以及这些产品在工业制造、服务业、医疗康复、教育娱乐、交通出行、公共安全等领域的多元化应用场景。这一环节直接面向市场和消费者,是产业链价值实现的最终体现。主要产品方面,机器人占据了重要地位,包括服务机器人、工业机器人、医疗机器人、特种机器人、人形机器人等。这些机器人凭借先进的传感器、算法和控制技术,能够在各种环境中执行复杂任务,不仅提升了服务效率和质量,还推动了制造业自动化水平的提升,并在医疗领域为患者提供了精准的辅助治疗。自动驾驶载具也是重要的一环,其中自动驾驶汽车、无人机和eVTOL尤为突出。自动驾驶汽车利用自主导航和避障技术,提高了交通安全和出行效率,为人们带来了更加便捷的出行体验。无人机则具备垂直起降、悬停、自主飞行等能力,在航拍、物流、农业、救援等领域发挥着重要作用。eVTOL结合了传统航空器的快速性与地面交通工具的便捷性,能够在城市密集区域实现垂直起降,极大地提高了空间利用效率。应用场景方面,具身智能产品广泛应用于多个领域。在工业制造领域,人形机器人和工业机器人等具身智能产品在自动化生产线、智能仓储与物流以及质量控制与检测等环节发挥重要作用,推动制造业转型升级。在服务业领域,酒店、餐饮、零售与电商等行业通过引入智能机器人提升服务效率和客户体验。在医疗康复领域,辅助康复训练机器人的应用,为患者提供了个性化的康复治疗方案和便捷的医疗服务。在教育娱乐领域,教育机器人和娱乐机器人的出现,为学生的学习和休闲生活增添了更多乐趣和创意。在交通出行领域,自动驾驶汽车、无人机和eVTOL的发展正在改变人们的出行方式和物流配送模式。在公共安全领域,机器人产品在应急响应、救援以及安防监控等方面的应用,为社会的安全和稳定提供了有力保障。具身智能产业链下游涵盖多元产品与应用场景,为社会带来广泛价值2.2 具身智能产业链构成分析14 芯片 传感器 伺服电机 AI算法 云服务 典型公司分析具身智能核心零部件与软件集成分析031517具身智能强调智能体与环境之间的物理交互和实时响应,而AI芯片作为实现这一目标的关键,面临着越来越高的算力要求,这主要体现在实时性、复杂性、能效比、可扩展性与灵活性,以及安全性与可靠性等方面。为了满足这些要求,AI芯片设计需要不断创新和优化,以提供更高性能、更低功耗、更灵活可扩展的算力解决方案。现阶段,根据技术架构种类划分,AI芯片主要包括GPGPU、FPGA、以VPU和TPU为代表的ASIC芯片,以及存算一体芯片,这些不同类型的芯片各具特点和优势。其中,GPGPU凭借强大的并行计算能力和高带宽内存,在深度学习推理和训练等计算密集型任务中表现出色;FPGA则以其高灵活性和可重构性,在模型优化加速、物体检测加速等多个领域得到广泛应用;ASIC芯片主要针对特定应用进行定制优化,提供高效的计算和推理能力;而存算一体芯片则通过紧密结合存储和计算单元,能够降低能耗并提高计算效率,特别适用于边缘计算和实时推理任务。具身智能的实时交互与响应,对AI芯片提出更高要求3.1 芯片1601实时性要求具身智能需要实时处理传感器数据,快速做出决策,例如自动驾驶需实时分析摄像头、雷达数据,调整行驶状态,要求芯片具备极高算力,短时间内完成复杂计算任务02复杂性需求具身智能涉及多领域交叉,算法模型复杂,需处理大量数据和参数,深度学习模型广泛应用,需要大量计算资源,芯片算力决定系统支持的算法复杂度和模型精度03能效比考量具身智能常在移动设备或嵌入式系统中运行,功耗有限制,需考虑芯片能效比。高能效比芯片能降低能耗,延长设备使用时间,对提升系统实用性和用户体验具有重要意义04可扩展性与灵活性具身智能产品技术进步和应用场景拓展导致算力需求变化,芯片设计需具备可扩展性和灵活性。模块化设计或先进封装技术可实现算力灵活扩展和性能优化05安全性与可靠性具身智能应用涉及自动驾驶、医疗设备等领域,对安全性有极高要求。芯片作为核心部件,其安全性和可靠性至关重要,需加强芯片的安全防护和可靠性设计,确保系统稳定运行图示:具身智能对芯片算力提出更高的要求数据来源:36氪研究院根据公开资料整理18AI芯片市场竞争激烈,各厂商在技术创新上持续深耕,加速产品迭代,以抢占市场份额。英伟达将GPU架构的更新频率从两年一次加速到一年一次,并计划不断推出新产品,如Blackwell、Blackwell Ultra、Rubin及Rubin Ultra,持续巩固其行业领先地位。AMD和英特尔则分别推出了MI325X、MI350和MI400系列加速器,以及Gaudi 2和Gaudi 3 AI加速器,通过积极的产品更新策略和技术创新,力求在市场中占据优势。除了硬件的产品竞争力,三大巨头还致力于工艺制程、高带宽内存及互联技术等维度的创新。工艺制程方面,采用3纳米工艺,以提升芯片的性能和能效比,并降低功耗。高带宽内存方面,第五代HBM3E已广泛应用于AI芯片中,下一代AI芯片预计将采用第六代HBM4,以满足更高的带宽需求。互联技术方面,为了解决AI芯片之间高效传输数据的问题,纷纷自研互联技术。英伟达的NVLink和AMD的Infinity Fabric就是典型代表,它们通过提供高带宽、低延迟的数据传输能力,提升系统的整体性能。英特尔则继续沿用传统的以太网互联技术,并通过提高带宽来优化数据传输效率。尽管英伟达、AMD、英特尔等巨头在AI芯片市场居于领先地位,但在政策支持与市场需求的双重驱动下,国内AI芯片厂商正在加速布局,力求弯道超车,推动国产替代进程显著加速。华为、地平线等企业在深度学习、自动驾驶等关键领域展现出强劲实力。例如,华为的昇腾910芯片基于7nm增强版工艺,最大功耗为350W,算力可达到256TFOPS;地平线的征程系列芯片已在多家车企实现量产应用。同时,寒武纪的云端AI芯片、黑芝麻的智能座舱芯片等亦表现不俗。此外,亿铸科技、知存科技、苹芯科技、九天睿芯等一批初创公司选择跳脱传统架构,布局存算一体架构等新兴技术,力图填补国内市场空白。预计未来3-5年内,国产AI芯片在算力、能效比等核心指标上有望实现质的飞跃,进一步缩小与国际领先水平的差距。AI芯片市场激烈竞争,国内外厂商加速创新以巩固或抢占市场3.1 芯片1719对于具身智能而言,智能体的力感知能力以及与外部的触觉、视觉、听觉交互能力极为关键,直接影响其可使用范围。力传感器能够测量智能体与环境的接触力和力矩,对于复杂和精细作业至关重要。其中,六维力传感器是力控核心部件,为国产替代重点。六维力传感器技术壁垒和价值量高,国内多家企业,如安培龙、华培动力、东华测试等,正在加速这一产品的研发和生产,并已取得一定成果。触觉传感器模仿生物触觉,提供外界感知,对智能体末端的动作执行和精细操作同样重要。目前特斯拉Optimus Gen2等多个人形机器人手部已明确使用指尖触觉传感器,但技术路线并未统一。IMU惯性传感器能够测量物体的角速度和加速度,对智能体姿态控制和定位导航具有关键作用。目前该领域被国际厂商所垄断,国产替代空间大,国内芯动联科、华依科技、敏芯股份等多家企业正加速研发和生产高性能IMU产品。视觉传感器助力智能体直接获取外部图像信息,以实现模型和软件运行。目前国内企业已具备较高性能的视觉传感器生产能力。具身智能依赖于力感知与多模态交互能力,国内企业正加速研发和生产相关核心传感器3.2 传感器18图示:具身智能主要传感器及发展特点数据来源:36氪研究院根据公开资料整理主要传感器视觉传感器能够获取外界图像信息,并对其进行处理和分析,使智能体具备自主感知和识别环境的能力。3D视觉传感器能够提供更为丰富的空间信息,提高识别精度和交互性;而2D视觉传感器则成本更低,适用于对精度要求不高的场景力传感器测量智能体末端操作器和外部环境相互接触或抓取工件时所承受力和力矩的传感器,对完成复杂、精细的作业和具身智能化起着重要作用。六维力传感器能同时检测三维空间中的全部力信息,测量最为全面,但技术难度和成本也相对较高触觉传感器能够模仿生物触觉,感知外界的压力、温度、形状等物理性质,对于智能体肢体末端精细操作至关重要。压阻式触觉传感器因技术成熟、成本低廉而成为主流,而MEMS压阻式传感器则因其体积小、集成度高而备受关注IMU惯性传感器IMU(惯性测量单元)是一种能够测量物体三轴角速度和加速度的设备,对于智能体姿态控制、定位导航等至关重要。IMU通常由加速度计、陀螺仪和磁力计等组件构成,能够提供全面的运动信息20对于具身智能来说,电机的主要作用是作为执行机构,将智能系统的指令转化为具体的物理动作,实现机器与环境的交互。其中,伺服电机起到关键作用,它不仅是实现机器精确操作和运动控制的核心部件,还通过其高可靠性、稳定性和灵活性为系统的持续运行和智能表现提供有力保障。伺服电机主要分为直流和交流两大类,二者各具特色,适用于不同的应用场景。直流伺服电机具有优良的调速性能和较大的启动转矩,特别适用于需要频繁启动、制动及反转的场景。对于具身智能来说,当机器需要快速而精确的位置调整时,直流伺服电机能迅速响应控制指令,实现精准定位。同时,其控制系统相对简单,维护成本较低,因此成为经济高效的选择。交流伺服电机则以其无电刷和换向器的结构设计著称,这种设计显著提升了电机的可靠性和使用寿命。在具身智能中,交流伺服电机能够长时间地稳定运行,无需频繁维护,能够有效降低整体运营成本。同时,它还具有较高的功率密度和较强的动态响应性能,使得它能够在高速、高精度的运动控制任务中表现出色。伺服电机主要分为直流和交流两大类,二者各具特色,适用于不同的应用场景3.3 电机(含伺服电机)19提升整体系统的智能表现高效的速度与加速度控制高可靠性和稳定性灵活的控制方式精确的位置控制伺服电机的高精度位置控制能力确保具身智能准确无误地执行操作伺服电机与具身智能结合,显著提升智能表现,使机器能更智能地感知环境、做出决策并执行任务伺服电机能实现高效的速度和加速度控制,使具身智能实现快速、平稳的运动控制,满足复杂任务需求伺服电机可与各种控制器和传感器连接。实现复杂的运动控制任务伺服电机采用先进的制造工艺和材料,为具身智能的持续运行提供有力保障伺服电机图示:伺服电机在具身智能中的主要作用数据来源:36氪研究院根据公开资料整理21伺服电机的核心难度,即导致各国技术差距的主要原因,主要在三个方面:电机的基础性研究、高精度伺服驱动器的研发以及编码器的技术。电机的基础性研究涉及电磁学、热力学、材料科学等多个领域,要求深入探索电机的运行机理和性能优化。高精度伺服驱动器的研发则需要解决控制算法、功率放大、信号处理等一系列复杂问题,以实现电机的精确控制。而编码器的技术则是伺服电机实现闭环控制的关键,它要求具备高分辨率、高稳定性和可靠性,以确保电机的位置、速度和加速度等参数能够被准确测量和反馈。这三个方面的技术难度和挑战,共同构成了伺服电机技术的核心壁垒。目前,我国伺服系统市场主要分为日韩品牌、欧美品牌以及国产品牌三大类型。由于伺服系统所需技术水平较高,高端市场长期以来被外资垄断。然而,近年来,国内厂商通过引进国外先进技术并进行消化吸收等策略,持续增强在伺服系统领域的技术研发与生产实力,向中高端产品进军,国产伺服系统的产品品质和技术水准因此得到显著提升,国产替代加速进行。据MIR数据,2023年,通用交流伺服系统国产化率已经超过37%,其中汇川技术的市场份额超23%,是西门子的2倍多。伺服电机技术壁垒较高,国产品牌持续增强技术研发,市场份额实现大幅提升3.3 电机(含伺服电机)20图示:2023年通用交流伺服系统市场份额数据来源:MIR,36氪研究院整理23.0.0%8.0%7.0%7.0%6.0%3.0%3.0%4.0%4.0%3.0.0%汇川西门子三菱安川台达松下电器机电禾川埃斯顿无锡信捷雷赛欧姆龙其他22直驱电机作为伺服技术发展的产物,除了延续伺服电机的优良特性外,还凭借其低速大扭矩、高精度定位、快速响应、结构简单、低损耗、低噪音及易维护等特性,成为具身智能的核心驱动组件。特别是在具身智能机器人领域,准直驱电机对机器人关节系统的革新尤为显著。机器人关节系统作为机器人的动作执行者,直接决定了机器人的运动性能、稳定性和工作效率。准直驱电机的引入,强化了关节系统的减速、传动和扭矩提升能力,实现了机器人动作的高效与低噪,被誉为机器人运动的“心脏”。然而,当前机器人关节模组市场仍存产品定制化导致标准不统一、参数虚标现象普遍等问题,增加了需求方的选购难度,也给行业健康发展带来一定隐患。对此,本末科技推出P10系列准直驱机器人关节模组,2.5Nm/A最高转矩系数为行业树立了新标杆。该模组在核心指标、稳定性、精准度、静音性和通用性上均进行了优化,并通过实际应用验证,广泛适用于机械狗、机械臂、人形机器人、轮足机器人、科技竞赛、实验载台等多个领域,以其卓越的性能和可靠性赢得了市场的广泛认可。直驱电机的应用为机器人关节系统带来了前所未有的变革3.3 电机(含伺服电机)21图示:直驱电机的主要特点与优势数据来源:36氪研究院根据公开资料整理01低速大扭矩直驱电机能够在低速状态下输出大扭矩,满足具身智能系统对驱动力和负载能力的需求,使得机器能够轻松应对各种复杂任务02高精度定位直驱电机通过直接驱动负载减少中间传动环节的误差,实现了高精度定位,使得具身智能得以精确控制位置和轨迹03高响应速度直驱电机的动态响应速度快,能够在短时间内达到所需转速和扭矩,提高系统的灵敏性和反应速度04结构简单直驱电机无需复杂的传动机构,结构紧凑,体积小巧,便于集成到具身智能系统中,降低了系统的复杂性和成本05减小机械损耗由于减少了中间传动环节,直驱电机的机械损耗显著降低,提高了系统的能效和运行稳定性06低噪声直驱电机在运行过程中产生的噪声较低,有助于提升具身智能系统的用户体验和工作环境质量07少维护直驱电机的结构简单且磨损部件少,因此维护成本较低,延长了系统的使用寿命23AI算法,特别是大模型的引入,极大地提升了具身智能的感知精度、决策效率和执行自主性,使其能够更灵活地适应复杂多变的环境,推动智能技术迈向新高度。国内大模型市场竞争激烈,通用与垂类大模型均展现出强大应用潜力3.4 AI算法22图示:大模型对具身智能的主要作用数据来源:36氪研究院根据公开资料整理强大的数据处理和分析能力,精确理解环境传感器数据(如图像、声音),为后续决策和执行提供高质量信息输入显著提升感知精度提高执行自主性在缺乏明确的指令时,根据环境和任务需求自主决策和执行,减少对人类干预的依赖,提升应对突发和复杂环境的能力增强决策效率增强学习和优化能力出色的自然语言处理和模式识别能力,能够快速解析复杂任务指令,生成有效决策方案。减少响应时间,提高任务完成效率和质量通过持续环境交互收集数据,优化内部模型和策略。适应环境变化和任务需求变化,保持竞争力“大模型 具身智能”正处于技术探索的初期阶段,技术路线尚未收敛,但已经展现出诸多潜力与方向。在机器人领域,该技术正引领着任务级交互与自主操作能力的飞跃,推动多机器人协作系统的高效协同,以及长期任务规划与优化的深度探索。而在自动驾驶领域,则聚焦于提升高精度感知与决策能力,强化行为预测与路径规划的精准度,并不断优化系统的安全与鲁棒性设计,以确保行驶的安全性与稳定性。目前,国内公布的大模型数量已超过300个,市场竞争激烈。其中,百度文心一言、阿里云通义、腾讯混元等通用类大模型在自然语言处理方面表现出色,且其应用范围正逐步拓展至多模态交互、知识问答、逻辑推理等多个维度,展现出强大的通用性和扩展性。与此同时,DriveGPT、Apollo ADFM等垂类大模型则更加专注于特定行业或领域的深度赋能,它们已被成功应用于自动驾驶等领域,展现出极高的专业性和应用价值。24具身智能,尤其是涉及执行复杂任务和拥有高级交互能力的具身智能(如人形机器人),需要处理大量的数据和运行复杂的算法。云服务基于云计算技术,能够提供弹性可扩展的计算资源,满足具身智能在处理大规模数据和运行高性能算法时的需求。从整体来看,我国云服务行业持续展现出强劲的活力。根据中国信通院的最新数据,2023年我国云计算市场规模达到了6,165亿元,与去年同期相比实现了35.5%的显著增长。在生成式AI和大模型所带动的算力与应用需求的强劲刺激下,云计算市场规模预计将保持长期稳定的增长态势,有望在2027年突破2.1万亿元大关。在竞争格局方面,阿里云、天翼云、移动云、华为云、腾讯云以及联通云稳居中国公有云IaaS市场份额的前六名。而在公有云PaaS领域,阿里云、百度云、华为云、腾讯云、天翼云和移动云则占据了领先的地位。值得注意的是,受生成式AI和大模型等前沿技术的影响,云计算市场正面临着新的发展机遇。中腰部厂商正积极借助科技平台的优势,强势发力,推动云业务向智能化方向加速转型。我国云服务行业活力强劲,市场规模持续扩大,竞争格局清晰,云业务智能化转型加速3.5 云服务233,2294,5506,1658,37811,78015,98521,40454.4 2140.9 2235.5 2335.9 24e40.6 25e35.7 26e33.9 27e市场规模(亿元)增长率(%)图示:中国云计算市场规模及增速数据来源:中国信息通讯研究院,36氪研究院整理25寒武纪成立于2016年,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片。公司向客户提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。寒武纪的核心竞争力主要体现以下三个方面:1)技术创新。其技术优势在于智能处理器微架构与指令集优化。这些技术对人工智能应用及各类算法进行了优化,使得寒武纪的芯片产品在性能功耗比和性能价格比上具有显著优势。此外,寒武纪针对大模型领域进行了底层硬件架构指令集和基础软件的优化,加速了产品应用的落地。2)软硬件协同。寒武纪能够提供云边端一体、软硬件协同、训练推理融合的系列化智能芯片产品和平台化基础系统软件,以便更好满足不同场景的需求,提高系统的整体性能和效率。3)生态建设。寒武纪构建完善的软硬件生态,提供统一的开发平台和丰富的系统软件支持,并深化产学合作,与多所高校合作开设基于其软硬件平台的人工智能课程,进一步推动生态的发展。寒武纪:专注于人工智能芯片产品的研发与技术创新3.6 典型公司分析2401智能加速卡思元370系列思元290思元270系列02智能加速系统玄思1000智能加速器整机03智能边缘计算模组思元220系列04终端智能处理器IPCambricon-1MCambricon-1H05软件开发平台Cambricon NeuWareMagicMind图示:寒武纪的主要产品技术数据来源:寒武纪官网,36氪研究院整理26汇川技术成立于2003年,聚焦工业领域的自动化、数字化、智能化,专注“信息层、控制层、驱动层、执行层、传感层”核心技术。汇川技术的核心竞争力在于以下三方面:1)技术创新与研发实力。汇川技术高度重视技术创新和研发投入,每年将收入的8%至10%用于研发,这一比例在业界处于较高水平。这种持续的研发投入确保了公司在技术上的领先地位。2)全面的产品线与解决方案。经过20多年的发展,公司已形成通用自动化、新能源汽车、智慧电梯、轨道交通等四大业务板块,并在多个细分领域占据龙头地位。同时,公司的产品广泛应用于新能源汽车、电梯、起重、注塑机等多个领域,能够满足不同客户的需求。此外,汇川技术坚持为客户提供整体解决方案,以及为细分行业的重点客户提供个性化设计,定价也更灵活。3)市场份额与品牌影响力。在工业自动化领域,汇川技术的通用伺服系统、低压变频器、小型PLC等产品在中国市场份额均名列前茅。凭借其卓越的产品性能和服务质量,赢得了广泛的市场认可和品牌影响力。汇川技术:工控龙头,专注于工业自动化控制与驱动技术3.6 典型公司分析25图示:汇川技术的主要产品数据来源:汇川技术官网,36氪研究院整理工业自动化变频器、伺服、电机、气动、传感器、可编程逻辑控制器、IO系统、人机交互、PAC智能控制器、CNC控制器、柜机、工业视觉01能源储能系统、工业电源02工业机器人机器人系统、机器人控制柜、机器人软件、机器人选配件、直线导轨(精密机械)、滚珠丝杠(精密机械)、单轴机器人(精密机械)03工业互联网工业云平台、智能硬件、物联网屏04智能电梯电梯控制柜、电梯一体化控制器、电梯专用变频器、门机一体化控制器、扶梯一体化控制器、电梯单板附件、电梯整机附件05新能源汽车06轨道交通0727广和通成立于1999年,是行业领先的无线通信模组和AIoT解决方案供应商,主要提供融合无线通信模组、物联网应用解决方案在内的一站式服务,致力于将可靠、便捷、安全、智能的无线通信方案普及至每一个物联网场景,为用户带来完美无线体验、丰富智慧生活。无线通信模组作为广和通的核心产品,是其业务发展的基石和主要营收来源。广和通的产品种类覆盖广泛,包括蜂窝通信模组(5G/4G/3G/2G/LPWA)、车规级模组、智能模组、GNSS模组及天线产品等。这些产品广泛应用于云办公、移动宽带、智慧交通、智慧零售、智能机器人等多个领域,极大地推动了各行业的数字化转型。同时,广和通凭借其深厚的技术积累和丰富的行业经验,精准地洞察到了具身智能作为AI领域继大模型之后的又一重要发展趋势,从而在该领域展开了深度的战略布局。广和通根据具身智能行业的特殊需求,针对性地开发及优化算力主控方案(高算力 Linux 边缘侧部署),并推出了具身智能机器人行业级参考设计(传感器 机械臂 算力主控)。此外,广和通还自主研发了具身智能机器人开发平台Fibot,该平台不仅具备强大的感知、定位、导航和动作控制能力,还集成了多种深度学习和强化学习AI算法,能够为客户提供高效、便捷的二次开发环境。广和通:行业领先的无线通信模组和AIoT解决方案供应商,在具身智能领域进行深度布局3.6 典型公司分析26图示:Fibot具身智能机器人开发平台数据来源:广和通,36氪研究院整理执行机械臂机械臂升降结构全向移动底盘示教机械臂算力平台机器人的动作执行机构,用来独立执行各种动作执行机械臂动作模仿学习的教学机构机器人的大脑 小脑机器人的运动机构调节执行机械臂的高度执行夹爪抓取物品目前最大支持3KG示教夹爪28广和通具身智能机器人开发平台Fibot不仅能够满足客户对Mobile ALOHA协同学习与示教操作数据验证的需求,还通过一系列技术创新,极大地提升了机器人在复杂场景下的适应能力。1)高度灵活的开发环境。Fibot通过底盘选配的激光雷达或双目模组,能够实现室内外空间感知、建图、路径规划和动态避障等核心算法的二次开发,为用户提供高度灵活的开发环境。同时,Fibot集成了多种深度学习和强化学习AI算法,结合高效的感知系统与智能决策框架,能够显著提升二次开发的效率,使客户能够更快速、更精准地实现定制化功能。2)创新的全向轮底盘设计。Fibot采用了创新性的全向轮底盘设计,这一设计赋予了机器人在狭窄空间内原地旋转及平移的能力,彻底打破了传统机器人移动方式的局限。无论是复杂的工厂生产线,还是拥挤的城市街道,Fibot都能凭借其卓越的机动性轻松应对,极大拓宽了应用场景。3)可拆卸式训练臂与性能优化。为了进一步提升Fibot的综合性能,广和通采用了可拆卸式训练臂的结构设计,方便客户在完成算法开发后进行实测与部署。相比于原斯坦福Mobile ALOHA方案,Fibot赋予了机械臂更多的自由度及臂展范围,并对机械臂额定负载能力进行了超150%的优化。Fibot凭借卓越的技术性能,已经在多个领域展现出巨大的应用潜力和价值。在智能制造领域,Fibot具身智能机器人不仅能够承担重复性高的生产任务,还能通过自主学习优化生产线流程,提高生产效率和灵活性。在医疗健康领域,高精度机械臂和机械手的应用,可为手术辅助和康复治疗提供有力支持,有效减轻医护人员的工作负担。在灾害救援领域,Fibot具身智能机器人能够进入人类难以到达的区域进行搜救和灾情评估,极大提升救援效率和安全性。未来,随着技术的不断成熟和跨学科融合的日益加深,Fibot具身智能机器人将更加深入地融入人类社会,实现规模化的落地应用,促进社会生产力的跃升,为人们的生活质量带来实质性改善。广和通:具身智能机器人开发平台Fibot凭借其技术优势,在多个领域展现出巨大应用潜力3.6 典型公司分析27 人形机器人 非人形具身智能产品 典型公司分析具身智能主要产品分析042830人形机器人是具备人类外形特征和行动能力的智能机器人。它们以双腿行走,通过手臂和身体的协调来完成各种功能。同时,基于通用型算法和生成式AI,拥有语义理解、人机交互、自主决策等能力,并能通过人机交互实现任务理解与反馈。自2020年以来,人工智能技术快速发展,特别是生成式AI与大模型的崛起,极大地推动了人机交互技术的成熟。这些技术通过融合环境感知、三维仿真、目标识别等先进算法,显著提升了人形机器人在“感知交互规划”三个核心环节的能力,进而提高了其智能化水平,为人形机器人的商业化应用奠定了坚实基础。生成式AI和大模型的崛起极大提升了人形机器人的智能化水平4.1 人形机器人29图示:大模型对人形机器人“感知交互规划”的主要提升作用数据来源:36氪研究院根据公开资料整理大模型感知数据收集与处理:大模型通过处理来自多种传感器的数据,实现对环境的全面感知,为人形机器人提供更加丰富的环境信息环境理解:利用深度学习算法,大模型能够从复杂数据中提取并理解有用信息,这使得人形机器人在执行任务时更加灵活实时反馈:大模型具备高效的推理能力和低延迟的计算性能,能够确保人形机器人在感知到环境变化后迅速做出反应交互自然语言处理:通过自然语言处理技术,大模型使人形机器人能够理解人类的语言指令,并生成更流畅的自然语言回应非语言交互:通过分析表情、手势等非语言行为,大模型能据此生成相应的交互响应,让人形机器人互动更加自然和人性化适应性学习:通过分析用户的反馈和行为数据,模型能够自动调整交互方式,以更好地满足用户需求,提升用户体验规划任务分解与调度:大模型能够将复杂的任务分解为一系列简单的子任务,并根据任务优先级和资源状况进行合理的调度动作生成与优化:大模型根据规划任务路径生成相应的动作指令,并不断试错和优化,使人形机器人完成任务更加精准可靠情景模拟与预测:执行任务时,大模型能够进行情景模拟和预测,提前评估可能出现的风险和挑战,并制定相应的应对策略31人形机器人在工业制造、服务业和家政服务三大领域展现出广阔的应用前景,已经开始进入商业化试水阶段。在工业制造领域,人形机器人在工业制造领域展现出强大的泛用性,能够胜任多种生产任务。例如,比亚迪投资的智元机器人已经能在工厂汽车底盘装配线里拧螺丝,能拿起检测工具,环绕车做外观检测,以及能在实验室做实验。此外,在核电站事故现场、化工厂爆炸区域、矿山救援等高危环境中,人形机器人能够代替人类执行复杂危险的任务,减少人员伤亡,保障人员安全。在服务业,人形机器人可用于客户服务、导购、迎宾等客户服务任务,以及炒菜、做咖啡等餐饮服务,提高作业效率,提升客户体验。例如,Astribot S1机器人能独立完成烹饪、泡茶、乐器演奏等任务。在家政服务领域,随着年轻一代对婚姻和生育观念的转变,未来养老需求将急剧增加。人形机器人不仅能够承担扫地、擦窗、烹饪等家务劳动,还能陪伴老人外出散步,提供情感上的支持和慰藉。例如,Mobile ALOHA被称为“保姆”机器人,不仅能够做出各式菜肴,还能完成浇花、拖地、收纳衣物等复杂家务。人形机器人已开始进入商业化试水阶段,在三大领域应用前景广阔4.1 人形机器人30服务业人形机器人通过个性化服务和低门槛应用场景的推广,提升客户体验工业制造人形机器人能够提升生产效率、保障人员安全并缓解劳动力短缺问题家政服务人形机器人能够满足未来养老需求、提供陪伴与亲和力,并通过低成本与量产策略实现家庭普及图示:人形机器人的主要应用领域数据来源:36氪研究院根据公开资料整理32国内外众多企业纷纷布局人形机器人领域,国内已有数十家企业聚焦人形机器人,不断推出各具特色的产品,以满足不同场景下的需求。这些人形机器人不仅具备高度仿真的身体结构、强大的运动能力和智能感知与交互功能,还在不断迭代与优化中,以适应更加复杂多变的应用场景。以下是对国内外主要人形机器人产品及其应用情况的梳理与介绍。国内外企业竞相研发人形机器人产品,并推动产品的不断升级迭代4.1 人形机器人31图示:国内外主要人形机器人产品及应用情况数据来源:36氪研究院根据公开资料整理(*注:只列出部分企业为代表,未覆盖全产业)企业名称主要代表产品主要产品特点与应用现状国际特斯拉Optimuse采用电机驱动,全身40个执行器,2022年发布后持续迭代更新。据马斯克预计,Optimus将于未来3-5年量产上市,并计划2024年用于特斯拉工厂。波士顿动力Atlas采用电液混合驱动,膝关节扭矩890Nm,运动表现机动灵活,具备翻越障碍物、后空翻等能力。同时Atlas拥有自主步伐规划算法 行为库 模型预测控制等技术,感知、导航功能强大。目标在工业、物流等多样性领域应用。1XEVE人形机器人EVE拥有环境感知交互功能,主要用于物流、零售和安保领域;人形机器人NEO尚在研发中,预计采用无齿轮设计理念,未来将用于物流、制造、操作机械以及清洁整理家务等场景。AgilityDigitDigit主要用于仓库货物搬运、物流配送。Agility在建机器人制造工厂,规划产能10,000 台,2023年底投产,预计2024年可交付第一批Digit,2025年将全面上市。国内傅利叶智能GR-1配置6个RGB摄像头,覆盖机器人周围360度视角,具备端到端的环境感知能力,能够在复杂多变的环境中实现自主导航,高效、安全地执行各种任务,将在医疗康复、家庭服务、接待引导、安防巡检、紧急救援、工业制造等场景应用。开普勒先行者K1采用自研行星滚柱丝杠执行器,集成滚柱丝杠、驱动器、减速器及编码器为一体,最多达40个全身自由度。预计最快在2024年9月量产上市,全球储备客户已经有上百家,不少客户已经达成订购意向。小米CyberOne全尺寸人形仿生设计,具有高情商与情感交互能力、先进的视觉系统、强大的运动能力和全栈自研技术等特点,目前仍处于技术展示和探索阶段,尚未实现量产。优必选Walker系列Walker S搭载了41个高性能伺服关节和多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统。聚焦工业制造、商用服务和家庭陪伴三大应用场景,提升人形机器人工具操作与任务执行能力,已在全球率先与多家车企合作,并进入车厂实训。宇树科技G1全身共具备23-43个关节电机,总自由度超过43个,最大关节扭矩为120N.m,可进行超大角度的关节运动。售价9.9万起,预计2024年开始进行大规模量产。智元机器人远征系列远征A2采用拟人构型与人因设计,提供多模交互与智能体验,可自主移动与可靠行走。双足人形机器人将于2024年10月开始量产,预计每月生产100 台,2024年的出货量预计将达到200台左右。33尽管多家公司已推出人形机器人并取得了显著的技术突破,但现阶段人形机器人仍未能实现大规模应用。这主要归因于技术难度大、制造成本高昂以及商业化难度高。技术方面,人形机器人的设计与制造极其复杂。人形机器人需要设计出既能模仿人体力学结构又能实现灵活运动的骨架和关节系统。这需要精确的机械设计和制造工艺,尤其是在小型化和轻量化的同时保持强度和耐久性。同时,开发高效的驱动装置以提供足够的力量和精度来执行复杂的肢体动作,并确保续航能力强,也是一项巨大挑战。此外,集成高灵敏度和多样化的传感器用于环境感知、物体识别、动态平衡和抓取操作,特别是在复杂和动态环境下精准感知的能力是一大技术难点。制造成本高也是人形机器人普及的一大障碍。人形机器人由伺服电机、减速器等大量高精度部件组成,成本较高。特别是关节部分,人形机器人需要的关节数量远多于工业机器人,关节约占人形机器人制造成本的60p%,一个关节就是一个电机,一只手就能用到20多个关节,导致整体成本显著增加。商业化方面,目前高昂的成本使得普通消费者难以承受,限制了市场的拓展。此外,人形机器人的安全性和可靠性也是市场接受度低的重要影响因素。公众对于这类高科技产品的接受程度,往往受到安全顾虑和伦理问题的制约。人形机器人尚未规模化的难点在于技术难度大、制造成本高和安全顾虑4.1 人形机器人32图示:人形机器人的主要规模化难点数据来源:36氪研究院根据公开资料整理技术难度大复杂的机械设计与制造、高效的驱动与能源管理、高级感知与交互能力、智能算法与决策能力安全顾虑人形机器人的高售价难以被普通消费者接受。人们对于人形机器人的安全性、可靠性等方面也存在担忧制造成本高硬件成本高,关节大约占到人形机器人制造成本的60p%。同时,研发与测试成本高。人形机器人的研发周期长,投入大,且需要不断的测试与优化以确保其性能与稳定性34高能量密度电池是人形机器人实现长时间、高强度工作的基石。相较于传统电池,高能量密度电池能够在更小的体积和重量下储存更多的能量,从而显著延长人形机器人的续航时间,并提升其整体工作效率。柔性电子皮肤则是一种模仿人类皮肤特性的电子传感器系统,具有延展性、自愈能力、高机械韧性和触觉感知能力。对于人形机器人而言,柔性电子皮肤不仅能够增强其触觉感知能力,提高操作精度和安全性,还能通过模拟人类皮肤的触觉反馈,提升人机交互的自然性和沉浸感。这使得人形机器人在医疗护理、康复训练等领域的应用更加贴近人类需求,能够提供更加个性化的服务。脑机接口技术则为人形机器人提供了更直接、更高效的控制方式。该技术通过读取和解码大脑信号,使人类能够直接通过思维来控制人形机器人,进而提高其控制精度和响应速度。元宇宙作为一个虚拟与现实高度融合的数字世界,为人形机器人提供了丰富的虚拟环境和交互场景,能够进一步推动其在感知、控制、交互等方面的技术创新和突破。高能量密度电池、柔性电子皮肤、脑机接口等创新技术将推动人形机器人的进一步发展4.1 人形机器人33图示:创新技术对人形机器人的推动作用数据来源:36氪研究院根据公开资料整理延长续航:为人形机器人提供持久动力,使其在复杂环境中持续执行任务,无需频繁充电或更换电池提升负载能力:随着电池能量增加,人形机器人可以携带更重的工具和设备,执行更多样化的任务促进应用拓展:更强大的续航和负载能力将推动人形机器人在户外探险、灾难救援等更多领域应用高能量密度电池增强触觉感知:柔性电子皮肤使人形机器人能够更精细地感知外界环境,提高操作精度和安全性提升人机交互体验:通过模拟人类皮肤的触觉反馈,能够增强人机交互的自然性和沉浸感拓展应用场景:在医疗护理、康复训练等领域,使人形机器人更加贴近人类需求,提供更加个性化的服务柔性电子皮肤增强控制能力:脑机接口技术使人类能够直接通过思维控制人形机器人,提高控制精度和响应速度促进自主决策:结合人工智能技术,帮助人形机器人做出更加智能的决策拓展应用边界:在医疗康复、无人驾驶等领域,为人形机器人开辟新的应用场景和市场空间脑机接口提升训练效率:在元宇宙中构建虚拟的训练场景和任务环境,可以帮助人形机器人快速适应各种复杂环境和任务需求,提高训练效率和效果。拓展应用场景:虚拟娱乐、远程教育、远程医疗等促进技术创新:元宇宙的发展将推动人形机器人在感知、控制、交互等方面的技术创新和突破元宇宙352023年至2024年,人形机器人产业迎来投融资热潮,投融资数量和总金额显著增长,显示出资本市场对该领域的浓厚兴趣与高度认可。据IT桔子数据,2023年人形机器人产业共发生22起投资事件,已披露的融资总额高达54.61亿元。而2024年仅前6个月,人形机器人领域投资数量已经达到8起,已披露的融资金额为15.9亿元。值得注意的是,车企作为重要参与者,凭借与人形机器人在技术上的共通性和供应链优势,正通过战略投资的方式在人形机器人领域加速布局。穿透人形机器人企业的背后投资方,可以看到多家车企的身影。例如,在国际领域,业界知名的波士顿动力是现代汽车旗下的人形机器人公司。而在国内,这股投资热潮同样高涨。例如,上汽集团通过旗下的私募股权投资平台尚颀资本,领投了逐际动力的A轮战略融资。此外,比亚迪、北汽集团等车企旗下相关机构也对人形机器人企业进行了投资。例如,在人形机器人企业上海智元新创技术有限公司的股东中,就有比亚迪的身影。此外,在银河通用机器人的天使轮融资中,北汽产投也参与其中。在千亿级蓝海市场之下,资本正向人形机器人赛道加速汇聚4.1 人形机器人34图示:中国人形机器人投融资数据数据来源:IT桔子,36氪研究院整理(*注:2024年数据截止为2024年6月)64922854.66.020204.020219.02022202315.92024H1投资数量投资金额(亿元)车企名称人形机器人投资情况比亚迪2023年8月,比亚迪投资智元机器人,缴出资额约191.50万元,持有智元机器人3.76%股权,为该公司第7大股东。上汽集团2024年7月,上汽集团通过其旗下私募股权投资平台尚颀资本,领投了对逐际动力公司的A轮战略融资。北汽集团通过北汽集团旗下的北汽产投对外投资了帕西尼感知科技、银河机器人、智元机器人等公司。奇瑞汽车2024年4月,与AI公司Aimoga共同研发人形机器人Mornine。图示:车企投资人形机器人的主要情况数据来源:36氪研究院根据公开资料整理36除了吸引资本和车企的关注,今年以来,地方政府也在人形机器人领域重点加码。多地纷纷出台政策,以支持人形机器人产业的创新发展。例如,山东省在4月发布山东省促进人形机器人产业创新发展实施方案(20242027年),旨在到2027年显著提升人形机器人技术创新能力,使综合实力达到全国先进水平。5月,安徽省公布了安徽省人形机器人产业发展行动计划(20242027年)(征求意见稿),目标是在2030年建成国内具有重要影响力的人形机器人产业发展高地。除了政策扶持,地方政府还积极行动,相继成立人形机器人产业创新中心。例如,浙江人形机器人创新中心在今年3月启动并发布了相关产品;5月,全国首个国家地方共建人形机器人创新中心在上海市浦东新区揭牌成立;7月,安徽省也在合肥市举行了人形机器人产业创新中心的成立大会。这些举措不仅展示了地方政府对人形机器人产业发展的高度重视,也预示着人形机器人产业将迎来一个快速发展的新阶段。地方政府出台政策并成立产业创新中心,加码人形机器人领域4.1 人形机器人35图示:各地人形机器人产业创新中心数据来源:36氪研究院根据公开资料整理成立时间人形机器人产业创新中心主要介绍2023年11月北京人形机器人创新中心北京人形机器人创新中心将面向未来,打造全球首个通用人形机器人“硬件母平台”,首个大模型 开源运控系统“软件母平台”。围绕行业亟待解决的关键共性问题,开展通用人形机器人本体原型、人形机器人通用大模型、运控系统、工具链、开源OS及开发者社区等5项重点任务攻关。2024年3月浙江人形机器人创新中心浙江人形机器人创新中心由宁波市人民政府与浙江大学智能系统与控制研究所的熊蓉教授团队联合共建,以建成一个重大高能级创新平台为目标,重点开展人形机器人智能感控技术研究和整机系统研发,全力打造集人形机器人技术研发、成果转化、人才培养及产业发展、产业辐射于一体的综合性创新平台。2024年5月上海人形机器人制造业创新中心上海人形机器人制造业创新中心是由工信部和上海市政府共同授牌的国家地方共建人形机器人创新中心。根据合作协议,部市双方将深化完善合作机制,聚焦上海建设“五个中心”重要使命,着力强化“四大功能”,进一步支持上海加快发展新质生产力、大力推进新型工业化、着力构建现代化产业体系,支持上海建设三大先导产业高地、打造制造业重点产业集群、创建关键产业链平台载体等,加快推动上海制造业高质量发展。2014年6月安徽省人形机器人产业创新中心安徽省人形机器人产业创新中心,是由江淮前沿技术协同创新中心牵头,联合中国科大先研院、合肥工业大学、科大讯飞、蔚来汽车科技(安徽)有限公司等13家单位,建设集研究、设计、评估与市场一体化的产业创新平台。2024年7月成都人形机器人创新中心成都人形机器人创新中心是中西部首个人形机器人创新中心,将专注于人形机器人的研发、设计、测试、产出,并计划在2024年年内推出全国首个带“大脑”的人形机器人整机产品。“创新中心首批人才专家团队今天正式登岛办公,进行前期的技术研发等相关工作,为创新中心场地的正式落成和持续运营做好前期准备。37目前,人形机器人还处于产业化初期,市场规模主要由产品技术的进步速度、大规模商用进程和下游渗透率决定。可以预见,一旦通过产业链优势实现工程化的成本控制,人形机器人产业将迎来规模化发展的拐点。一方面,产业链的优化和成本控制将能够有效降低制造成本,提升人形机器人在市场上的竞争力,这将进一步激发市场需求,促使应用场景不断拓宽,满足更多领域的需求。另一方面,同时,随着人形机器人技术的不断成熟,市场接受度将进一步提高,原有产业的应用渗透率也将逐步提升。在政府政策引导和资本市场支持的共同作用下,人形机器人产业将迎来快速发展的新阶段。随着技术瓶颈逐步克服、产业链不断完善以及成本的进一步降低,人形机器人有望在未来五年逐步实现规模化应用,迎来市场规模的爆发式增长。中国人形机器人产业大会上发布的人形机器人产业研究报告预测,2024年中国人形机器人市场规模约27.6亿元,2029年将达到750亿元,占据世界总量的32.7%,位居世界第一,到2035年有望达到3,000亿元的规模。人形机器人规模化拐点在于产业链优化与成本控制,预计未来五年将迎来爆发式增长4.1 人形机器人36图示:中国人形机器人的市场规模(单位:亿元)数据来源:36氪研究院根据公开资料整理27.6750.03,000.02024e2029e2035eCAGR=53.18配送机器人是一种用于自动化配送和送货的机器人系统。它们通过集成先进的感知、导航和控制技术,能够在室内或室外环境中自主导航,识别障碍物,规划最佳路径,并安全高效地将货物从起始地点运送到目的地。随着技术的不断进步,配送机器人的应用场景已从最初的快递配送扩展到外卖配送、零售配送、物流仓储等多个领域,为各行各业提供便利和效率。随着市场规模的扩大,配送机器人行业的竞争也日益激烈。主要竞争者包括三类:1)互联网企业,如阿里、美团、京东等,它们依托自身的业务需求和资本积累,较早开始进行自动驾驶技术研发,并形成了无人配送特色模式,例如阿里的“小蛮驴”物流机器人;2)物流机器人技术企业,如海康机器人、Geek 、快仓等,它们专注于物流机器人技术,通过技术创新和市场拓展在行业中建立了良好的品牌声誉;3)传统制造业企业,如娃哈哈等,也开始涉足配送机器人领域,通过跨界合作或自主研发,推出用于提升自身生产线效率和适应市场需求的产品。配送机器人:应用场景不断扩展,市场竞争激烈,主要包括三类玩家4.2 非人形具身智能产品服务机器人3701020304快递配送将包裹从快递仓库或物流中心送到居民小区、办公楼等指定目的地。顺丰速运、中通快递等均已推出或测试了无人配送车,用于快递的“最后一公里”配送零售配送在商场、超市等场所内自动巡航,根据订单信息将商品送到指定位置,或者自动补充货架上的商品。阿里、美团、亚马逊等企业已经在此布局外卖配送目前外卖配送机器人尚未完全普及,但已有美团、饿了么以及一些与酒店合作的服务机器人企业进行了试点和推广工业和物流仓储在工业领域,配送机器人被用于自动化生产线上的物料配送和搬运,实现物流作业的自动化和智能化。在物流仓储领域,配送机器人能够自动化地完成货物的搬运、装载、卸载等操作,提高仓库效率和货物处理速度05特定场景配送在医院、学校、养老院等特定场景,配送机器人可以承担药品、文件、食品等物品的配送任务,为特殊人群提供便利服务图示:配送机器人的主要应用场景数据来源:36氪研究院根据公开资料整理39导览机器人是一种集成了人工智能和机器人技术的智能设备,融合了导航、语音交互、视觉识别和智能问答等多重功能,能够自主定位和导航,带领用户在场馆内自由移动,并提供定位、路径规划和指引服务。同时,它们还具备语音识别技术,能够与用户进行自然语言交互,回答用户问题,从而提供个性化的导览体验。目前,导览机器人在旅游业、教育领域、医疗行业、公共场所以及商业展览与会议等多个领域都有所应用。导览机器人的主要市场玩家涵盖科技巨头、专业机器人制造商及特定应用场景的解决方案提供商。科技巨头如阿里、腾讯等,凭其技术实力与用户基础,正逐步涉足此领域,推出创新产品。专业机器人制造商如优必选、科大讯飞,则凭借深厚的技术积累,致力于开发高性能和高可靠性的导览机器人。同时,专注于博物馆、旅游景点等特定场所的定制化导览服务解决方案提供商也在市场中占据一席之地。这些企业共同推动了导览机器人市场的快速发展。导览机器人:集成多重功能,应用广泛,市场玩家多元4.2 非人形具身智能产品服务机器人38旅游业可应用于旅游景点和博物馆,为游客提供导览服务,解说景点的历史背景、文化特色,介绍展品的背景知识和艺术价值等商业展览与会议在各类商业展览中,可带领参观者游览展览区域,介绍展品信息和企业文化;在大型会议中,提供会议指引、日程安排查询等服务教育领域作为教学辅助工具,在科学课、历史课等场合发挥作用。带领学生参观实验室、历史遗迹等,讲解相关知识,提供生动有趣的导览体验0102050304医疗行业在医院环境中,导览机器人可以用于导诊服务,为患者提供医院设施和医疗服务的介绍和导航公共场所在机场和车站为旅客提供场所导览、航班/车次信息查询等服务;在图书馆帮助读者快速找到所需的书籍资料,提供便捷的查询和导览服务图示:导览机器人的主要应用场景数据来源:36氪研究院根据公开资料整理40Robotaxi,也被称为无人驾驶出租车,是基于自动驾驶技术为公众提供出行服务的创新形式。我国Robotaxi的发展始于2018年,历经近七年的探索与演进,正在经历从“车上安全员”过渡到“远程安全员”,从测试、示范应用到商业化运营的转变过程。当前,北京、上海、广州、深圳、重庆、武汉、成都、长沙、合肥、阳泉、嘉兴、福州等多个城市已开放Robotaxi商业化试点,为乘客提供便捷的出行服务。在这些城市中,北京自动驾驶示范区覆盖了包括经开区、通州区等在内的600平方公里区域,上海开放了912平方公里的测试范围,而武汉的开放面积则高达3,000平方公里,成为开放区域面积最大的城市。在车速方面,Robotaxi相较于其他车辆并未表现出明显的降速现象。以小马智行为例,该公司已在北京、上海、广州和深圳等多个城市开展Robotaxi业务。小马智行认为,过度降速可能增加驾驶风险并降低运营效率。因此,在严格遵守道路限速规定的前提下,Robotaxi会根据前后车辆的行驶速度智能选择最佳车速。根据小马智行提供的数据,在路况良好的情况下,Robotaxi在城区的最高时速可达80公里/小时,而在高速公路上的行驶时速则可达到120公里/小时*。当前阶段,Robotaxi主要被用作通勤的补充工具。萝卜快跑的数据显示,高达约67%的使用者将其视为上下班的主要或辅助交通方式,凸显了通勤作为Robotaxi的首要应用场景。然而,随着Robotaxi技术的持续进步和政策环境的日益宽松,这一创新出行方式正不断拓展其服务边界,应用场景趋向多元化。北京大兴机场、武汉天河机场等交通枢纽已率先开通Robotaxi接驳路线,实现机场与市区之间的无缝衔接,极大地方便了旅客出行。Robotaxi:产业已步入全车无人商业化运营试点阶段,且应用场景正在不断拓宽4.2 非人形具身智能产品自动驾驶载具39*参考资料:国泰君安证券Robotaxi加速快跑,智能驾驶持续推进,36氪研究院整理41Robotaxi市场参与者众多,主要包括车企、自动驾驶科技公司和出行平台三方。车企在Robotaxi市场中扮演着至关重要的制造角色。它们利用自身的车辆设计和生产能力,结合自动驾驶科技公司的智驾方案,制造出符合自动驾驶需求的专用车辆。这些车辆不仅需具备高度的自动化驾驶能力,还要在安全性、耐用性等方面达到严格的标准。通过与自动驾驶科技公司的深度合作,确保车辆的技术先进性和市场适应性,共同推动Robotaxi的商业化落地。此外,广汽丰田、小鹏汽车等车企不仅与自动驾驶科技公司联合打造运营车辆,还积极探索自行开展Robotaxi业务的可能性。例如,小鹏汽车通过其NGP技术开展Robotaxi业务,并与滴滴出行等平台合作,共同拓展市场。自动驾驶科技公司作为技术创新的核心驱动力,不断研发先进的智驾方案,为Robotaxi提供技术支持。典型公司包括萝卜快跑、小马智行、文远知行、元戎启行、AutoX、赛可智能等。出行平台则负责Robotaxi的运营和服务。它们利用自身的用户资源、运营经验和平台技术,将自动驾驶车辆转化为可供用户使用的出行工具。典型公司包括滴滴、如祺出行等平台。随着Robotaxi市场的不断发展,自动驾驶科技公司与出行平台之间的界限日渐模糊。一方面,越来越多的自动驾驶科技公司开始涉足出行平台的运营业务。它们利用自身的技术优势和市场资源,建立自己的出行服务平台,为用户提供Robotaxi服务。例如,百度Apollo不仅自主开发了智驾方案,还通过其出行服务平台“萝卜快跑”直接提供Robotaxi服务。通过这一平台,百度能够实时收集用户乘坐体验数据,快速响应市场需求变化,不断优化其自动驾驶技术和乘车体验。另一方面,出行平台也意识到技术的重要性,通过投资、合作等方式,积极参与到自动驾驶技术的研发和应用中,提升自身技术实力。例如,滴滴出行曾收购自动驾驶初创企业,并与小鹏汽车等车企合作,共同探索Robotaxi的商业化路径。Robotaxi:市场参与者众多,自动驾驶科技公司与出行平台之间的界限日渐模糊4.2 非人形具身智能产品自动驾驶载具4042近年来,随着国家各部委相继发布多项智慧矿山建设相关政策,不仅明确了建设目标,还具体指导了矿山智能化建设的方向和评价标准。这些政策在科技创新、信息化建设及金融支持等多个维度上,全方位地推动了矿山向安全、绿色、智能化的转型,使智慧矿山建设上升为国家层面的重点任务。地方政府也紧随其后,出台行动计划与实施方案,大力推进示范试点,以引导和助力矿山企业提升智能化水平。在这一大背景下,自动驾驶技术,作为智慧矿山建设的核心推动力,正迎来飞速发展。从矿区使用的车型来看,主要有非公路矿用自卸卡车、宽体自卸车和后八轮,而目前无人驾驶的改造主要集中在宽体车和大型矿卡车上。在具体应用上,矿区无人驾驶技术在煤矿中的使用最为普及,市场规模占比超六成,其次是金属矿,而非金属矿的应用相对较少。技术上,矿山领域的自动驾驶近年来取得了显著的进步,已从“安全员下车”逐步发展到“单车无人化”,再到现在的“编组无人化”。业内领先企业如易控智驾、踏歌智行等,已成功实现无人驾驶与有人驾驶车辆的混合运营,并在逐步扩大单个矿山的自动驾驶规模。矿山:政策推动智慧矿山建设,自动驾驶技术助力矿山智能化转型4.2 自动驾驶载具商用车41单车作业矿车被配备各种传感器、雷达、摄像头等设备,以实现车辆的自主感知、决策和控制单车智能化1无人驾驶矿车与有人驾驶车辆进行混编运营,对无人驾驶系统的稳定性和安全性提出了更高的要求无人 有人驾驶混编运营3在单车智能化的基础上,将多辆无人驾驶矿车组成编组进行测试运营单编组测试运营2无人驾驶系统已经过充分的测试和验证,能够在各种复杂环境下稳定运行。整个矿山的运输作业完全由无人驾驶车辆承担全矿无人驾驶运营4 4图示:矿山无人驾驶的四个发展阶段数据来源:36氪研究院根据公开资料整理43本末科技成立于2020年,是一家专注于智能机器人技术的创新型企业。作为直驱型精准动力方案提供商,本末科技擅长使用直驱电机技术为客户创造价值,让原本品检、吵闹、易损、昂贵、复杂的产品焕然一新。拥有直驱电机模组从设计、打样、生产、测试到最终认证的全链条能力,主要服务于泛机器人产品、工业现场、医疗等板块。近年来,本末科技凭借深厚的技术积累与市场洞察力,逐步实现从电机核心部件到机器人整机的全面产品线布局。本末科技的产品线覆盖广泛。电机方面,推出M5、M6、M7、M9、M11、M15等系列直驱电机及P10系列准直驱机器人关节模组,以其结构紧凑、安装便捷、运行稳定及小体积大扭矩等特点,展现出强大的市场适应性和应用价值,已广泛应用于具身智能机器人、家用机器人、工商用机器人、健身设备、医疗康复设备、智能家电等多元化场景。机器人整机方面,本末科技凭借其创新的直驱型关节和轮毂电机驱动技术,推出刑天和TITA两款双轮足机器人。这些机器人将轮式AGV的速度与敏捷性与足式机器人的机动越障性能完美结合,能够在复杂多变的环境中高效、灵活地执行任务。同时,机器人开放的API接口设计,使得客户可以轻松进行二次开发,以满足不同场景下的定制化需求。本末科技:专注于智能机器人技术,从直驱电机到机器人整机全面布局4.3 典型公司分析42图示:本末科技的主要产品布局数据来源:本末科技,36氪研究院整理双轮足机器人刑天机器人:直驱敏捷双轮足机器人,亦是一个开放的开发平台TITA机器人:双轮足机器人,将卓越的感知能力与高级决策能力相结合直驱电机系列主要产品:M5/M6系列、M7/M15系列、M11系列/健身动力模组、P1010系列电机应用领域:家用领域(小型轮式家用机器人)、工商用领域(AGV、ARM、室外检测机器人、清洁机器人等轮式机器人)、健娱领域(健身器材)44本末科技以电机和机器人为核心的“双轮驱动”战略是公司持续发展的基石。电机作为主要营收来源,不仅为机器人提供动力支持,还通过技术创新不断拓展应用范围。而机器人事业部的成立,则标志着公司向更广阔市场的迈进。通过研发新产品、开拓新场景,本末科技正逐步实现机器人技术的商业化落地,预计2024年可实现数百万台机器人关节模组和上千台机器人的实际交付。本末科技的核心竞争力主要体现在以下三个方面:1)技术优势:公司在直驱电机技术和机器人关节设计方面拥有深厚的技术积累,通过持续的研发投入和技术创新,不断突破技术瓶颈,提升产品性能。此外,公司拥有一支由国内外顶尖学府和知名企业背景的专家组成的研发团队,为技术领先提供了有力保障。2)成本优势与规模化落地能力:凭借自主研发的直驱型精准动力方案,本末科技有效降低了生产成本,提高了产品的市场竞争力。与此同时,通过优化生产流程和供应链管理,进一步降低了整体运营成本,为客户提供更具性价比的产品和服务,加速了市场渗透与份额扩张,推动产品规模化落地。3)快速定制解决方案的能力:本末科技始终坚持市场导向,将客户需求置于首位。公司不仅提供标准化的电机产品和机器人解决方案,还具备强大的快速定制能力,能够根据客户的具体需求进行个性化的设计和服务,从而在多样化的复杂应用场景中确保产品的精准匹配与高效运作。本末科技凭借强大的技术实力、敏锐的市场洞察力和卓越的产品性能,正在逐步成为智能机器人领域的领先企业。未来,本末科技将继续坚持创新驱动发展战略,不断深化在电机与机器人领域的布局。在电机领域,公司将持续探索新材料、新技术在电机设计中的应用,提升电机的性能和效率;在机器人领域,公司将加快新产品的研发和商业化落地步伐,拓展更多应用场景和市场空间。同时,本末科技还将积极寻求与产业链上下游企业的合作与共赢,共同推动智能机器人产业的快速发展。本末科技:拥有技术优势、成本优势与解决方案快速定制能力等三大核心竞争力4.3 典型公司分析4345擎朗智能成立于2010年,是行业领先的服务机器人企业,主要提供服务机器人产品和完整解决方案。自推出配送机器人以来,擎朗智能持续深耕多个复杂场景,产品线已扩展至清洁机器人、消杀机器人等多个品类,业务范围广泛,涵盖了餐饮、酒店、医疗康养、工厂、商超、机场等多个行业和领域。目前,擎朗智能的商业模式已经在餐厅、酒店、清洁等多个服务场景中得到了验证,并实现了大规模商业化落地。公司的主打产品广泛应用于餐厅、酒店、医疗康养等商用服务领域。擎朗智能不仅在国内市场拥有70多个运营中心,并在阿联酋迪拜、德国、韩国、荷兰、加拿大、美国、日本、中国香港等地设有子公司/办公室,业务覆盖全球600多个城市及地区。截止目前,擎朗智能的机器人总出货量已超10万台,积累了大量的真实商用场景数据,为布局具身智能提供了夯实的数据基础。擎朗智能:行业领先的服务机器人企业,已经在多个场景实现了大规模商业化落地4.3 典型公司分析44图示:擎朗智能的主要产品和解决方案数据来源:擎朗智能,36氪研究院整理01配送机器人产品矩阵T系列:餐饮配送机器人W系列:酒店机器人02清洁机器人产品矩阵C系列:全场景清洁服务机器人03医疗康养线产品矩阵M系列:消杀、配送机器人X系列:AMR机器人04教育线产品矩阵K12人工智能普及高校、职校产业学院教育05其他产品矩阵S系列:大载重机器人G系列:导引机器人擎朗智慧餐饮:智慧送餐解决方案、智慧餐饮领位解决方案、智慧KTV解决方案擎朗智慧酒店:通过组合机型 无人货柜模式构建“智能酒店”生态擎朗全场景清洁解决方案:以解决不同场景清洁痛点为核心,打造智能化清洁体验,覆盖酒店、商场、办公等多个领域擎朗全场景数智化医院解决方案:专为医疗环境设计的智能物流自动化解决方案、中心药房、手术室、检验站无人化配送、污物物流等K12机器人智培解决方案、定向人才培养培训方案大载重系列专为重物搬运设计的智能机器人,一键配送,轻松驾驭从工业车间到酒店休闲的多元化场景46在具身智能领域,擎朗智能展现出前瞻性的布局思路。擎朗认为,具身智能将为机器人注入更高级的人工智能,使其能够感知、学习并与环境进行动态交互,这一趋势将推动行业向通用机器人时代迈进。基于对行业发展的深刻洞察,擎朗将具身智能的产业化应用视为技术突破的关键,旨在解决服务机器人在商业场景中面临的挑战,进而提升产品性能,并拓展更广泛的应用场景。结合自身丰富的产品落地经验,擎朗认为在餐饮、酒店等大规模商业化场景中,采用“移动底盘 机械臂”架构的具身智能机器人,能够在成熟应用场景中承担更多复杂任务,迅速实现商业规模化应用的全流程闭环,从而推动大模型等先进人工智能技术的大规模商业应用。目前,擎朗已推出第一代具身智能服务机器人的应用,基于大模型能力,以移动底盘 机械臂的机器人架构,可在酒店餐饮等场景内完成自主乘坐电梯、拿取餐盘等复杂任务,实现场景中的服务全流程闭环。在具身智能的实现过程中,擎朗智能主要有如下优势:1)全面的技术架构。擎朗自主研发智能感知、多传感器融合SLAM、机器人运动控制、多模态人机交互,云端大脑等智能机器人全链路技术栈。掌握核心技术,确保机器人在复杂多变的环境中具备高度的鲁棒性和可靠性。2)大规模场景数据集与算法迭代闭环。擎朗拥有全球大规模的具身智能机器人场景落地应用,积累了丰富的商用场景数据。大规模场景环境数据通过深度学习/大模型对算法进行快速迭代,高效地构建具身机器人数据集,为深化具身智能研究和提升通用多模态模型效果提供坚实的支撑。3)全球化的商业/产品/供应体系。擎朗智能构建了全球化的具身智能机器人商业运营体系、国际化的产品开发体系,高品质规模化的生产供应链体系。具备全球化范围内快速产品化商业化具身智能机器人的能力。未来,擎朗智能将把具身智能技术融入更多商业场景,进一步提升服务机器人的普及率和应用价值。并将加速出海步伐,助力全球客户智能化转型。擎朗智能:凭借商业、技术和场景数据优势,推动具身智能的产业化应用4.3 典型公司分析4547云迹科技成立于2014年,是一家专注于AI、具身智能研发、应用及平台建设的创新型科技企业。自成立以来,云迹科技坚持从场景需求着手,在技术和产品创新上不断突破,从初代智能送物机器人“润”、智能双舱送物机器人“格格”,到面向全行业推出服务机器人新形态复合多态机器人“UP”,不断满足具身智能的服务升级及场景化应用。此外,云迹科技以机器人为载体,服务数字化运营系统HDOS(Hospitality Digital Operation System),在酒店场景,可提供“端到端”服务闭环,打造“酒店智能体”。云迹科技以其优秀的商业化落地能力和广泛的市场覆盖,展现出强大的市场竞争力,成为商用服务机器人行业的领跑者。目前,其服务范围已遍布全球40余个国家和地区,覆盖了超过3万家酒店、医院、工厂、公寓及楼宇,每 天可为超百万人次提供智能机器人服务。尤其是在酒店行业,覆盖300 酒店品牌,其中国内Top8酒店集团品牌合作率达80%,云迹科技凭借领先的具身智能产品与数字化方案的服务模式,成为推动酒店行业智能化转型的重要力量。云迹科技:商用服务机器人行业领跑者,专注AI、具身智能研发、应用及平台建设4.3 典型公司分析46图示:云迹科技机器人服务模式进化数据来源:云迹科技,36氪研究院整理初代商用服务机器人(一体机)智能送物机器人-RUN(润)双仓送物机器人-GEGE(格格)01新型商用服务机器人复合多态机器人-UP(多模态、自适应、全场景、全时段执行能力)02服务数字化运营方案服务数字化运营系统HDOS(深度服务-场景智能)03领跑酒店向具身智能有效、闭环、高阶服务发展构建“智能体”,实现“端到端”场景多闭环48云迹科技深植AI产业,凭借对AI技术的深刻理解与创新应用,特别是将具身智能技术融入实际场景,在商用服务机器人领域展现出强大的竞争优势。其产品服务紧密结合具体场景,通过解决实际问题,形成数据驱动的良性循环,进而推动AI的规模化普及。目前两大优势正逐渐凸显:以具身智能为核心的有效服务,为“端到端”服务闭环提供运力基础。云迹科技推出了复合多态机器人“UP”,创造了一种全新的具身智能机器人形态。通过“一机多能,分时复用”的设计理念,实现多功能集成与灵活调度,具备全天候、全时段、多场景、多任务执行能力。其三大特点为:自主使用工具、精准任务处理与Human In The Loop智能调度。UP如同“变形金刚”般的多面手,能轻松应对同一时段内的多任务和个性化需求,进行多任务协调,满足跨场景、多功能及轻量化定制的服务需要。这一创新为智能服务领域树立了新的标杆。以场景智能为核心的深度服务,实现“端到端”服务闭环,构建“具身智能 场景智能”交互融合的“智能体”。云迹科技推出服务数字化运营系统HDOS。以酒店为例,一方面,将需求端的信息处理与执行端的具身智能结合,形成完整的信息流、任务流、工作流闭环;另一方面,开放API端口,与场景中的电视、电话、音箱、电梯等智能设备互联,打造线上线下融合的、可运营、可协作的智能体。面对酒店需求在时间与空间上的多样性和临时性,HDOS能链接酒店住前、住中、住后的立体生态系统,让机器人参与服务流程的感知、认知、决策、执行、反馈的全流程,形成AI服务全生命周期的自闭环,并组成酒店AI数字服务网,帮助酒店实现全智能化运营管理。在发挥深度服务能力的同时,还为未来适应多场景的灵活性、可扩展性打下基础。云迹科技作为“AI 具身智能”先行者,已步入2.0发展阶段,正构建下一代AI服务模型,融合高级认知智能与空间智能,形成“场景智能 具身智能”的组合优势,推动“服务机器人”向“机器人服务”的全面升级。云迹科技:打造场景智能体,用“AI 具身智能”实现“端到端”服务闭环4.3 典型公司分析47 跨模态交互 自适应学习 与人类协作具身智能发展趋势展望054850具身智能将发展出更高级的跨模态交互能力,整合视觉、听觉、触觉等多种感官信息。这种能力意味着具身智能将可以更全面地感知环境并快速适应变化,以及通过多种方式与人类自然交互。例如,机器人可以通过视觉识别表情、手势,结合听觉理解指令,提供更精准服务。同时,跨模态交互能力的提升将极大增强具身智能的适应性和灵活性,使其完成任务的动作和策略更加准确有效。同时,这种能力的发展也将对具身智能的学习和进化产生积极影响,使其不断调整和优化行为策略,更好地应对复杂任务。具身智能的跨模态交互能力的发展将基于多模态感知系统、数据融合算法以及上下文感知等多个方面。多模态感知系统将使具身智能能够捕捉和解析来自不同感官通道的数据;数据融合算法将整合不同感官的信息,形成统一、多维度的环境理解;而上下文感知则使具身智能能够理解交互的上下文,包括用户情绪状态、环境条件等,从而提供更加个性化的响应。具身智能将发展更高级的跨模态交互能力,整合视觉、听觉、触觉等多种感官信息495.1 跨模态交互多模态感知系统具身智能将配备高级的感知系统,能够捕捉和解析来自不同感官通道的数据。例如,使用3D摄像头和深度传感器来理解空间和物体,利用麦克风阵列来确定声源位置和语音内容上下文感知具身智能将能够理解交互的上下文,包括用户的情绪状态、环境条件等,提供更加个性化和适应性强的响应数据融合算法通过先进的数据融合技术,具身智能能够整合来自不同感官的信息,形成一个统一的、多维度的环境理解。这需要复杂的算法来处理和协调各种数据源图示:具身智能跨模态交互能力的作用基础数据来源:36氪研究院根据公开资料整理51在大模型的加持下,具身智能的自适应学习能力将得到显著提升。这意味着具身智能不再局限于预设的算法和规则,而是能够基于自身经验和环境反馈进行自我进化,不断优化和调整行为策略。首先,具身智能将能高效地分析和处理来自不同感官模态的信息,形成全面多维的环境理解,从而更准确地感知和解释周围世界,这为自适应学习奠定了基础。其次,在任务执行过程中,具身智能会不断积累新的经验和数据,利用大模型的深度学习和强化学习机制,深入挖掘和分析这些经验和数据,提取有价值的信息和模式,进一步精进其行为策略,使其在面对类似任务时更加游刃有余。这种自我优化能力不仅能提高具身智能的执行效率,还能增强其应对复杂任务的能力。更为重要的是,具身智能的自适应学习能力还能赋予其更强大的泛化能力,即使面对全新和未知的任务环境,也能迅速适应并找到有效的解决方案。这种能力对于具身智能在复杂多变的环境中进行长期自主运行至关重要,使其能在环境变化中始终保持高效的运行状态。此外,具身智能的自适应学习能力不仅体现在行为调整上,还涵盖强化学习、持续学习和元学习等多个层面,使其在学习和进化方面更加全面和深入。具身智能将具备更强的自适应学习能力,能够根据经验自我进化,以便更好地完成任务505.2 自适应学习图示:具身智能自适应学习的主要方式数据来源:36氪研究院根据公开资料整理强化学习通过强化学习算法,具身智能可以在与环境的交互中学习最佳行为策略,以最大化某种累积奖励持续学习具身智能将具备持续学习的能力,即使在部署后也能不断从新的经验中学习,以适应长期变化的任务和环境元学习具身智能将采用元学习技术,快速适应新任务或新环境,通过少量的样本或经验快速调整自己的行为52基于人类对智能的根本期待和技术发展的必然趋势,未来具身智能将更加注重与人类的协作能力,成为人类工作和日常生活中的有力助手。其核心在于能够理解和适应人类的需求和行为模式,通过深度学习、自然语言处理及情感智能等技术的突破,更准确地识别和理解人类的意图和情绪,提供个性化、贴心的服务。这种协作关系的深化体现在多个方面:1)共享控制。具身智能将实现与人类操作者更紧密的共享控制,能够在人类需要时进行辅助或接管操作,同时允许人类的监督和干预;2)社会化交互。具身智能将具备更高级的社会化交互能力,能够理解人类的社交信号,如肢体语言、面部表情等,并作出适当的反应;3)任务协调。在团队环境中,具身智能可与人类成员共同理解和协调任务分配,提供必要的信息和支持,协助处理繁琐任务,帮助团队更高效完成任务,有效支持团队目标;4)安全交互。具身智能的设计将更注重安全性,采用先进的安全技术和算法,确保在所有交互中保护人类操作者不受伤害,同时具备自我监测和故障检测能力,及时发现并处理潜在的安全隐患,确保与人类的安全协作。具身智能将更加注重与人类的协作能力,成为人类工作和日常生活中的有力助手515.3 与人类协作图示:具身智能与人类协作的主要方式数据来源:36氪研究院根据公开资料整理协作方式安全交互物理安全:具身智能体在执行任务过程中需确保不会对人类造成物理伤害隐私保护:在与人类的交互过程中,保护人类的个人信息和隐私数据伦理规范:建立相应的伦理规范来指导人机交互行为共享控制协同决策:人类与具身智能体可根据各自优势,共同决定任务的执行路径和策略动态调整:在任务执行过程中,人类和智能体可以根据实际情况动态调整控制策略,以适应复杂多变的环境社会化交互情感识别与回应:具身智能体通过感知人类情感状态,作出相应情感回应自然语言处理:通过先进的自然语言处理技术,具身智能体能够理解人类的语言指令,并以自然语言进行回应任务协调多智能体协同:多个具身智能体通过通信和协作机制,共同完成任务人机协同:人类与具身智能体通过任务分配和协同执行机制共同完成任务5336氪研究院介绍36氪研究院根据行业发展、资本热度、政策导向等定期输出高质量研究报告,研究方向覆盖人工智能、5G、区块链、医疗、金融、物流、文娱、消费、汽车、教育等多个领域,帮助政府、企业、投资机构等快速了解行业动态,把握发展机遇和明确发展方向。同时,研究院致力于为全国各级政府、企业、VC/PE机构、政府引导基金、孵化器/产业园区等提供专业定制化咨询服务,服务内容包括行业研究、产业规划、用户研究、股权投资研究、指数研究、投资配置、基金/企业尽调、战略规划、园区规划等。36氪已成为中国流量与影响力较大的互联网新商业媒体,覆盖全球超1.5亿读者,累计发布超过50,000篇文章,拥有行业内较显著的流量和传播优势。01 传播资源36氪深耕创投市场超9年,深度服务过数千家客户,累积超80万家企业和投资机构资源,搭建了完善的一级市场数据库。02 核心数据研究院现有数十位成员,主要来自国内外知名咨询机构或研究机构,拥有丰富的研究及项目经验。03 团队优势 36氪研究院主要关注领域包括人工智能、5G、区块链、医疗、金融、物流、文娱、消费、汽车、教育等。04 研究领域36氪研究院发布的常规性研究报告,受业内专业人士一致好评。在政府合作层面,研究院已为国务院、国家发改委、中央网信办、工信部、基金业协会、北京发改委、南京发改委、青岛高新区政府、湖南湘江新区管委会、成都新经济委、杭州西湖区政府等提供过咨询服务;在企业/投资机构合作方面,研究院已与大众中国、苏宁易购、携程、京东、网易、转转、字节跳动、海尔资本、洪泰基金、首钢基金等建立了深度合作关系。05 品牌影响5254分析师声明作者具有专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。免责声明36氪不会因为接收人接受本报告而将其视为客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在法律许可的情况下,36氪及其所属关联机构可能会持有报告中提到的公司的股权,也可能为这些公司提供或者争取提供筹资或财务顾问等相关服务。本报告的信息来源于已公开的资料,36氪对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映36氪于发布本报告当日的判断,本报告所指的公司或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,36氪可发出与本报告所载资料、意见及推测不一致的报告。36氪不保证本报告所含信息保持在最新状态。同时,36氪对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。53特别声明研究咨询邮箱:研究院网站:https:/ 让一部分人先看到未来
人工智能(AI)国际金融监管初探毕马威金融行业研究中心2024年09月1人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。执行摘要随着经济社会的发展与科学技术的进步,人工智能已经被广泛应用于工作生活的各个领域。各国纷纷将人工智能纳入国家战略,期待其为经济发展提供新的增长点与动能。特别是2022年Chat-GPT的问世,向世界展现了人工智能巨大的发展潜力与应用前景。但同时,人工智能技术也可能带来系统性歧视、对数据和隐私权的侵犯以及信息茧房等问题。为推动技术以人为本,有效应对潜在风险,各国开始立足于自身的技术优势与资源禀赋,采用不同的人工智能治理与监管路径。在吸收国际组织研究成果的基础上,欧盟率先推出人工智能伦理规范、法案与框架公约等,利用治理格局优势地位积极推动国际监管,并借助欧盟统一市场的力量,通过产业链向全球施加影响。英国采取了比较灵活的监管路径,并利用地缘优势与脱欧后的自由空间,优先促进技术的创新与发展,吸引科技公司并促进产业转化。以美国、中国、新加坡为代表的具有人工智能技术优势的国家,则在国家规划的整体引领下布局促进技术发展与产业培植,兼顾发展中可能产生的风险与问题,积极推动人工智能的治理与监管。本文立足于全景扫描,在收集研读人工智能相关文献的基础上,对国际组织、欧盟、英国、美国、中国等具有代表性主体的监管体系进行了分析,并对具有里程碑意义的文件及内容要点进行了整理与解读。同时,我们亦结合各国家/地区金融领域的人工智能监管动态进行了总结、分析与展望,并对金融机构人工智能技术应用提出了合规行动建议。2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。目录人工智能监管概览0305主要国家/地区人工智能监管05一、国际组织1.1 国际组织体系概览1.2 重要监管文件分析1.3 金融领域的人工智能监管与影响10二、欧盟/欧洲2.1 欧盟/欧洲体系概览2.2 重要监管文件分析2.3 金融领域的人工智能监管与影响15三、英国3.1 英国体系概览3.2 重要监管文件分析3.3 金融领域的人工智能监管与影响21四、美国4.1 美国体系概览4.2 重要监管文件分析4.3 金融领域的人工智能监管与影响27五、中国5.1 中国体系概览5.2 重要监管文件分析5.3 金融领域的人工智能监管与影响结语36 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。3人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。人工智能监管概览图1:国际人工智能监管相关文献分布情况数据来源:毕马威自行收集整理。数据收集期间为2017年7月至2024年7月底根据毕马威收集的全球人工智能监管相关文献分析,国际上人工智能立法较为活跃的国家与地区有欧盟、美国、英国、中国、新加坡以及香港等。从已发布的文件来看,各区域/国家普遍采取了促进创新,以人为本,以风险为导向的原则来实施或推进人工智能的监管,具有强制约束力的监管规则较少,仅占18%(且一半为美国州级的立法),多数采取了原则、伦理、指南、讨论文件及报告等更为软性的形式(图1)。从各区域/国家的人工智能立法特点来看,国际组织积极推出人工智能原则、伦理规范,并通过宣言、倡议、联合声明等方式推动全球整体的人工智能治理与伦理约束。欧盟的人工智能监管体系更为完整,全面覆盖规划、原则、伦理、框架、指引、监管规则等各种类型;欧盟同时积极参与国际社会人工智能监管规则的制定,其推出的欧盟人工智能法案为全球首部人工智能领域的全面监管法规,人工智能与人权、民主和法治框架公约为全球首个关于负责任地使用人工智能的具有法律约束力的国际条约,具有较强的国际影响力。英国的人工智能监管体系非常有特点,它整体采用了一种政府引领,以部门为主导、有利于创新的做法来实施监管。它采用了相对软性的方式,不主张仓促立法与推出强制规范,文件多以软性的规划、框架、指南等形式颁布,同时英国监管机构还实施了大量研究并与社会各界人士广泛探讨,以保持对人工智能实践与风险的敏锐度。美国的人工智能监管立法具有州领跑联邦政府的特点,一批州级的法律规范已率先落地,联邦部门的立法在政府执行令的统一引导下逐步推进,但尚未正式推出具有强制遵循意义的法律规范。国际人工智能监管体系概况18%6A%监管规则/立法蓝图/规划原则/伦理道德治理/风险框架指南讨论文件及其他4人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。人工智能监管概览中国较早就开始实施人工智能规划及治理活动,虽然已出台的文件数量不多,但种类较为丰富,已涵盖发展规划、监管规则、治理原则、伦理规范、倡议与宣言等。同时,中国也积极参与国际社会的人工智能监管治理,推动人工智能产业发展并构建自身的国际影响力。从金融领域来看,目前金融监管机构对于人工智能监管的整体立法并不十分活跃,各区域/国家金融监管部门主要根据整体性的人工智能监管政策与要求,在各自的职能领域针对人工智能应用进行规范。但随着上位法及人工智能专门法规的陆续出台,相关金融监管机构亦在酝酿人工智能领域的金融监管要求。以下我们将选择国际组织、欧盟、英国、美国等四个人工智能监管领域具有代表性与领先意义的主体开展分析。我们亦对中国人工智能监管的进展与动态进行了总结,后续将单独撰写与国际实践比较分析的专题文章。5人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管1.1 国际组织体系概览国际组织较早就开始了关于人工智能的探讨,从其目前已发布的文件看,均为不具有强制约束力的原则、伦理建议、倡议宣言等,旨在推动相关方以人为本,以负责任的方式设计、开发和应用人工智能。相关内容为不同地区、国家的人工智能立法提供了有力的支持与丰富的借鉴,包括标准定义、原则导向、伦理规范、工具方法等。2019年,世界经济合作组织(OECD)与二十国集团(G20)先后推出了人工智能原则,但原则并不具有约束力。2021年,联合国教科文组织(UNESCO)发布人工智能伦理问题建议书,对人工智能涉及的伦理问题进行了深入探讨,并提供了评估工具与政府行动建议。2023年,七国集团(G7)领导人发布就广岛人工智能进程的联合声明,并配套推出了指导原则与行为准则。2023年11月,首届全球人工智能(AI)安全峰会上,包括中国、美国、欧盟在内的 28 个国家,签署了布莱切利 AI 宣言,这也是是全球第一份针对人工智能这一快速新兴技术的国际性声明(图2)。1.2 重要监管文件分析以下选择三份重要的国际组织人工智能监管文件进行分析。OECD人工智能原则和G20人工智能原则(2019年)在全球层面,从国际组织发布的人工智能相关文件来看,较为重要且被广泛引用的两份文件是世界经济合作组织(OECD)于2019年5月发布的人工智能原则(首个人工智能政府间标准),以及二十国集团(G20)于2019年6月发布的人工智能原则,后者借鉴了前者的提议1(图3)。在后续各地区、国家、组织发布的人工智能监管文件中,关一、国际组织图2:国际组织人工智能相关文件信息来源:毕马威自行收集整理。1 部分内容引用自FSI Insight on policy implementation No 35,Humans keeping AI in check-emerging regulatory expectations in the financial sector。6人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管于人工智能的标准定义、原则等,均吸收利用了两份文件的成果。人工智能伦理问题建议书(2021年11月)首个全球级的人工智能伦理标准2021年11月,联合国教科文组织(UNESCO)采纳了一套关于人工智能伦理的建议人工智能伦理问题建议书(以下简称建议书),由193个成员国一致通过,这是首个全球级的人工智能伦理标准。它建议会员国在自愿基础上适用建议书的各项规定,特别是根据各自国家的宪法实践和治理结构采取适当步骤,包括必要的立法或其他措施,依照包括国际人权法在内的国际法,使建议书的原则和规范在本国管辖范围内生效2。建议书详细讨论了其目标、价值观、原则以及政策领域的行动(图4),并提供了两项核心工具,准备 状 态 评 估(readinessassessmentmethodology)与伦理影响评估(ethicalimpact assessment)。准备状态评估工具(RAM)包括一系列定量和定性问题,旨在收集与一个国家的人工智能生态系统相关的不同方面的信息,包括法律和监管、社会和文化、经济、科学和教育以及技术和基础设施方面。其中每个维度都有一系列定量和定性评估问题,使RAM有别于其他现有的准备状态评估工具。其问题设置主要覆盖六大维度,包括通用维度、法律维度及其8个细分维度、社会与文化维度及其5个细分维度、科学与教育维度及其10个细分维度、经济维度及其3个细分维度,以及技术与基础设施维度及其4个细分维度。其中法律图3:OECD和G20提出的人工智能原则信息来源:毕马威根据OECD人工智能原则和G20人工智能原则整理。2 部分内容引用自UNESCO,人工智能伦理问题建议书中文版。7人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管维度包含人工智能政策与监管细分维度(图5),由于与本文研究主题高度相关,详细列示以供参考。伦理影响评估工具(EIA)考虑了设计、开发和部署人工智能系统的整个过程,包含一系列问题以及评估表格等,可以用于人工智能系统向公众发布之前和之后对其风险及影响进行评估。伦理影响评估工具最初设计目的是帮助参与人工智能系统采购的公共部门官员,为他们提供一系列问题,以确保他们购买的人工智能系统符合建议书中规定的伦理标准。然而,它也可以被开发人员或私营部门和其他地方的其他人使用,以促进人工智能系统符合道德的设计、开发和部署。图4:UNESCO人工智能伦理问题建议书提出的价值观与原则信息来源:毕马威自根据UNESCO人工智能伦理问题建议书整理。8人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管图5:准备状态评估工具人工智能政策与监管评估指标七国集团领导人就广岛人工智能进程的联合声明(2023年10月)2023年10月30日,七国集团(G7)领导人就“广岛人工智能进程”发表联合声明,强调要开发先进的人工智能系统,充分利用生成式人工智能带来的机遇和潜力,打造以人类为中心的包容的人工智能治理框架。基于联合声明,七国集团领导人当日还发布了广岛进程先进人工智能系统开发组织国际指导原则和广岛进程先进人工智能系统开发组织国际行为准则3。文件提出了11项与风险相匹配的原则:在先进人工智能系统的整个开发过程中,包括在部署和投放市场之前,采取适当的措施,以识别、评估和减轻整个人工智能生命周期的风险;在部署及投放市场后,识别和减轻漏洞,并在适当的情况下识别滥用事件和模式;信息来源:毕马威自根据UNESCO人工智能伦理问题建议书整理。3 内容引用自中国国际科技交流中心,科技动态|七国集团领导人就“广岛人工智能进程”发表联合声明。9人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管公开报告先进人工智能系统的能力、局限性、适当和不适当使用的领域,以支持确保足够的透明度,从而有助于加强问责制;致力于在开发先进人工智能系统的组织之间,包括与行业、政府、民间社会和学术界,实现负责任的信息共享和事件报告;制定、实施和披露基于风险的人工智能治理和风险管理政策,包括隐私政策和缓解措施,特别是针对开发先进人工智能系统的组织;投资并实施强有力的安全控制,包括整个人工智能生命周期的物理安全、网络安全和内部威胁防护;在技术可行的情况下,开发和部署可靠的内容认证和来源机制,如水印或其他技术,使用户能够识别人工智能生成的内容;优先考虑研究以减轻社会、安全和保障风险,并优先考虑对有效缓解措施的投资;优先发展先进的人工智能系统,以应对世界上最大的挑战,特别是但不限于气候危机、全球卫生和教育;推动制定并酌情采用国际技术标准;实施适当的数据输入措施,保护个人数据和知识产权。1.3 金融领域的人工智能监管与影响从金融领域来看,国际清算银行(BIS)、国际证券事务监察委员会组织(IOSCO)等国际组织一直在积极推进金融领域人工智能相关的研究,自2021年起陆续发布金融领域的人工智能研究报告,研究主题覆盖市场中介机构和资产管理公司对人工智能和机器学习的应用,人工智能在中央银行的应用,中央银行的生成式人工智能与网络安全,人工智能如何重塑金融业等,其研究内容主要聚焦于人工智能在金融业的运用现状,机会与挑战,以及蕴含风险的探讨,并未推出具有遵循意义或操作指导的治理原则、风险框架、指引等规范。国际清算银行金融稳定研究所(BIS-FSI)的研究报告也提出,建议区分面客(customer-facing)、非 面 客(Noncustomer-facing)两类场景搭建不同的监管框架与措施。展望未来,随着人工智能技术的持续发展与金融领域应用场景的不断扩大,预计未来将有更多国际组织积极作为,促进金融领域人工智能监管或引导规范的出台。10人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管2.1 欧盟/欧洲体系概览欧盟自2016年起就不断探索对人工智能技术应用的监管体系构建,其以欧洲整体层面为视角,致力于构建协调一致、适合欧洲发展的人工智能治理体系。欧盟监管的政策重点是,以基本人权为底层逻辑,侧重于保障个人权利。以数据安全为阵地延伸,通过人工智能使用数据与数据应用场景划分其风险等级。其治理模式是与风险相匹配的分层治理。监管机制是采取分级监管、多种监管,并实行高额的行政处罚,且将公私机构一起纳入监管范围4。从国际竞争的视角来看,欧盟一方面利用自身国际影响力,积极拟定并输出伦理指南、全面监管法案、国际公约等,发挥制度优势影响国际层面的人工智能治理与监管。另一方面以欧盟统一市场为基础,延伸向域外乃至全球供应链相关方施加影响力。欧洲的人工智能监管体系较为完善,已颁布的文件虽然数量不多,但其内容全面覆盖规划蓝图、监管立法、原则伦理、治理框架、指引指南等类型。每份文件正式出台前,均经历了多轮的草拟议案、意见征询、讨论反馈与修订等(图6)。2.2 重要监管文件分析以下选择三份欧盟人工智能领域监管具有里程碑意义的文件进行重点分析。值得信赖的人工智能伦理指南(2019年4月)不具备强制约束力的伦理指南,提出了值得信赖的人工智能框架基于2018年12月份的初稿与意见征询,2019年4月8日,欧盟委员会下设的人工智能高级别专家组正式发布了值得信赖的人工智能伦理指南,提出了实现值得信赖的人工智能全生命周期框架(图7)。值得信赖的人工智能包含三要素,符合法律的(lawful),合乎道德的(ethical)和二、欧盟/欧洲图6:欧盟/欧洲人工智能相关文件信息来源:毕马威自行收集整理。4 部分内容引用自人工智能监管制度概览,国家社会科学基金重点项目“人工智能研发与应用风险治理的财税法协同机制研究”(立项编号:21AFX021)的阶段性成果,来源人民法院报。11人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管具有稳健性的(robust)。开发、部署和应用人工智能需符合四项伦理原则,包括:尊重 人 的 自 主 性(respect for human autonomy)、预防伤害(prevention of harm)、公平(fairness)和具有可解释性(explicability)。为达成以上目标,框架还提出了七项关键要求,包括:人的能动性与监督(human agency and oversight),技术稳健性与安全性(technical robustness and safety),隐私与数据治理(privacy and data governance),透 明 性(transparency),多样性、非歧视性与公平性(diversity,non-discrimination and fairness),环 境 和 社 会 福 利(environmental and societal well-being),责任制(accountability)。欧盟人工智能法案(2024年5月)全球首部人工智能领域的全面监管法规欧盟人工智能法案出台经历了漫长的酝酿过程,除欧盟内部的立法程序与反复商讨外,还曾多次遭遇空客、西门子等大型企业,以及谷歌、微软、OpenAI等科技巨头的公开反对与抵制。2021年4月,欧盟委员会提出了一项旨在协调人工智能规则的法规提案。2023年6月,欧洲议会通过人工智能法案谈判授权草案。12月,欧洲议会、欧洲理事会和欧盟委员会达成临时协议,将把人工智能法案制定为法律。2024年3月13日,图7:值得信赖的人工智能框架指南数据来源:毕马威根据值得信赖的人工智能伦理指南翻译整理。12人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管欧洲议会批准人工智能法案。5月21日,欧洲理事会正式批准欧盟人工智能法案(以下简称“法案”),这是第一个具有约束力的全球人工智能横向监管法规,为欧盟人工智能系统的使用和供应设定了一个共同的法律框架,具有标志性意义。法案是一份全面的文件,它旨在提供人工智能的明确定义,使欧盟范围内关于人工智能的法律法规与其他欧盟法律法规保持一致。法案的主要目标是建立一个统一和横向的法律框架,促进人工智能系统的使用,同时提供高水平的保护,防止其不利影响。从主要内容来看,法案共13章,包括总则,禁止的人工智能实践,高风险人工智能系统,特定人工智能系统的供应者与使用者需遵循的透明度义务,通用人工智能模型,支持创新的措施,治理,欧盟高风险人工智能数据库,上市后监测、信息共享与市场监督,行为准则与指引,授权与委员会程序,处罚,以及最后条款。法案的重点是保护安全和基本权利,它根据“基于风险的方法”,为不同的人工智能应用系统风险水平,引入了分级的监管要求系统(图8)。一些存在“不可接受”风险的人工智能系统被禁止。一些可能对人们的健康、安全或基本权利产生不利影响的“高风险”人工智能系统得到授权后可以使用,但需要遵守一系列进入欧盟市场的要求和义务。由于缺乏透明度而造成“有限风险“的人工智能系统将受到信息和透明度要求的约束,而存在“最小风险”的人工智能将不受进一步义务的约束。此外,法案还为通用人工智能(GPAI)模型提供了具体规则,考虑到具有“高影响能力”的通用人工智能模型可能会构成系统性风险并对内部市场产生重大影响,法案还对其提出了更严格的要求。图8:欧盟人工智能法案的人工智能系统分级监管数据来源:根据毕马威国际Decoding the EU AI Act翻译整理。13人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管从适用范围来看,法案为整个人工智能产业链上的相关方提供了一个合规义务框架,旨在约束与欧盟市场有连接点的所有主体,包 括 供 应 商(providers)、进 口 商(importers)、分销商(distributors)、产品制造商(product manufacturers)、部署商(deployers)和用户(users)等。从法案生效时间与处罚后果来看,法案中规定禁止的做法将在生效6个月后适用;通用型人工智能(GPAI)的相关义务和规则将在生效12个月后适用;法案生效24个月后,该法案完全适用,但一些高风险AI系统的规则将在生效后36个月适用。不遵守法案的后果可能包括限制市场准入和根据违法程度处以巨额罚款。罚款可能从750万欧元或全球营业额的1%,到3,500万欧元或全球营业额的7%不等,具体取决于人工智能系统的类型、公司的规模和违法行为的严重程度。人工智能与人权、民主和法治框架公约(2024年5月)全球首个关于负责任地使用人工智能的具有法律约束力的国际条约人工智能与人权、民主和法治框架公约的起草工作于2019年启动,当时人工智能特设委员会(CAHAI)的任务是审查这种工具的可行性。在其授权之后,人工智能委员会(CAI)于2022年继任,起草并谈判了该文件。2024年5月18日,欧洲理事会在斯特拉斯堡正式通过了具有历史意义的人工智能与人权、民主和法治框架公约(以下简称“框架公约”),这标志着全球首个关于负责任地使用人工智能的具有法律约束力的国际条约正式诞生。它旨在确保人工智能系统生命周期内的活动完全符合人权、民主和法治,同时有利于技术进步和创新。框架公约未对技术进行规范,本质上是技术中立的。框架公约共8章,36条,主要内容包括:总则、总体义务、与人工智能系统生命周期内的活动相关的原则、补救措施、风险和不利影响的评估和缓释、公约的执行、后续机制与合作、以及最后条款。从各国需履行的框架公约责任来看,主要包括:基本原则人的尊严和个人自主(Human dignity and individual autonomy);平 等 和 不 歧 视(Equality and non-discrimination);尊重隐私和个人数据保护(Respect for privacy and personal data protection);透 明 度 和 监 督(Transparency and oversight);问责制和负责任(Accountability and responsibility);可靠性(Reliability);安全创新(Safe innovation)。补救措施、程序性权利和保障措施记录有关人工智能系统及其使用的相关信息,受影响人员可获得相关信息;信息必须足以使相关人员质疑通过使用该系统或在很大程度上基于该系统做出的决定,并质疑该系统本身的使用;14人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管有效保障向主管当局提出申诉的可能性;在人工智能系统对人权和基本自由的享受产生重大影响的情况下,就人工智能系统的应用向受影响的人提供有效的程序保障、防护措施和权利;提供通知,说明一个人正在与人工智能系统交互,而不是与人类交互。风险与影响的管理要求以持续迭代(iterative)的方式,对人权、民主和法治的实际和潜在影响进行风险和影响评估;通过实施这些评估,制定充分的预防和缓释措施;保留当局对人工智能系统的某些应用实施禁令或暂停的可能性(“红线”)。从框架公约的适用范围和约束效力来看,涵盖公共当局(public authorities),亦包括代表其行事的私立行为者,以及私营部门及个体(private actors)对人工智能系统的使用。框架公约为缔约方在管理私营部门时遵守其原则和义务提供了两种方式:缔约方可以选择直接受框架公约相关条款的约束,或者作为一种选择,采取其他措施遵守条约的规定,同时充分尊重其在人权、民主和法治方面的国际义务。此外,框架公约缔约方不必将条约的规定适用于与保护其国家安全利益有关的活动,但必须确保这些活动尊重国际法和民主体制和进程。框架公约不适用于国防事务,也不适用于研发活动,除非人工智能系统的测试可能干扰人权、民主或法治。2.3 金融领域的人工智能监管与影响除通用人工智能监管政策外,从金融领域人工智能监管政策与要求来看,欧洲银行管理局、欧洲保险与职业养老金局等已发布的监管规则,以及德国、法国、卢森堡、荷兰等国家发布的适用于本国的治理框架、总体原则等,基本与欧盟通用人工智能监管要求保持一致。此外,欧盟金融监管机构与各国监管机构还发布了多项人工智能相关的专题研究报告。针对法案与框架公约后金融领域的人工智能监管职责来说,欧盟国家可以将这项任务分配给其人工智能监管机构或现有的国家金融监管机构。与此同时,作为欧洲重要金融监管机构,欧洲央行(ECB)在监管法案的要求方面没有设置角色,但将继续从审慎的角度审查信贷模型。但随着法案与框架公约的生效与实施,预计未来欧盟及各国也将调整或细化监管政策,进一步明确金融领域人工智能监管的职责分工与监管要求。从金融领域的影响来看,依据法案的风险分级,部分金融行业的人工智能应用被划分为高风险,例如银行的人工智能信用评分系统被指定为高风险系统,因为这可能会对个人或群体造成不公平歧视。又如保险领域,为健康或人寿保险单定价的人工智能系统也归类为高风险。此类人工智能系统必须满足高标准的稳健性和准确性,必须在强大的风险管理框架内运行,并且必须确保人工监督和对其输出信息的正确理解。这些要求将适用于法案生效两年后部署的新系统,为金融机构履行合规义务保留了窗口期。而依据法案与框架公约的强制性要求,金融机构应用人工智能还需建设相应的治理架构、持续的风险评估与管理流程,并配备相应的岗位与专家等。15人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管3.1 英国体系概览英国在人工智能监管路径设计方面主张平衡创新与发展5,整体采用了一种政府引领,以部门为主导、有利于创新的做法来实施人工智能监管。政府部门、监管机构与特设机构通过发布政策白皮书、讨论文件、研究简报、政策反馈、政府应答、实施效果评估等方式,持续通过深入的研究、广泛的探讨与动态的论证,并充分征询社会公众与商业企业的信息输入与反馈意见,促进相关部门不断审视并检讨原则与目标的实现情况,用较低成本的方式达成整体人工智能治理与监管目标,并促进公众的理解与信任。此外,英国高度重视并积极参与国际标准的制定,并将推广促进有利于英国发展的国际标准作为降低合规成本,促进国家竞争力的有效手段。在最新发布的科学技术框架,英国将成为国际治理优胜者与领导者列入拟于2030年实现的战略目标。从已发布的人工智能相关文件来看,英国采用的监管方法比较温和,不主张仓促推出立法与监管规范,文件多以软性的规划、框架、指南等形式颁布。同时,英国对人工智能的发展变化保持密切关注,发布了大量的研究报告、白皮书、讨论文件等,并将持续实施相关调研与研究,以保持对风险的敏锐感知与及时响应(图9)。3.2 重要监管文件分析以下将对英国四份重要的监管政策与文件进行分析。国家人工智能战略(2021年9月)在2021年9月发布的国家人工智能战略(以下简称战略)中,英国政府承诺在治理和监管人工智能方面采取有利于创新的国家立场,提出了“使英国成为人工智能超级大国的十年计划”以及关于高效治理人工三、英国图9:英国人工智能相关文件信息来源:毕马威自行收集整理。5 引用自人工智能监管制度概览,国家社会科学基金重点项目“人工智能研发与应用风险治理的财税法协同机制研究”(立项编号:21AFX021)的阶段性成果,来源人民法院报。16人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管智能的路径设想(图10)。战略还对后续人工智能即将采取的十项监管举措进行了部署说明。建立有利于创新的人工智能监管方法(2022年7月)承接战略中的监管举措部署,英国政府在2022年7月的一份政策文件建立有利于创新的人工智能监管方法(以下简称政策文件)中概述了政府的立场。这份文件阐述了政府关于实施一个适度的、经得起未来考验的、有利于创新的人工智能监管框架的建议。为了促进创新并支持蓬勃发展的人工智能生态系统,英国采取的方法是:情景化的(Context-specific):承认人工智能是一种动态的通用技术,由此产生的风险主要取决于其应用的情景;支持创新和基于风险的(Pro-innovationand risk-based):要求监管机构专注于可能导致真实、可识别、不可接受的风险水平的人工智能应用,而不是试图对低风险或假设风险的人工智能应用实施控制,以避免扼杀创新;连贯的(Coherent):确保体系简单、清晰、可预测和稳定;适度且适应性强的(Proportionate andadaptable):要求监管机构首先考虑更轻盈的选择,如指导或自愿措施等。针对人工智能技术的特征,政策文件还建议制定一套跨部门原则,由监管机构将其发展为特定部门或领域的人工智能监管措施。6项跨部门原则包括:确保人工智能安全使用;图10:英国国家人工智能战略中的政府目标与实现路径信息来源:毕马威根据国家人工智能战略整理17人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管确保人工智能在技术上是安全的,并在功能上按设计运行;确保人工智能具有适当的透明性和可解释性;将公平考虑嵌入人工智能;明确法人对人工智能治理的责任;明确纠偏或质疑的途径。人工智能监管:一种有利于创新的方法(2023年3月)2023年3月,在政策文件基础上,充分吸纳各方反馈意见与政策影响评估见解,英国正式发布了促进创新的人工智能监管方法白皮书(以下简称监管方法),总体而言将通过一种基于原则,中央职能持续监测并促进协作,能够灵活适应的方法来实施监管(图11)。新监管框架以五项原则为基础,以指导和影响人工智能在所有经济部门的负责任开发和使用。这些原则将在非法定基础上发布(on a non-statutory basis),并由现有监管机构实施。安 全 性、保 障 性 和 稳 健 性(Safety,security and robustness);适当的透明度和可解释性(Appropriate transparency and explainability);公平性(Fairness);责 任 制 与 治 理(Accountability and governance);图11:英国促进创新的人工智能监管方法中的人工智能监管策略数据来源:毕马威根据促进创新的人工智能监管方法翻译整理。18人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管争 议 与 纠 偏(Contestability and redress)。监管框架围绕四个关键要素构建,旨在增强现有监管机构的能力,促进整个监管格局的一致性。四大关键要素为:根据人工智能的独特特性定义人工智能,以支持监管机构协调;采用针对特定情景的方法;提供一套跨部门原则,指导监管机构应对人工智能风险和机遇;提供新的中央职能,支持监管机构实施人工智能监管框架,最大限度地提高迭代方法的效益,并确保框架的一致性。在实施方面,为促进跨部门的横向协作,监管方法确定了一些必要的中央支持职能,以确保总体框架对风险做出适度但有效的反应,同时促进整个监管领域的创新:监测和评估总体监管框架的有效性和原则的实施情况,包括实施在多大程度上支持了创新。这将使英国能够保持响应能力,并在必要时调整框架,包括在人工智能能力和最新技术发展的背景下需要调整以保持有效的地方;评估和监测人工智能在整个经济中产生的风险;进行全景扫描和差距分析,包括召集行业一同为应对新兴人工智能技术趋势提供一致的信息;支持试验台和沙盒计划,帮助人工智能创新者将新技术推向市场;提供教育和意识宣传,为企业提供清晰的指引,并赋予公民权力,让他们的声音被听到,作为框架不断迭代的组成部分;促进与国际监管框架的互用性。科学技术框架(2024年2月)2024年2月,英国发布科学技术框架政策文件(以下简称“框架”),它制定了政府到2030年使英国成为科技超级大国的战略愿景。它将人工智能确定为五大关键技术之一,并指出监管在创造人工智能蓬勃发展的环境方面发挥着重要作用。框架阐明了监管与规则方面的愿景,即英国始终处于制定技术标准和制定国际法规的前沿,并将充分利用脱欧后的自由。监管将有利于创新,刺激对科技的需求,吸引投资,同时代表英国的价值观并保护公民。政府将利用其科学技术优势和国际关系,来确保对法规和技术标准的影响力。并希望在2030年达成以下目标:一个有利于创新、易于引导并促进广泛商业科学和技术应用的法规和标准体系。监管机构对每一项关键技术的作用都将是明确的,包括它们在哪些领域跨部门和监管职责。监管机构将有权支持英国创新者的创新测试成本,使其具有国际竞争力;相对于其他国家,迅速采取行动,为关键技术制定规则,并在适当的情况下制定法规,以增加这些领域创新者的确定性。英国将在制定国内法规时考虑国际背景,以加强英国的先发优势。涵盖关键技术的法规将处于世界领先地位;19人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管领导制定关键技术标准和法规的国际行动。英国将在世贸组织、七国集团、二十国集团、经合组织、北约、欧洲理事会、英联邦和联合国发挥积极作用。英国将成为关键技术国际规则和公约的召集人和顶级作者;成为支撑关键技术国际治理的全球技术标准生态系统的优胜者。建立行业和政府的能力,形成多方利益相关者联盟来制定技术标准;利用政府的全景扫描能力,支持监管机构考虑新兴技术如何成为关键技术。行业和监管机构之间的对话将为英国的改革和促进技术发展提供信息。3.3 金融领域的人工智能监管与影响针对2023年3月发布的促进创新的人工智能监管方法白皮书,英国政府于2024年2月发布了回应。在此回应中,英格兰银行、审慎管理局、金融行为监管局以及其他已确定的监管机构被要求在4月底之前发布自己的人工智能监管计划。从其已发布的金融行业人工智能监管策略来看,总体而言,他们欢迎政府拟定的各部门引导,鼓励创新的方法。他们并未提出新的监管规则,英格兰银行、英国审慎管理局、英国金融行为监管局都认为他们已经设立了合适的监管框架来支撑政府拟定的原则。他们认为现有框架仍然适用于解决人工智能带来的风险,因为这些风险“并非唯一”。具体而言,监管机构计划依靠其商业原则、消费者责任、运营弹性规则手册、模型风险管理原则以及高级管理人员和认证制度(SM&CR)等工具。这些工具不仅会起到护栏作用,而且由于许多工具都以结果为中心,监管机构认为这将是相称的,并允许金融机构以安全的方式灵活适应和创新。针对白皮书中提出的五项原则,监管机构概述了如何通过现有框架来贯彻这些原则:安全性、保障性和稳健性:监管机构计划依靠其总体业务原则(例如,金融行为监管局的原则2,要求企业“以应有的技能、谨慎和勤勉的态度开展业务”)、基本条件以及高级管理系统和控制原始资料(SYCS)。在更精细的层面上,运营弹性、第三方风险管理和外包框架也高度相关,企业有责任管理供应商可能影响重要商业服务的任何风险。适当的透明度和可解释性:审慎管理局参考了其模型风险管理原则(其中明确要求考虑模型的可解释性和透明度)。金融行为监管局计划在消费者责任不适用的情况下,通过消费者责任(要求“与零售客户进行诚实和公开的交易”)和商业原则第7条(要求“适当考虑信息需求”)对此进行解释。英国GDPR规则也可能在公平透明处理个人数据方面发挥作用。公平性:主要由金融行为监管局的消费者责任(例如,最终指导意见专门反对公司以放大偏见的方式使用人工智能)和其他关于公平对待弱势客户的指导意见来解决。金融行为监管局还参考了其商业原则,如原则6(适当考虑客户利益)、原则7(明确传达信息)、原则8(管理利益冲突)和原则9(建议的适用性),以及其消费者保护手册章节。所有监管机构还必须遵守2010年平等法,该法要求它们适当考虑对具有受保护特征的人消除歧视的必要性。20人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管责任制与治理:该要求主要由高级管理人员和认证制度(SM&CR)涵盖。目前,人们一致认为,不需要定制SMCR AI角色,这一职责可以纳入现有职能中,例如首席运营职能(SMF24)和首席风 险职能(SMF4)。监管机构还参考了其规则手册中概述治理和组织要求的章节,而金融行为监管局也特别指出了消费者责任,审慎管理局也特别提出了模型风险管理的期望。争议与纠偏:这主要通过金融行为监管局的投诉处理框架来解决。然而,也可以通过金融监察专员服务或金融服务补偿计划(如适用)提供更广泛的保护。从金融监管机构已公布的人工智能监管计划来看,他们近期将推进的举措有:运行英国金融服务业机器学习调查的第三期;考虑跟进人工智能公私论坛(AIPPF)成果,后续成立行业联盟;考虑试点新型监管项目机会,例如人工智能沙盒;建立在既定框架之上例如,通过金融政策委员会(FPC)的网络压力测试和参与跨市场运营弹性小组(CMORG)来增强网络/运营弹性;考虑各种选择,以解决当前数据治理和管理的分散监管局面;继续与其他监管机构和公司合作,包括通过数字监管合作论坛(DRCF)等,进一步监测和了解金融市场中的人工智能部署。例如,人工智能的发展也可能放大投机行为或更广泛的顺周期行为、增加网络风险以及增强互联性,从而对金融系统的稳定性构成威胁;继续分析人工智能(AI)/机器学习(ML)之外更广泛的技术发展的影响,例如量子计算的发展,以及这些发展如何相互作用;继续参与国际倡议,如人工智能安全峰会、七国集团领导人关于广岛人工智能进程的声明、部长宣言、IOSCO、FSB、经合组织、GFIN和七国集团活动6。然而,他们也认为,金融行业人工智能的发展与应用十分迅猛,需要密切关注。他们将继续监测金融机构的人工智能部署情况,以确定是否有必要对其框架进行任何修改。例如,如果这种方法限制而不是促进创新,或者不能充分保护消费者免受有意或无意的伤害,就需要重新考虑。从对金融机构的影响来看,英国金融监管机构都利用了已有的监管体系与工具,为不同的人工智能供应商提供了足够的灵活性,以开发满足客户特定需求的创新应用。英国的监管方法是综合的、基于结果的,不同于其他司法管辖区(尤其是欧盟),后者建立了定制的、相对规范的规则手册。英国金融机构被要求在其现有的风险管理结构中考虑人工智能风险,而不是创造新的(潜在的孤立的)能力。因此,对金融机构而言,需要采取措施以确保已建立符合管理目标的人工智能风险管理工具,并充分吸纳已出台的要求7。6-7 部分内容引用自毕马威国际文章英国金融监管机构发布人工智能策略,UK FS regulators publish their AI strategies-KPMG Global。21人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管4.1 美国体系概览在美国,对人工智能的监管已经从自愿指导演变为行政行动(图12)。最初,2022年10月的人工智能权利法案蓝图奠定了基本的伦理考虑。随后,2023年1月,美国国家标准与技术研究院发布自愿性的人工智能风险管理框架。领先的人工智能公司于2023年7月做出了自愿承诺,表明行业准备应对人工智能的社会影响。2023年11月,关于安全、可靠和值得信赖的人工智能的行政命令标志着向监管监督的转变,该命令授权25个以上的机构解决与人工智能相关的危害,包括安全、隐私和歧视。这些机构的任务是制定规则、资助研究、评估风险,并通过人工智能开发人员的安全测试和报告来提高透明度。2024年5月,美国国家标准与技术研究院发布了两份生成式人工智能(GenAI)的指南草稿,以及降低合成内容风险的报告操作和人工智能标准全球合作的草稿,积极酝酿新的框架与指南。然而,在人工智能监管方面,联邦政府部门还没有采取重大的立法行动8。相比之下,州级别的立法活动较为活跃,自2020年开始,特别是2023年与2024年,部分州级人工智能立法已陆续落地生效。从美国监管政策的重点来看,主要是以促进产业发展为主,在治理时侧重于维护公平和保护隐私。其治理模式是风险评估与风险管理框架。监管机制不是单一的依赖于行政监管,而是强调政府部门与私营部门的协作。并且,为了推动人工智能技术的发展,主张企业进行自我监管9。四、美国图12:美国人工智能相关文件信息来源:毕马威自行收集整理。8 部分内容引用自Bank for International Settlements(BIS)Working Papers No.1194 Intelligent financial system:how AI is transforming finance。9 引用自人工智能监管制度概览,国家社会科学基金重点项目“人工智能研发与应用风险治理的财税法协同机制研究”(立项编号:21AFX021)的阶段性成果,来源人民法院报。22人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管4.2 重要监管文件分析以下选择美国具有标志性意义的三份监管文件进行分析。人工智能权利法案蓝图(2022年10月)2022年 10月 4日,白宫科 技政策 办公 室(OSTP)发布人工智能权利法案蓝图(以下简称“法案蓝图”)。法案蓝图由五项原则和相关实践组成,旨在指导自动化系统的设计、使用和部署,以保护人工智能时代美国公众的权利。这些原则是通过与美国公众广泛协商制定的,是构建和部署与民主价值观相一致并保护公民权利、公民自由和隐私的自动化系统的蓝图。从具体内容来看,法案蓝图包括前言、五项原则(图13)、关于应用法案蓝图的说明,以及一份技术指南,其中给出了从各级政府到各种规模的公司等多种组织可以采取的具体步骤,以维护这些价值观。尽管来自私营部门、政府和国际财团的专家已经发布了指导负责任地使用自动化系统的原则和框架;法案蓝图的框架提供了一个与行业无关的国家价值观声明和工具包,为将这些保护纳入政策、实践或技术设计过程提供信息10。在现有法律或政策(如特定行业的隐私法和监督要求)尚未提供指导的情况下,应使用法案蓝图来为政策决策提供信息。人工智能风险管理框架(2023年1月)2023年1月26日,美国国家标准与技术研究院(隶属于美国商务部)发布了人工智能风险管理框架(AI RMF 1.0)(以下简称“风险框架”),旨在帮助设计、开发、部署或使用人工智能系统的组织提高人工智能风险管理的能力,并促进人工智能系统的可信度和负责任的开发和使用。风险框架是一个自愿性的技术框架,不具备强制效力。风险框架分为两部分,第一部分讨论了组织如何构建与人工智能相关风险的框架,并描述了目标受众(图14)。之后分析了人工智能相关风险和可信赖度,概述了值得信赖的人工智能系统的特征,包括有效和可靠(Valid and Reliable),安全(Safe),保障和有弹性(Secure and Resilient),负责和透明(Accountable and Transparent),可 解 释 和 可 交 互 解 释(Explainable&Interpretable),隐 私 增 强(Privacy-Enhanced),以及公平对有害偏见进行10 部分内容引用自美国白宫科技政策办公室,Blueprint for an AI Bill of Rights的框架简介。图13:人工智能权利法案蓝图的5项原则信息来源:毕马威根据白宫科技政策办公室官网信息翻译整理。!23人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管图14:人工智能系统的全生命周期与关键维度信息来源:毕马威根据人工智能风险管理框架翻译整理。管理(Fair-With Harmful Bias Managed)。第二部分包括风险框架的“核心”。它描述了四项具体职能(图15),以帮助组织在实践中应对人工智能系统的风险,即治理(Govern)、映 射(Map)、测 量(Measure)和管理(Manage),并进一步细分了四个职能的类别和子类别。其中,治理适用于组织人工智能风险管理流程和程序的所有阶段,映射、测量与管理功能可以应用于人工智能系统特定的环境和人工智能生命周期的特定阶段。24人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管图15:治理、映射、测量、管理四项核心职能关于安全、可靠和值得信赖的人工智能的行政命令(2023年10月)2023年10月30日,美国白宫发布拜登签署的最新行政命令关于安全、可靠和值得信赖的人工智能的行政命令(以下简称“行政命令”),呼吁采取“整个政府”的方法来建立安全、可靠和值得信赖的人工智能,强调人工智能开发和部署的透明度和问责制,并指示联邦机构优先考虑促进经济增长和创造就业机会的人工智能技术,同时尽量减少对工人和社区的潜在负面影响。行政命令遵循政府的人工智能权利法案蓝图,是一套指导设计、使用和部署自动化系统以保护公众的原则和做法11。行政命令提出了8项指导原则和优先事项(图16),同时也对美政府下一步的行动措施与职责分工进行了部署与安排。4.3 金融领域的人工智能监管与影响截止目前,美国金融领域的人工智能监管规则较少,具有强制性遵循意义的两份要求来自于美国消费者金融保护局(CFPB)发布的关于复杂算法不当行动要求的通知与贷款人使用人工智能拒绝信贷的指南,旨在聚焦具体应用场景,保护金融消费者公平,避免算法与人工智能技术带来的系统性歧视。美国财政部(US Treasury)、美国证券交易委员会(SEC)、美国联邦贸易委员会(FTC)、美国商务部(DOC)、美国商品期货交易委员会(CFTC)等金融监管机构发布信息来源:毕马威根据人工智能风险管理框架翻译整理。11 部分内容引用自毕马威美国发布的监管要求报告,AI Regulations:Present&Future,Apr.2024。25人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管的文件主要形式为征求意见(Request forComment,RFC)、拟 议 规 则 预 先 通 知(AdvanceNoticeofProposedRulemaking,ANPR)、拟 议 规 则 通 知(Notice of Proposed Rulemaking,NPR)、信息请求(Request for Information,RFI)、研究报告等,主题涉及商业监控与数据安全,人工智能运用于鉴证与信托,自动化估值模型,使用预测数据分析的利益冲突等,相关内容尚处于公众探讨与意见征询阶段,对金融机构不具备约束力,但预期将在未来陆续落地出台。26人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管图16:关于安全、可靠和值得信赖的人工智能的行政命令的8项指导原则与优先事项数据来源:毕马威根据关于安全、可靠和值得信赖的人工智能的行政命令翻译整理。27人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管5.1 中国体系概览中国较早就启动了人工智能相关的规划与治理活动(图17)。2017年7月国务院发布新一代人工智能发展规划(以下简称“规划”),并在第五部分“保障措施”中,作出了制定促进人工智能发展的法律法规和伦理规范,完善支持人工智能发展的重点政策,建立人工智能技术标准和知识产权体系,建立人工智能安全监管和评估体系等整体部署,并明确由国家科技体制改革和创新体系建设领导小组牵头统筹协调,推动人工智能相关法律法规建设。承接规划部署,为促进新一代人工智能健康发展,加强人工智能法律、伦理、社会问题研究,积极推动人工智能全球治理,新一代人工智能发展规划推进办公室成立了国家新一代人工智能治理专业五、中国委员会,并陆续于2019年6月和2021年9月推出了新一代人工智能治理原则发展负责任的人工智能与新一代人工智能伦理规范,明确了中国人工智能治理原则与伦理规范。中国亦积极参与国际人工智能治理,于2023年发布了全球人工智能治理倡议,并在2024年7月召开的2024世界人工智能大会暨人工智能全球治理高级别会议上,发布了人工智能全球治理上海宣言。整体来看,目前中国的人工智能领域具有强制约束力的监管文件较少,已出台文件主要集中于规划蓝图、治理原则、伦理规范等软性约束。但预计未来将有更多人工智能领域的法律法规和政策文件陆续出台。图17:中国人工智能相关文件信息来源:毕马威自行收集整理。28人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管5.2 重要监管文件分析以下选择中国具有标志性意义的三份监管文件进行分析。新一代人工智能治理原则发展负责任的人工智能(2019年6月)2019年6月17日,国家新一代人工智能治理专业委员会发布新一代人工智能治理原则发展负责任的人工智能(以下简称“治理原则”),提出了人工智能治理的框架和行动指南。这是中国促进新一代人工智能健康发展,加强人工智能法律、伦理、社会问题研究,积极推动人工智能全球治理的一项重要成果12。治理原则包含8个方面(图18),具体内容为:和谐友好。人工智能发展应以增进人类共同福祉为目标;应符合人类的价值观和伦理道德,促进人机和谐,服务人类文明进步;应以保障社会安全、尊重人类权益为前提,避免误用,禁止滥用、恶用;公平公正。人工智能发展应促进公平公正,保障利益相关者的权益,促进机会均等。通过持续提高技术水平、改善管理方式,在数据获取、算法设计、技术开发、产品研发和应用过程中消除偏见和歧视;包容共享。人工智能应促进绿色发展,符合环境友好、资源节约的要求;应促进协调发展,推动各行各业转型升级,缩小区域差距;应促进包容发展,加强人工智能教育及科普,提升弱势群体适应性,努力消除数字鸿沟;应促进共享发展,避免数据与平台垄断,鼓励开放有序竞争;尊重隐私。人工智能发展应尊重和保护个人隐私,充分保障个人的知情权和选择权。在个人信息的收集、存储、处理、使用等各环节应设置边界,建立规范。完善个人数据授权撤销机制,反对任何窃取、篡改、泄露和其他非法收集利用个人信息的行为;图18:新一代人工智能治理8项原则信息来源:毕马威根据新一代人工智能治理原则发展负责任的人工智能整理。12、部分内容引用自人民日报,我国发布治理原则发展负责任的人工智能,2019年6月18日。29人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管安全可控。人工智能系统应不断提升透明性、可解释性、可靠性、可控性,逐步实现可审核、可监督、可追溯、可信赖。高度关注人工智能系统的安全,提高人工智能鲁棒性及抗干扰性,形成人工智能安全评估和管控能力;共担责任。人工智能研发者、使用者及其他相关方应具有高度的社会责任感和自律意识,严格遵守法律法规、伦理道德和标准规范。建立人工智能问责机制,明确研发者、使用者和受用者等的责任。人工智能应用过程中应确保人类知情权,告知可能产生的风险和影响。防范利用人工智能进行非法活动;开放协作。鼓励跨学科、跨领域、跨地区、跨国界的交流合作,推动国际组织、政府部门、科研机构、教育机构、企业、社会组织、公众在人工智能发展与治理中的协调互动。开展国际对话与合作,在充分尊重各国人工智能治理原则和实践的前提下,推动形成具有广泛共识的国际人工智能治理框架和标准规范;敏捷治理。尊重人工智能发展规律,在推动人工智能创新发展、有序发展的同时,及时发现和解决可能引发的风险。不断提升智能化技术手段,优化管理机制,完善治理体系,推动治理原则贯穿人工智能产品和服务的全生命周期。对未来更高级人工智能的潜在风险持续开展研究和预判,确保人工智能始终朝着有利于社会的方向发展。新一代人工智能伦理规范(2021年9月)2021年9月25日,国家新一代人工智能治理专业委员会发布了新一代人工智能伦理规范(以下简称伦理规范),旨在将伦理道德融入人工智能全生命周期,为从事人工智能相关活动的自然人、法人和其他相关机构等提供伦理指引13。伦理规范提出了6项基本伦理要求,以及人工智能管理、研发、供应、使用等特定活动的18项具体伦理要求。6项基本伦理要求(图19)为:图19:新一代人工智能基本伦理要求信息来源:毕马威根据新一代人工智能伦理规范整理。13、引用自科学技术部官方网站,新一代人工智能伦理规范发布,2021年9月26日。30人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管增进人类福祉。坚持以人为本,遵循人类共同价值观,尊重人权和人类根本利益诉求,遵守国家或地区伦理道德。坚持公共利益优先,促进人机和谐友好,改善民生,增强获得感幸福感,推动经济、社会及生态可持续发展,共建人类命运共同体;促进公平公正。坚持普惠性和包容性,切实保护各相关主体合法权益,推动全社会公平共享人工智能带来的益处,促进社会公平正义和机会均等。在提供人工智能产品和服务时,应充分尊重和帮助弱势群体、特殊群体,并根据需要提供相应替代方案;保护隐私安全。充分尊重个人信息知情、同意等权利,依照合法、正当、必要和诚信原则处理个人信息,保障个人隐私与数据安全,不得损害个人合法数据权益,不得以窃取、篡改、泄露等方式非法收集利用个人信息,不得侵害个人隐私权;确保可控可信。保障人类拥有充分自主决策权,有权选择是否接受人工智能提供的服务,有权随时退出与人工智能的交互,有权随时中止人工智能系统的运行,确保人工智能始终处于人类控制之下;强化责任担当。坚持人类是最终责任主体,明确利益相关者的责任,全面增强责任意识,在人工智能全生命周期各环节自省自律,建立人工智能问责机制,不回避责任审查,不逃避应负责任;提升伦理素养。积极学习和普及人工智能伦理知识,客观认识伦理问题,不低估不夸大伦理风险。主动开展或参与人工智能伦理问题讨论,深入推动人工智能伦理治理实践,提升应对能力。18项人工智能管理、研发、供应、使用等特定活动的具体伦理要求为(图20):图20:新一代人工智能管理、研发、供应、使用的伦理要求信息来源:毕马威根据新一代人工智能伦理规范整理。31人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管全球人工智能治理倡议(2023年10月)2023年10月18日,中国国家互联网信息办公室发布全球人工智能治理倡议(以下简称“倡议”),围绕人工智能发展、安全、治理三方面系统阐述了人工智能治理中国方案。倡议提出,各国应秉持共同、综合、合作、可持续的安全观,坚持发展和安全并重的原则,通过对话与合作凝聚共识,构建开放、公正、有效的治理机制,促进人工智能技术造福于人类,推动构建人类命运共同体。各国应在人工智能治理中加强信息交流和技术合作,共同做好风险防范,形成具有广泛共识的人工智能治理框架和标准规范,不断提升人工智能技术的安全性、可靠性、可控性、公平性。并进而提出了11项倡议:发展人工智能应坚持“以人为本”理念,以增进人类共同福祉为目标,以保障社会安全、尊重人类权益为前提,确保人工智能始终朝着有利于人类文明进步的方向发展。积极支持以人工智能助力可持续发展,应对气候变化、生物多样性保护等全球性挑战;面向他国提供人工智能产品和服务时,应尊重他国主权,严格遵守他国法律,接受他国法律管辖。反对利用人工智能技术优势操纵舆论、传播虚假信息,干涉他国内政、社会制度及社会秩序,危害他国主权;发展人工智能应坚持“智能向善”的宗旨,遵守适用的国际法,符合和平、发展、公平、正义、民主、自由的全人类共同价值,共同防范和打击恐怖主义、极端势力和跨国有组织犯罪集团对人工智能技术的恶用滥用。各国尤其是大国对在军事领域研发和使用人工智能技术应该采取慎重负责的态度;发展人工智能应坚持相互尊重、平等互利的原则,各国无论大小、强弱,无论社会制度如何,都有平等发展和利用人工智能的权利。鼓励全球共同推动人工智能健康发展,共享人工智能知识成果,开源人工智能技术。反对以意识形态划线或构建排他性集团,恶意阻挠他国人工智能发展。反对利用技术垄断和单边强制措施制造发展壁垒,恶意阻断全球人工智能供应链;推动建立风险等级测试评估体系,实施敏捷治理,分类分级管理,快速有效响应。研发主体不断提高人工智能可解释性和可预测性,提升数据真实性和准确性,确保人工智能始终处于人类控制之下,打造可审核、可监督、可追溯、可信赖的人工智能技术;逐步建立健全法律和规章制度,保障人工智能研发和应用中的个人隐私与数据安全,反对窃取、篡改、泄露和其他非法收集利用个人信息的行为;坚持公平性和非歧视性原则,避免在数据获取、算法设计、技术开发、产品研发与应用过程中,产生针对不同或特定民族、信仰、国别、性别等偏见和歧视;坚持伦理先行,建立并完善人工智能伦理准则、规范及问责机制,形成人工智能伦理指南,建立科技伦理审查和监管制度,明确人工智能相关主体的责任和权力边界,充分尊重并保障各群体合法权益,及时回应国内和国际相关伦理关切;32人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管坚持广泛参与、协商一致、循序渐进的原则,密切跟踪技术发展形势,开展风险评估和政策沟通,分享最佳操作实践。在此基础上,通过对话与合作,在充分尊重各国政策和实践差异性基础上,推动多利益攸关方积极参与,在国际人工智能治理领域形成广泛共识;积极发展用于人工智能治理的相关技术开发与应用,支持以人工智能技术防范人工智能风险,提高人工智能治理的技术能力;增强发展中国家在人工智能全球治理中的代表性和发言权,确保各国人工智能发展与治理的权利平等、机会平等、规则平等,开展面向发展中国家的国际合作与援助,不断弥合智能鸿沟和治理能力差距。积极支持在联合国框架下讨论成立国际人工智能治理机构,协调国际人工智能发展、安全与治理重大问题。5.3 金融领域的人工智能监管与影响目前中国尚未出台金融领域人工智能监管的专门法律法规,但在消费者保护领域,已有算法规制、互联网广告等相关联的适用监管要求。在行业标准与自律规范方面,中国人民银行于2021年3月发布了人工智能算法金融应用评价规范,提供了金融领域应用人工智能算法的基本要求、评价方法和判定准则。2022年10月,中国银行业协会发布人工智能模型风险管理框架,规范了银行业金融机构在开展人工智能模型需求分析、数据准备、模型构建、检验验证、模型部署、模型监控、持续验证与确认、模型修正、模型下线等关键活动过程中进行风险管理需考虑的相关方面。2023年8月,国家市场监督管理总局、国家标准化管理委员会发布信息安全技术机器学习算法安全评估规范(GB/T 42888-2023),规定了机器学习算法技术和服务的安全要求和评估方法,以及机器学习算法安全评估流程等。2023年9月,中国信息通信研究院联合多家企业发布了国内首个金融行业大模型标准面向行业的大规模预训练模型技术和应用评估方法 第1部分:金融大模型,旨在规范金融大模型的研发和应用过程,提高模型的准确性和可靠性,促进金融行业的智能化发展。但相关规范均为参考、指南类的软性文件,对金融机构不具有强制约束力。以下我们将对人工智能算法金融应用评价规范、人工智能模型风险管理框架两份金融业人工智能相关文件进行重点分析。人工智能算法金融应用评价规范(2021年3月)为全面提升人工智能技术在金融领域应用和管理水平,推动金融与科技深度融合协调发展,2021年3月26日,中国人民银行发布金融行业标准 JR/T 0221-2021人工智能算法金融应用评价规范(以下简称“规范”)。规范针对人工智能技术应用存在的算法黑箱、算法同质化、模型缺陷等潜在风险问题,建立了人工智能金融应用算法评价框架,从安全性、可解释性、精准性和性能等方面系统化地提出基本要求、评价方法和判定准则,为金融机构加强智能算法应用风险管理提供了指引14。规范明确其适用对象为开展人工智能算法金融应用的金融机构、算法提供商和第三方安全评估机构等。首先,规范提出了整体评价框架(图21),并区分各项内容的适用场景为资金类场景和非资金类场景15。14 部分内容引用自经济参考网文章出炉 助力打造金融创新发展新引擎。15 引用内容来源于中国人民银行,人工智能算法金融应用评价规范(JR/T 0221-2021)。33人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管图21:AI算法评价内容框架图信息来源:引用自人工智能算法金融应用评价规范。其次,规范对可采用的评价方法进行了详细列示与说明,包括查阅资料、查看系统、访谈人员、系统测试、攻击测试、算法测试与查看算法。最后,规范结合整体框架提出的评价内容,对每项内容包含的基本要求,建议采用的评价方法及判定准则进行了详细阐述。并以附录形式提供了金融行业AI精准性的相关指标定义,覆盖分类算法模型、回归算法模型、图像识别模型、自然语言处理模型等四类模型的15个指标。人工智能模型风险管理框架(2022年10月)2022年10月24日,中国银行业协会发布团体技术报告 TR/CBA 106-2022人工智能模型风险管理框架(以下简称“框架”)。框架针对银行业金融机构在管理、研发、供应、使用人工智能模型过程中面临的主要风险挑战,根据行业特性,给出银行业金融机构在开展人工智能模型需求分析、数据准备、模型构建、检验验证、模型部署、模型监控、持续验证与确认、模型修正、模型下线等关键活动过程中进行风险管理需要考虑内容的框架。框架适用于银行业金融机构,向银行业金融机构提供人工智能服务和支持的相关机构亦能作为参考16。16 部分内容引用自团体技术报告 TR/CBA 106-2022人工智能模型风险管理框架。34人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管框架采取了“分级管理、逐步递增”的基本策略,将人工智能模型风险管理措施分为逐步递增的三个级别(图22)。根据其内容来看,第一级为“不能有效地管控风险”,第二级为人工智能风险管理的基础要求,第三级为较佳实践。框架依据模型生命周期中的九个主要环节,以及特殊过程的两类事项,详细阐述了其适用的风险分级管理措施(图23),内容详细覆盖组织架构与职责分工、流程与工作机制、报告文档规范、系统平台与工具功能、模型监控指标等,对于银行业金融机构具有较强的指导意义。图22:人工智能风险管理措施的三个级别信息来源:毕马威根据人工智能模型风险管理框架整理。图23:模型生命周期与特殊过程信息来源:毕马威根据人工智能模型风险管理框架整理。35人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。主要国家/地区人工智能监管从对金融机构的影响与合规建议来看,整体而言,金融机构面临的人工智能相关硬性约束较少,而已发布的软性指导文件集中在各行业通用性的、高层次的人工智能治理原则与伦理规范;针对金融业侧重于算法模型开发应用过程中的风险应对、安全评估等技术领域的规范要求;以及消费者权益保护视角的算法规制与互联网广告要求等。但随着中国人工智能技术的快速发展及应用转化,金融行业已广泛将人工智能技术投入于智能营销、智慧投顾、投诉处理、风险管理、制度审阅、合规测试等领域的探索。建议金融机构一方面做好已发布的监管规则的合规,以及结合机构管理实际,主动应用各项自律规范与行业标准;另一方面主动调研行业市场及机构内部的人工智能应用现状,保持对于人工智能技术发展与监管立法进程的动态关注,并结合风险控制目标,前瞻性地将人工智能治理要求与风险管控融入日常管理流程中(图24)。同时关注机构内部人工智能相关人才与资源储备,以备未来应对人工智能的应用发展与监管变化。图24:中国人工智能相关要求与金融机构合规建议数据来源:毕马威自行收集整理。36人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。结语总体而言,在人工智能监管方面,国际组织与各国家地区截至目前出台的专门性法律法规较少,其立法尚处于研究摸索与实践探寻的初级阶段;但随着欧盟人工智能法案的落地生效,预计未来各国家/地区的监管立法活动将提速。目前多数已发布文件为人工智能相关的监管指导性文件,其治理框架、原则、伦理规范等,对金融机构具有一定的指导意义,但政府部门与监管机构仍将大部分实际实施空间留给了金融机构自己。随着人工智能技术在金融业的应用不断拓展与丰富,其蕴含的风险与问题将不断涌现暴露,特别是在金融业整体严监管态势与结果合规的导向下,需要金融机构主动作为,积极应对,一方面贯彻已颁布的监管要求与规范倡导,另一方面运用机构已有的风险三道防线设置与管理机制,以及与人工智能相关的数据安全、个人信息保护、网络安全等领域的管理机制与管理工具,从风险视角实施目标管控,确保在整个端到端商业模式中满足监管预期并充分考虑人工智能风险。此外,考虑到国际不同区域、国家之间人工智能监管立法发展不均衡的现状,全球化经营的大型金融机构在整体开发与部署人工智能时,还需关注不同区域/国家机构的监管要求与合规达标,特别是欧盟等人工智能立法步速较快的国家与地区,以充分挖掘人工智能技术的金融应用潜力,在合理管控潜在风险的前提下促进创新。2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。37人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。附件一:全球人工智能监管文件清单序号序号立法机构立法机构文件名称文件名称年度年度具体时间具体时间国别国别/区域区域1国务院新一代人工智能发展规划2017Jul.2017中国225 European CountriesDeclaration of cooperation on Artificial Intelligence(AI)2018Apr.2018欧洲3Federal Financial Supervisory Authority of Germany(BaFin)Big Data meets AI2018Jul.2018德国4US TreasuryA financial system that creates economic opportunities:nonbank financials,fintech,and innovation2018Jul.2018美国5Monetary Authority of Singapore(MAS)Principles to promote fairness,ethics,accountability and transparency(FEAT)in the use of AI and data analytics in Singapores financial sector2018Nov.2018新加坡6Financial Sector Supervisory Commission of Luxembourg(CSSF)AI:Opportunities,risks and recommendations for the financial sector2018Dec.2018卢森堡7the European CommissionCoordinated Plan on Artificial Intelligence2018Dec.2018欧盟8White HouseExecutive Order on Maintaining American Leadership in AI2019Feb.2019美国9Independent High-level Expert Group on AI(set up by the European Commission)Ethics guidelines for trustworthy AI(draft version in Dec.2018)2019Apr.2019欧盟10European Insurance and Occupational Pensions AuthorityBig data analytics in motor and health insurance:A thematic review2019May.2019欧盟11Organisation for Economic Cooperation and Development(OECD)AI Principles2019May.2019国际组织12G20AI Principles2019Jun.2019国际组织13国家新一代人工智能治理专业委员会新一代人工智能治理原则发展负责任的人工智能2019Jun.2019中国14Netherlands BankGeneral principles for the use of AI in the financial sector2019Jul.2019荷兰15Bank of England and Financial Conduct AuthorityResearch Note:Machine Learning in UK financial services2019Oct.2019英国16Hong Kong Monetary AuthorityHigh-level principles on AI2019Nov.2019香港17Hong Kong Monetary AuthorityConsumer protection in respect of Use of Big Data Analytics and Artificial Intelligence by Authorized Institutions2019Nov.2019香港18IllinoisAI Video Interview Act became effective2020Jan.2020美国19European Banking AuthorityReport on big data and advanced analytics2020Jan.2020欧盟38人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。序号序号立法机构立法机构文件名称文件名称年度年度具体时间具体时间国别国别/区域区域20French Prudential Supervision and Resolution Authority(ACPR)Governance of AI in Finance2020Jan.2020法国21UKs Information Commissioners Officedraft Guidance on the AI auditing framework2020Feb.2020英国22the European CommissionWhite paper on AI:a European approach to excellence and trust2020Feb.2020欧盟23UKs Information Commissioners OfficeGuidance on AI and data protection2020Jul.2020英国24National Association of Insurance CommissionersPrinciples for Artificial Intelligence2020Aug.2020美国25Department of the Treasury,Office of the Comptroller of the Currency,Board of Governors of the Federal Reserve System,Federal Deposit Insurance Corporation,Bureau of Consumer Financial Protection,National Credit Union AdministrationRequest for information and comment on financial institutions use of AI,including machine learning2021Mar.2021美国26中国人民银行人工智能算法金融应用评价规范2021Mar.2021中国27the European CommissionProposal for a regulation laying down harmonised rules on AI2021Apr.2021欧盟28European Insurance and Occupational Pensions AuthorityArtificial intelligence governance principles:towards ethical and trustworthy artificial intelligence in the European insurance sector2021Jun.2021欧盟29Federal Financial Supervisory Authority of Germany(BaFin)Big data and artificial intelligence:Principles for the use of algorithms in decision-making processes2021Jun.2021德国30Securities and Exchange Commission(SEC)Request for information on Digital engagement practices(DEPs)2021Aug.2021美国31Bank for International Settlements(BIS)Humans keeping AI in check emerging regulatory expectations in the financial sector2021Aug.2021国际组织32International Organization of Securities Commissions(IOSCO)The use of artificial intelligence and machine learning by market intermediaries and asset managers Final Report2021Sep.2021国际组织33国家新一代人工智能治理专业委员会新一代人工智能伦理规范2021Sep.2021中国34Department for Science,Innovation and Technology,Office for Artificial Intelligence,Department for Digital,Culture,Media&Sport and Department for Business,Energy&Industrial StrategyNational AI Strategy2021Sep.2021英国39人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。序号序号立法机构立法机构文件名称文件名称年度年度具体时间具体时间国别国别/区域区域35Monetary Authority of Singapore(MAS)National programme to deepen AI capabilities in financial services2021Nov.2021新加坡36United Nations Educational Scientific and Cultural Organization(UNESCO)Recommendation on the Ethics of Artificial Intelligence2021Nov.2021国际组织37Federal Trade Commission(FTC)Final Amendments to Safeguards Rule become effective2022Jan.2022美国38Bank of England,Financial Conduct AuthorityArtificial Intelligence Public-Private Forum Final Report2022Feb.2022英国39Consumer Financial Protection Bureau(CFPB)Circular on adverse action requirements for complex algorithms2022May.2022美国40Department for Business,Energy&Industrial Strategy,Department forDigital,Culture,Media&Sport,Department for Science,Innovation&Technology,Office for Artificial IntelligencePolicy paper:Establishing a pro-innovation approach to regulating AI2022Jul.2022英国41Federal Trade Commission(FTC)ANPR on commercial surveillance and data security2022Aug.2022美国42the European CommissionProposal for a DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on adapting non-contractual civil liability rules to artificial intelligence(AI Liability Directive)2022Sep.2022欧盟43White HouseBlueprint for AI Bill of Rights2022Oct.2022美国44Bank of EnglandDP5/22-Artificial Intelligence and Machine Learning(Discussion Paper)2022Oct.2022英国45Bank of England and Financial Conduct AuthorityResearch Note:Machine learning in UK financial services 20222022Oct.2022英国46UKs Information Commissioners OfficeExplaining decisions made with AI2022Oct.2022英国47中国银行业协会人工智能模型风险管理框架2022Oct.2022中国48CaliforniaCPPA/CPRA became effective2023Jan.2023美国49VirginiaConsumer Data Protection Act(VCDPA)became effective2023Jan.2023美国50National Institute of Standards and Technology(NIST)Voluntary AI Risk Management Framework2023Jan.2023美国51Federal Trade Commission(FTC)Blogs on advertising AI products/services and AI&UDAP2023Feb/Mar.2023美国52International Organization for Standardization(ISO)/International Electrotechnical Commission(IEC)ISO/IEC 23894:2023Information technology Artificial intelligence Guidance on risk management2023Feb.2023国际组织40人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。序号序号立法机构立法机构文件名称文件名称年度年度具体时间具体时间国别国别/区域区域53Department for Science,Innovation&Technology AI regulation:a pro-innovation approach2023Mar.2023英国54UKs Information Commissioners OfficeGuidance on AI and data protection 2023Mar.2023英国55Securities and Exchange Commission(SEC)Proposal to amend Regulation S-P2023Mar.2023美国56The Consumer Financial Protection Bureau(CFPB),the Department of Justice Civil Rights Division(DOJ),the Equal Employment Opportunity Commission(EEOC),and the Federal Trade Commission(FTC)Interagency Statement on supervision and enforcement of automated systems2023Apr.2023美国57Department of Commerce(DOC)NTIA Request for Comment on AI assurance and trust2023Apr.2023美国58MontanaEnacted the Consumer Data Privacy Act2023May.2023美国59Federal Trade Commission(FTC)Policy Statement on Misuse of Biometric Info2023May.2023美国60CongressMultiple hearings on AI,oversight,and intellectual property2023May.2023美国61Interagency:Office of the Comptroller of the Currency(OCC),US Treasury;Board of Governors of the Federal Reserve System(Board);Federal Deposit Insurance Corporation(FDIC);National Credit Union Administration(NCUA);Consumer Financial Protection Bureau(CFPB);and Federal Housing Finance Agency(FHFA)NPR on amendments to FIRREA regarding automated valuation models2023Jun.2023美国62New York CityAutomated Employment Decision Tool law becomes effective2023Jul.2023美国63Securities and Exchange Commission(SEC)NPR on Conflicts of Interest using predictive data analytics2023Jul.2023美国64ColoradoColorado Privacy Act becomes effective2023Jul.2023美国65ConnecticutConnecticut Data Privacy Act becomes effective2023Jul.2023美国66国家互联网信息办公室,国家发展和改革委员会,教育部,科学技术部,工业和信息化部,公安部,国家广播电视总局生成式人工智能服务管理暂行办法2023Jul.2023中国67ConnecticutAct concerning Artificial intelligence,automated decision-making and personal data privacy2023Jul.2023美国41人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。序号序号立法机构立法机构文件名称文件名称年度年度具体时间具体时间国别国别/区域区域68全国信息安全标准化技术委员会关于发布网络安全标准实践指南生成式人工智能服务内容标识方法的通知2023Aug.2023中国69国家市场监督管理总局、国家标准化管理委员会信息安全技术机器学习算法安全评估规范(GB/T 42888-2023)2023Aug.2023中国70White HouseLaunch of AI Cyber Challenge2023Aug.2023美国71中国信息通信研究院面向行业的大规模预训练模型技术和应用评估方法 第1部分:金融大模型2023Sep.2023中国72Cybersecurity and Infrastructure Security Agency(CISA),with NSA/FBIcybersecurity info sheet on deepfakes2023Sep.2023美国73White HouseFact Sheet on voluntary commitments from AI companies on AI risk management2023Sep.2023美国74Consumer Financial Protection Bureau(CFPB)Guidance on Credit Denials by Lenders Using Artificial Intelligence2023Sep.2023美国75White HouseExecutive Order on Safe,Secure and Trustworthy AI2023Oct.2023美国76the Group of Seven(G7)G7 Leaders Statement on the Hiroshima AI Process the Hiroshima Process International Guiding Principles for Organizations Developing Advanced AI Systems and the Hiroshima Process International Code of Conduct for Organizations Developing Advanced AI Systems2023Oct.2023国际组织77Financial Conduct Authority(FCA)FS23/6:Artificial Intelligence and Machine Learning(Feedback Statement)2023Oct.2023英国78国家互联网信息办公室全球人工智能治理倡议2023Oct.2023中国79首届全球人工智能(AI)安全峰会Bletchley Declaration布莱切利宣言2023Nov.2023国际组织80National Institute of Standards and Technology(NIST)Request for Information(RFI)to assist with implementation of its responsibilities under the recent Executive Order on Safe,Secure,and Trustworthy Development and Use of Artificial Intelligence2023Dec.2023美国81The Institute of Internal AuditorsArtificial Intelligence Auditing Framework2023-国际组织82Bank for International Settlements(BIS)Artificial intelligence in central banking2024Jan.2024国际组织83White HouseFinancial Services Committee bipartisan working group on AI2024Jan.2024美国42人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。序号序号立法机构立法机构文件名称文件名称年度年度具体时间具体时间国别国别/区域区域84New York State Department of Finance Services(NYDFS)纽约州金融服务部Proposed guidance on AI in the insurance industry2024Jan.2024美国85Commodity Futures Trading Commission(CFTC)RFC on AI uses/risks2024Jan.2024美国86White HouseFact Sheet on AI Actions related to EO2024Jan.2024美国87Department for Science,Innovation&Technology 英国政府A pro-innovation approach to AI regulation:government response2024Feb.2024英国88Department for Science,Innovation&Technology,Prime Ministers OfficePolicy paper:The UK Science and Technology Framework2024Feb.2024英国89UtahArtificial Intelligence Policy Act2024Mar.2024美国90Hong Kong Monetary Authority(HKMA)Thematic Review of Transaction Monitoring Systems and Use of Artificial Intelligence2024Apr.2024香港91Bank for International Settlements(BIS)Project Raven:using AI to assess financial systems cyber security and resilience2024Apr.2024国际组织92Financial Conduct Authority(FCA)AI Update2024Apr.2024英国93Council of EuropeFramework Convention on Artificial Intelligence and Human Rights,Democracy and the Rule of Law2024May.2024欧洲94Council of Europethe EU Artificial Intelligence Act(draft version in Dec.2023)2024May.2024欧洲95Bank for International Settlements(BIS)Generative artificial intelligence and cyber security in central banking2024May.2024国际组织96The Bipartisan Senate AI Working GroupDriving U.S.Innovation in Artificial Intelligence2024May.2024美国97National Institute of Standards and Technology(NIST)Draft-Guidance:Artificial Intelligence Risk Management Framework:Generative Artificial Intelligence(GenAI)Profile(NIST AI 600-1)2024May.2024美国98National Institute of Standards and Technology(NIST)Draft-Guidance:Secure Software Development Practices for GenAI and Dual-Use Foundation Models(NIST Special Publication(SP)800-218A)2024May.2024美国99National Institute of Standards and Technology(NIST)Draft-Report:Reducing Risks Posed by Synthetic Content(NIST AI 100-4)2024May.2024美国43人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。序号序号立法机构立法机构文件名称文件名称年度年度具体时间具体时间国别国别/区域区域100National Institute of Standards and Technology(NIST)Draft-Plan:Global Collaboration on AI Standards(NIST AI 100-5)2024May.2024美国101ColoradoColorado Artificial Intelligence Act(CAIA)2024Jun.2024美国102Bank for International Settlements(BIS)Intelligent financial system:how AI is transforming finance2024Jun.2024国际组织103European Central BankDigital innovation and banking regulation2024Jun.2024欧洲104Financial Industry Regulatory Authority(FINRA)Regulatory Notice 24-09:FINRA Reminds Members of Regulatory Obligations When Using Generative Artificial Intelligence and Large Language Models2024Jun.2024美国105the European CommissionA targeted consultation and a workshop series to seek input from stakeholders on the use of artificial intelligence(AI)in finance2024Jun.2024欧盟106Department of the TreasuryRequest for Information on Uses,Opportunities,and Risks of Artificial Intelligence in the Financial Services Sector2024Jun.2024美国1072024世界人工智能大会暨人工智能全球治理高级别会议人工智能全球治理上海宣言2024Jul.2024中国108欧洲保险与职业养老金局关于适用于保险行业人工智能系统的监管框架的情况说明书2024Jul.2024欧洲44人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。附件二:各地区/国家人工智能相关监管机构清单机构名称机构名称(中文)国家/地区Organisation for Economic Cooperation and Development(OECD)世界经济合作组织国际组织G20二十国集团国际组织the Group of Seven(G7)七国集团国际组织United Nations Educational Scientific and Cultural Organization(UNESCO)联合国教科文组织国际组织International Organization for Standardization(ISO)国际标准化组织国际组织International Electrotechnical Commission(IEC)国际电工委员会国际组织International Organization of Securities Commissions(IOSCO)国际证券事务监察委员会组织国际组织Bank for International Settlements(BIS)国际清算银行国际组织The Institute of Internal Auditors(IIA)国际内部审计师协会国际组织Council of Europe欧洲理事会欧盟/欧洲the European Commission欧盟委员会欧盟/欧洲Independent High-level Expert Group on AI(set up by the European Commission)欧盟委员会欧盟/欧洲European Banking Authority欧洲银行管理局欧盟/欧洲European Central Bank欧洲中央银行欧盟/欧洲European Insurance and Occupational Pensions Authority欧洲保险与职业养老金局欧盟/欧洲Bank of England英格兰银行英国Financial Conduct Authority(FCA)金融行为监管局英国UKs Information Commissioners Office信息专员办公室英国Department for Science,Innovation and Technology科学、创新和技术部英国Office for Artificial Intelligence人工智能办公室英国Department for Digital,Culture,Media&Sport英国数字、文化、媒体和体育部英国Department for Business,Energy&Industrial Strategy商业、能源和工业战略部英国White House白宫美国Congress议会美国The Bipartisan Senate AI Working Group两党参议院人工智能工作组美国US Treasury财政部美国Department of Commerce(DOC)商务部美国Federal Trade Commission(FTC)联邦贸易委员会美国Securities and Exchange Commission(SEC)证券交易委员会美国Consumer Financial Protection Bureau(CFPB)消费者金融保护局美国National Institute of Standards and Technology(NIST)美国国家标准与技术研究院美国the Department of Justice Civil Rights Division(DOJ)司法部民权司美国the Equal Employment Opportunity Commission(EEOC)平等就业机会委员会美国Office of the Comptroller of the Currency(OCC)货币监理署美国Board of Governors of the Federal Reserve System(Board)联邦储备系统理事会美国Federal Deposit Insurance Corporation(FDIC)联邦存款保险公司美国National Credit Union Administration(NCUA)全国信用合作社管理局美国45人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。机构名称机构名称(中文)国家/地区Federal Housing Finance Agency(FHFA)联邦住房金融局美国Cybersecurity and Infrastructure Security Agency(CISA)网络安全和基础设施安全局美国Commodity Futures Trading Commission(CFTC)商品期货交易委员会美国National Telecommunications and Information Administration(NTIA)国家电信和信息管理局美国National Association of Insurance Commissioners保险专员协会美国New York State Department of Finance Services(NYDFS)纽约州金融服务部美国Financial Industry Regulatory Authority(FINRA)金融业监管局美国国务院国务院中国国家新一代人工智能治理专业委员会国家新一代人工智能治理专业委员会中国国家发展和改革委员会国家发展和改革委员会中国教育部教育部中国科学技术部科学技术部中国工业和信息化部工业和信息化部中国公安部公安部中国国家广播电视总局国家广播电视总局中国全国信息安全标准化技术委员会全国信息安全标准化技术委员会中国国家互联网信息办公室国家互联网信息办公室中国中国信息通信研究院中国信息通信研究院中国Federal Financial Supervisory Authority of Germany(BaFin)联邦金融监管局德国Monetary Authority of Singapore(MAS)新加坡金融管理局新加坡Financial Sector Supervisory Commission of Luxembourg(CSSF)卢森堡金融部门监督委员会卢森堡Netherlands Bank荷兰银行荷兰French Prudential Supervision and Resolution Authority(ACPR)法国审慎监管和处置机构法国Hong Kong Monetary Authority(HKMA)香港金融管理局香港46人工智能(AI)国际金融监管初探 2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。联系我们李砾金融研究中心合伙人毕马威中国电话: 86 139 1033 7443邮箱:靳蓓金融研究中心副总监毕马威中国电话: 86 136 1115 0725邮箱:赵一诺金融研究中心副总监毕马威中国电话: 86 139 1170 3295邮箱:所载资料仅供一般参考用,并非针对任何个人或团体的个别情况而提供。虽然本所已致力提供准确和及时的资料,但本所不能保证这些资料在阁下收取时或日后仍然准确。任何人士不应在没有详细考虑相关的情况及获取适当的专业意见下依据所载资料行事。2024 毕马威华振会计师事务所(特殊普通合伙)中国合伙制会计师事务所,是与毕马威国际有限公司(英国私营担保有限公司)相关联的独立成员所全球组织中的成员。版权所有,不得转载。在中国印刷。毕马威的名称和标识均为毕马威全球组织中的独立成员所经许可后使用的商标。二零二四年九月出版
请务必阅读正文之后的信息披露和法律声明 Table_MainInfo 行业研究/信息服务 证券研究报告 行业专题报告行业专题报告 2024 年 09 月 25 日 Table_InvestInfo 投资评级 优于大市优于大市 维持维持 市场表现市场表现 Table_QuoteInfo 2995.454764.316533.188302.0510070.9211839.792023/92023/122024/32024/6信息服务海通综指 资料来源:海通证券研究所 相关研究相关研究 Table_ReportInfo 工业重点行业领域设备更新和技术改造指南发布,以设备更新为契机加速推进工业软件国产化2024.09.22 计算机行业跟踪周报 355 期:华为全联接大会全面拥抱 AI,工信部印发设备更新指南2024.09.22 计算机行业跟踪周报 354 期:OpenAI 发布新模型,苹果华为新机同日推出2024.09.15 Table_AuthorInfo 分析师:杨林 Tel:(021)23183969 Email: 证书:S0850517080008 分析师:杨蒙 Tel:(021)23185700 Email: 证书:S0850523090001 分析师:魏宗 Tel:021-23180000 Email: 证书:S0850524040003 联系人:杨昊翊 Tel:(021)23185620 Email: OpenAI o1 初探初探:或能或能成为成为引领引领 AI Phenomenal Ride 的的 LLM 新范式新范式 Table_Summary 投资要点:投资要点:OpenAI 发布发布 o1 系列大模型系列大模型,AI 大模型进入新纪元大模型进入新纪元。9 月 12 日,OpenAI 宣布开发了一系列全新 AI 模型:OpenAI o1,与之前的模型相比,这些模型能够更好地进行推理,这是一项重大进展,代表了 AI 能力的新高度。o1 在物理、化在物理、化学和生物学等困难的基准任务中表现与博士生相似学和生物学等困难的基准任务中表现与博士生相似,此外,o1 在数学和编程领域也表现优异。在国际数学奥林匹克竞赛的资格考试中,GPT-4o 仅正确解答了仅正确解答了13%的问题,而的问题,而 OpenAI o1 的正确率达到了的正确率达到了 83%。在 Codeforces 编程比赛中,OpenAI o1 的表现达到了第的表现达到了第 89 个百分位个百分位。OpenAI o1 系列的首个模型已被发布,这是一个预览版本,其被命名为 OpenAI o1-preview。此外,OpenAI 还发布了 OpenAI o1-mini,这是一款具有成本效益的推理模型。o1-mini 在 STEM领域表现出色,尤其是在数学和编程方面,几乎与 OpenAI o1 在评估基准(如AIME 和 Codeforces)上的表现相当。o1-mini 成本比 o1-preview 便宜 80%,o1-mini 推理速度远超 o1-preview,OpenAI 预计,预计,o1-mini 将成为一个快速且将成为一个快速且经济高效的模型,适用于需要推理但不依赖广泛世界知识的应用经济高效的模型,适用于需要推理但不依赖广泛世界知识的应用。全新的推理范式:思维链条全新的推理范式:思维链条 自我对弈强化学习自我对弈强化学习。OpenAI o1 带来的是推理范式的全面革新,即利用大语言模型学习推理(即利用大语言模型学习推理(Learning to Reason with LLMs)。OpenAI 的大规模强化学习算法通过高度数据高效的训练过程,教会模型如何通过思维链条进行有效推理。OpenAI 发现,发现,o1 模型的性能随着更多的强化学习模型的性能随着更多的强化学习(训练时的计算量)以及更多的思考时间(测试时的计算量)而持续提升。(训练时的计算量)以及更多的思考时间(测试时的计算量)而持续提升。与人类在回答难题前长时间思考的方式类似,o1 在尝试解决问题时也运用“思维链条(CoT,Chain of Thought)”。通过强化学习,o1 学会了优化其思维链条,并精炼所使用的策略。它能识别并纠正错误,学会将复杂的步骤拆解为更简单的部分,并在当前方法无效时尝试不同的方式。这个过程极大地提升了模型的推理能力。我们认为,OpenAI o1 并非是颠覆式的技术革命,但是其在工程化上已经达到了领先的地位,其在自我对弈强化学习(自我对弈强化学习(Self-play RL)、思维链)、思维链条条(CoT)、)、过程过程奖励模型(奖励模型(PRM)等技术实践运用方面取得了显著的进步,并且在深度思考和复杂推理上展现出了较高的能力。我们认为,o1 代表着代表着 Scaling up 从预训练到推理的转变。从预训练到推理的转变。o1 带来的带来的大模型技术创新,正推动大模型技术创新,正推动 AI 向更深层次向更深层次的智能推理与问题解决能力发展的智能推理与问题解决能力发展。OpenAI o1,能给,能给 AI 带来什么?带来什么?我们认为,OpenAI o1 的命名,从某种意义上摆脱了 GPT(Generative Pre-trained Transformer)这一过去命名过分强调预训练(Pre-trained)的意味,而是让它更成为一个更强调推理能力训练的模型系列,从某种意义上,从某种意义上,OpenAI o1 确实是第一个确实是第一个“推理模型推理模型”。在推理密集型的任务类别中,如数据分析、编程和数学,o1 相较于 GPT-4o 有显著优势,在某种程度上,我们认为,可以说我们认为,可以说 o1 在部分细分领域已经接近了当前人类的天花板,在部分细分领域已经接近了当前人类的天花板,这就使得 o1 在部分细分的应用场景,已经接近“替代大部分人类”这一目标已经接近“替代大部分人类”这一目标。当然值得注意的是,当然值得注意的是,o1 目前仍处于目前仍处于 AI 发展的初级阶段发展的初级阶段,不过,不过 o1 在最新门萨智商测试中,IQ 水平超过了 120 分,这也代表着 o1 这类大模型所蕴含的巨大潜能。o1 所采用业界前沿技术,我国大模型业界也在同步研究和实践应用中,o1 系列模型的发展也为我国大模型的发展指出了一条新路,有望助推相关技术在我国 AI 业界更快实践发展。我们相信我们相信,o1 代表的是全新的大模型推理范式,也许数十年后,回望如今,我们也能说出,我们很幸运能够“at the right place at the right time”,这是属于 AI 的“Phenomenal Ride”。建议关注建议关注。算力:算力:英伟达、寒武纪-U、海光信息、景嘉微、龙芯中科、浪潮信息、中科曙光、神州数码、软通动力、中国长城;模型:模型:科大讯飞、中控技术、海康威视、大华股份、商汤-W;应用:应用:微软、金山办公、赛意信息、宝信软件、万兴科技、虹软科技、新致软件、新国都。风险提示风险提示。AI 技术发展不及预期,AI 商业落地不及预期,市场竞争加剧的风险。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 2 目目 录录 1.OpenAI 发布 o1 系列大模型,AI 大模型进入新纪元.4 2.o1-mini 同期发布,低价高速背景下细分领域性能优异.11 3.全新的推理范式:思维链条 自我对弈强化学习.16 4.OpenAI o1,能给 AI 带来什么?.24 5.建议关注与风险提示.27 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 3 图目录图目录 图 1 OpenAI o1-preview 已经正式投入使用.4 图 2 o1 在具有挑战性的推理基准测试中相较于 GPT-4o 有显著提升.5 图 3 o1 在广泛的基准测试中相较于 GPT-4o 取得了显著提升.6 图 4 o1 及其改进型模型在编程领域表现优异.7 图 5 按领域的人类偏好评估:o1-preview vs GPT-4o.7 图 6 o1 模型在多个领域的多个测试集中表现优异.8 图 7 OpenAI o1 安全评分表.9 图 8 o1-preview 和 GPT-4o 安全性对比.10 图 9 不同模型数学表现与推理成本对比.11 图 10 o1-mini 模型推理速度远超 o1-preview.11 图 11 o1-mini 在数学和编程方面表现出色.12 图 12 o1-mini 在需要推理的学术基准测试上表现优于 GPT-4o.13 图 13 按领域的人类偏好评估:o1-mini vs GPT-4o.14 图 14 o1-mini 和 GPT-4o 安全性对比.14 图 15 o1 模型的性能随着训练时间和测试时间的计算量平稳提升.16 图 16 手工 CoT 方法可以让 LLM 在推理任务上大幅提升.17 图 17 自动化 CoT 方法简介.17 图 18 CoT 越长,能解决的问题越复杂.18 图 19 Self-Taught Reasoner 自学推理方法介绍.18 图 20 Quiet-STaR 方法原理介绍.19 图 21 未来大模型推理阶段的计算量或大大增加.19 图 22 利用两种方法测试优化 LLM 计算是否比扩大模型参数规模更高效.20 图 23 PRM 运作原理介绍.21 图 24 LLM 与 PRM 进行对弈的流程示意图.21 图 25 OpenAI“推理模型”的运作模式.22 图 26 不同的 PRM 方法介绍.22 图 27 OpenAI 对 AI 的划分了五个发展阶段.24 图 28 o1 在 IQ 测试中达到 120 分的水平.25 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 4 1.OpenAI 发布发布 o1 系列大系列大模型模型,AI 大模型进入新纪元大模型进入新纪元 9 月 12 日,OpenAI 宣布开发了一系列全新 AI 模型,旨在在回应前投入更多时间思考。与之前的模型相比,这些模型能够更好地进行推理,并在科学、编程和数学等领域解决更为复杂的问题。作为早期模型,它还没有许多 ChatGPT 上的实用功能,例如浏览网络信息或上传文件和图片。然而,对于复杂的推理任务而言,这是一项重大进展,代表了 AI 能力的新高度。因此,OpenAI 将计数器重臵为 1,并将该系列命名为 OpenAI o1。OpenAI 训练这些模型在做出响应前花更多时间思考问题,类似于人类的思维方式。通过训练,它们学会了优化思维过程、尝试不同策略并识别错误。在 OpenAI 的测试中,OpenAI o1 在物理、化学和生物学等困难的基准任务中表现与博士生相似。此外,OpenAI o1 在数学和编程领域也表现优异。在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 仅正确解答了 13%的问题,而 OpenAI o1 的正确率达到了 83%。在 Codeforces 编程比赛中,OpenAI o1 的表现达到了第 89 个百分位。在 OpenAI 看来,这些增强的推理能力可能对解决科学、编程、数学等领域的复杂问题特别有用。例如,o1 模型可以帮助医疗研究人员注释细胞测序数据,物理学家生成量子光学所需的复杂数学公式,开发者在各个领域构建和执行多步工作流。9 月 12 日,OpenAI 宣布在 ChatGPT 和 API 中推出了 OpenAI o1 系列的首个模型,这是一个预览版本,其被命名为 OpenAI o1-preview。图图1 OpenAI o1-preview 已经正式投入使用已经正式投入使用 资料来源:OpenAI 官网,海通证券研究所 为了突出相较于 GPT-4o 在推理能力上的提升,OpenAI 对模型进行了多样化的人类考试和机器学习基准测试。结果显示,o1 在绝大多数推理密集型任务中明显优于GPT-4o。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 5 图图2 o1 在具有挑战性的推理基准测试中相较于在具有挑战性的推理基准测试中相较于 GPT-4o 有显著提升有显著提升 资料来源:OpenAI 官网,海通证券研究所 注:实线柱表示 pass1 的准确率,阴影区域则显示了使用 64 个样本的多数投票(共识)性能。在许多推理密集型的基准测试中,o1 的表现与人类专家相媲美。OpenAI 评估了 o1在 AIME 考试中的数学表现,该考试旨在挑战美国最优秀的高中数学学生。在 2024 年的 AIME 考试中,GPT-4o 平均仅能解答 12%的问题(即 1.8/15),而 o1 平均解答正确率为 74%(即 11.1/15),单次样本测试的结果为 83%(即 12.5/15)时通过 64 个样本的共识,若通过学习得分函数对 1000 个样本进行重新排名,其正确率达到了 93%(即13.9/15)。得分 13.9 足以让其跻身美国全国前 500 名学生,并超过参加美国数学奥林匹克竞赛(USA Mathematical Olympiad)的分数线。OpenAI 还对 o1 在 GPQA-diamond 基准测试上的表现进行了评估,该测试是一个困难的智力基准,评估在化学、物理和生物学方面的专业知识。为了将模型与人类进行比较,OpenAI 邀请了拥有博士学位的专家来回答 GPQA-diamond 的题目。结果显示,o1 超越了这些人类专家的表现,成为首个在该基准测试中表现优于人类专家的模型。这一结果并不意味着 o1 在所有方面都比博士更有能力,而仅表明模型在解决某些问题上比博士生预期的表现更为出色。在其他多个机器学习基准测试中,o1 也超越了当前的最先进水平。启用了视觉感知功能后,o1 在 MMMU 测试中得分为 78.2%,成为首个在人类专家中具备竞争力的模型。此外,o1 在 MMLU 的 57 个子类别中,有 54 个超越了GPT-4o 的表现。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 6 图图3 o1 在广泛的基准测试中相较于在广泛的基准测试中相较于 GPT-4o 取得了显著提升取得了显著提升 资料来源:OpenAI 官网,海通证券研究所 o1 在编程领域表现优异,OpenAI 训练了一款模型,命名为 o1-ioi,这个模型在 2024年国际信息学奥林匹克竞赛(IOI)中获得了 213 分,排名在第 49 百分位。该模型基于o1 进行初始化,并进一步训练以提升编程技能。o1-ioi 在 2024 年 IOI 比赛中与人类参赛者在相同条件下竞争,有 10 小时的时间解决 6 道复杂的算法问题,每题允许提交 50 次解答。对于每个问题,OpenAI 的系统生成了多个候选解答,并根据测试时的选择策略提交了 50 次解答。提交选择基于 IOI 公开测试案例、模型生成的测试案例以及学习到的评分函数。如果 OpenAI 随机提交解答,平均分数仅为 156 分,这表明该策略在比赛条件下贡献了近 60 分的提升。当放宽提交次数限制时,模型的表现显著提升。在每题允许提交 10000 次的情况下,o1-ioi 的得分达到 362.14 分,超过了金牌门槛,且不需要任何测试时的选择策略。最后,OpenAI 模拟了 Codeforces 平台上举办的竞争性编程比赛,以展示 o1-ioi 的编程能力。OpenAI 的评估严格遵循比赛规则,并允许 10 次提交。GPT-4o 的 Elo 评分为 808,位于人类竞争者的第 11 百分位。而 o1-ioi 远远超越了 GPT-4o 和 o1,达到了1807 的 Elo 评分,表现超过了 93%的参赛者。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 7 图图4 o1 及其改进型模型在编程领域表现优异及其改进型模型在编程领域表现优异 资料来源:OpenAI 官网,海通证券研究所 除了考试和学术基准测试外,OpenAI 还评估了在各种领域中 o1-preview与 GPT-4o在应对复杂、开放式问题上的人类偏好。在此评估中,人类训练师们会看到来自o1-preview 和 GPT-4o 的匿名响应,并投票选择他们更喜欢的回答。结果显示,在推理密集型的任务类别中,如数据分析、编程和数学,o1-preview 相较于 GPT-4o 有显著优势。然而,在某些自然语言任务中,o1-preview 的表现不如 GPT-4o,这表明它并不适合所有应用场景。不同领域的偏好差异表明,o1-preview 虽然在推理和计算密集型任务上表现优异,但在某些自然语言任务中仍未超越 GPT-4o。图图5 按领域的人类偏好评估:按领域的人类偏好评估:o1-preview vs GPT-4o 资料来源:OpenAI 官网,海通证券研究所 o1 在 AI 推理方面取得了显著的突破,推动了技术的前沿发展。OpenAI 计划随着持续优化,发布该模型的改进版本。OpenAI 预期,这些新的推理能力将提升 OpenAI 将模型与人类价值观和原则对齐的能力。OpenAI 相信,o1 及其后续版本将为科学、编程、数学及相关领域的 AI 应用开启许多新的应用场景。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 8 图图6 o1 模型模型在多个领域的多个测试集中表现优异在多个领域的多个测试集中表现优异 资料来源:OpenAI 官网,海通证券研究所 在模型的安全性方面,OpenAI 也做出了相当程度的提升。在将新模型部署到 ChatGPT 或 API 中之前,OpenAI 会彻底评估新模型是否存在潜在风险,并建立适当的保护措施。OpenAI 发布了 OpenAI o1 系统卡和准备框架评分表,以对 o1 进行严格的安全评估。作为开发这些新模型的一部分,OpenAI 提出了一种全新的安全培训方法,充分利用这些模型的推理能力,使其遵循安全和对齐的准则。通过能够在具体语境中推理OpenAI 的安全规则,模型可以更有效地应用这些规则。OpenAI 评估安全性的一种方式是测试模型在用户尝试绕过这些规则时(俗称为“越狱”)能否继续遵循其安全规则。在 OpenAI 最难的越狱测试之一中,GPT-4o 的得分为 22(满分 100),而 o1-preview 模型得分为 84。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 9 图图7 OpenAI o1 安全安全评分表评分表 资料来源:OpenAI 官网,海通证券研究所 在基于过去模型的安全评估和缓解措施基础上,OpenAI 加大了对 o1 高级推理能力的关注。OpenAI 通过公开和内部评估,衡量了诸如不允许的内容、人口公平性、幻觉倾向和危险能力等风险。基于这些评估结果,OpenAI 在模型和系统层面都实施了相应的安全防护措施,例如黑名单和安全分类器,以有效缓解这些风险。OpenAI 的研究表明,o1 的高级推理能力通过使模型能够更好地推理安全规则并在上下文中应用它们,增强了生成有害内容的抗风险能力。在“准备框架”体系下,o1的总体风险等级为“中等”,且被评估为安全可部署,因为它并未使现有资源之外的风险变得更为可能。其网络安全和模型自主性风险等级为“低”,而化学、生物、放射和核(CBRN)风险及说服性风险等级为“中等”。o1 系列模型通过大规模强化学习进行训练,采用链式推理来提升推理能力。这些先进的推理能力为提高模型的安全性和稳健性提供了新的途径。尤其是在回应潜在不安全提示时,模型可以在上下文中推理 OpenAI 的安全政策,从而在生成非法建议、选择刻板印象化回应以及抵御已知的越狱攻击等风险基准测试中达到业内领先的表现。训练模型在回答之前进行链式推理不仅能够带来显著的好处,还可能因更高的智能性而增加潜在风险。OpenAI 的研究结果强调了构建稳健的对齐方法、广泛测试其有效性以及保持严谨风险管理协议的必要性。此外,o1 使用的“思维链条(CoT,Chain of Thought)”推理为模型的对齐和安全性带来了新的契机。OpenAI 发现,将模型行为的政策融入推理模型的思维链中,是 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 10 一种有效且稳健的方式,可以传授人类的价值观和原则。通过教导模型在具体情境中推理并遵循 OpenAI 的安全规则,OpenAI 的研究表明,推理能力直接提升了模型的稳健性:o1-preview 在关键的绕过安全限制评估和我们最严格的内部安全边界测试中表现显著提升。OpenAI 认为,使用链式思维推理能够为安全性和对齐带来重大进展,因为它一方面使 OpenAI 能够以可解释的方式观察模型的思维过程,另一方面使模型对安全规则的推理在处理分布外情况时更加稳健。图图8 o1-preview 和和 GPT-4o 安全性对比安全性对比 资料来源:OpenAI 官网,海通证券研究所 我们认为,OpenAI o1 的发布代表了 AI 大模型的发展进入了新纪元,其整体推理水平相比较 GPT-4o 模型有了跨越式的提升,在复杂推理和科学计算等方面,o1 模型表现出了广阔的潜力,此外,o1 在推理准确性和安全性上有显著提升,有望推动 AI 技术的进一步发展。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 11 2.o1-mini 同期发布,低价高速背景下细分领域性能优异同期发布,低价高速背景下细分领域性能优异 此外,OpenAI 还发布了 OpenAI o1-mini,这是一款具有成本效益的推理模型。o1-mini 在 STEM 领域(Science,Technology,Engineering,and Mathematics,可泛指理工科领域)表现出色,尤其是在数学和编程方面,几乎与 OpenAI o1 在评估基准(如AIME 和 Codeforces)上的表现相当。OpenAI 预计,o1-mini 将成为一个快速且经济高效的模型,适用于需要推理但不依赖广泛世界知识的应用。o1-mini 成本比 OpenAI o1-preview 便宜 80%。ChatGPT Plus、Team、Enterprise和 Edu 用户可以选择使用 o1-mini 作为 o1-preview 的替代方案,享受更高的速率限制和更低的延迟。图图9 不同模型不同模型数学表现与推理成本对比数学表现与推理成本对比 资料来源:OpenAI 官网,海通证券研究所 o1-mini 推理速度远超 o1-preview。作为一个具体的例子,OpenAI 对比了 GPT-4o、o1-mini 和 o1-preview 在一个词汇推理问题上的回答。GPT-4o 没有给出正确答案,o1-mini 和 o1-preview 都回答正确。值得注意的是,o1-mini 达到正确答案的速度是o1-preview 的 3 到 5 倍左右。图图10 o1-mini 模型推理速度远超模型推理速度远超 o1-preview 资料来源:OpenAI 官网,海通证券研究所 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 12 性能方面,像 o1 这样的大型语言模型在庞大的文本数据集上进行预训练,虽然这些高容量模型具备广泛的世界知识,但在实际应用中可能成本高且运行速度较慢。相比之下,o1-mini 是一款针对 STEM 推理任务进行优化的较小模型。通过与通过与 o1 相同的高相同的高计算强化学习(计算强化学习(RL)流程训练,)流程训练,o1-mini 在许多有用的推理任务中达到了相当的性能,在许多有用的推理任务中达到了相当的性能,同时显著提高了成本效率。同时显著提高了成本效率。在需要智能和推理的基准测试中,o1-mini 的表现与 o1-preview 和 o1 相当。然而,在涉及非 STEM 事实知识的任务上,o1-mini 的表现较为逊色 数学数学:在高中 AIME 数学竞赛中,o1-mini 的得分为 70.0%,与 o1(74.4%)具有竞争力,同时成本显著降低,并且优于 o1-preview(44.6%)。o1-mini 的得分(约 11/15题)使其位于全美大约前 500 名高中生之列。编程编程:在 Codeforces 竞赛网站上,o1-mini 的 Elo 评分为 1650,接近 o1 的 1673,且高于 o1-preview 的 1258。这个 Elo 评分使得 o1-mini 位于 Codeforces 平台上大约86%的程序员之上。此外,o1-mini 在 HumanEval 编程基准测试和高中级别的网络安全夺旗赛(CTFs)中也表现出色。图图11 o1-mini 在数学和编程方面在数学和编程方面表现出色表现出色 资料来源:OpenAI 官网,海通证券研究所 STEM 领域领域:在一些需要推理的学术基准测试上,例如 GPQA(科学)和 MATH-500,o1-mini 的表现优于 GPT-4o。然而,o1-mini 在 MMLU 等任务上的表现不如 GPT-4o,并且由于缺乏广泛的世界知识,其在 GPQA 上的表现也落后于 o1-preview。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 13 图图12 o1-mini 在在需要推理的学术基准测试上表现优于需要推理的学术基准测试上表现优于 GPT-4o 资料来源:OpenAI 官网,海通证券研究所 人类偏好评估人类偏好评估:OpenAI 让人类评审员在多个领域的复杂、开放式问题上对 o1-mini和 GPT-4o 进行了比较,使用与 o1-preview 对比 GPT-4o 相同的方法。与 o1-preview类似,o1-mini 在推理密集型领域中更受青睐,但在语言为主的领域中不如 GPT-4o 受欢迎。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 14 图图13 按领域的人类偏好评估:按领域的人类偏好评估:o1-mini vs GPT-4o 资料来源:OpenAI 官网,海通证券研究所 安全性方面,o1-mini 采用与 o1-preview 相同的对齐和安全技术进行训练。在部署之前,OpenAI 对 o1-mini 的安全风险进行了全面评估,使用了与 o1-preview 相同的准备措施、外部测试和安全评估方法。根据内部版本的 StrongREJECT 数据集评估,o1-mini 的绕过安全限制的鲁棒性比 GPT-4o 提高了 59%。图图14 o1-mini 和和 GPT-4o 安全性对比安全性对比 资料来源:OpenAI 官网,海通证券研究所 由于 o1-mini 专注于 STEM 推理能力,其在非 STEM 主题(如日期、人物传记和冷 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 15 知识)上的事实知识与较小的语言模型(如 GPT-4o mini)相当。OpenAI 将在未来版本中改进这些局限性,并尝试将模型扩展到其他模态和 STEM 之外的专业领域。我们认为,o1-mini 代表了大模型领域发展的一个新方向,其低成本但强大的性能为更多开发者和企业提供了高性价比的解决方案,与其他小模型不同的是,o1-mini 虽然并非是在所有领域都实现了突出的性能,但是它在编码和复杂任务的推理方面依然实现了一流的性能和安全性水平,这就降低了 AI 在这些细分领域的应用门槛,促进了更广泛的AI 技术普及和创新发展。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 16 3.全新的推理范式:全新的推理范式:思维链条思维链条 自我对弈强化学习自我对弈强化学习 OpenAI o1 带来的是推理范式的全面革新,即利用大语言模型学习推理(Learning to Reason with LLMs)。OpenAI 的大规模强化学习算法通过高度数据高效的训练过程,教会模型如何通过思维链条进行有效推理。OpenAI 发现,o1 模型的性能随着更多的强化学习(训练时的计算量)以及更多的思考时间(测试时的计算量)而持续提升。这种方法的扩展约束与LLM 的预训练方式有显著不同,OpenAI 仍在继续探索其中的奥秘。图图15 o1 模型的性能随着训练时间和测试时间的计算量平稳提升模型的性能随着训练时间和测试时间的计算量平稳提升 资料来源:OpenAI 官网,海通证券研究所 与人类在回答难题前长时间思考的方式类似,o1 在尝试解决问题时也运用“思维链条(CoT,Chain of Thought)”。通过强化学习,o1 学会了优化其思维链条,并精炼所使用的策略。它能识别并纠正错误,学会将复杂的步骤拆解为更简单的部分,并在当前方法无效时尝试不同的方式。这个过程极大地提升了模型的推理能力。根据腾讯研究院,思维链条(CoT,Chain of Thought),是学者们发现的能够激发大模型通过“思考”来回答困难问题的技术,可以显著提高其在推理等任务上的正确率。这个思路在两年前的几篇经典论文中已经得到不断完善。根据腾讯研究院援引Chain-of-Thought Prompting Elicits Reasoning in Large Language Models这篇文章提出,在问 LLM 问题前,手工在 Prompt 里面加入一些包含思维过程(Chain of thought)的问答示例(Manual CoT),就可以让 LLM 在推理任务上大幅提升。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 17 图图16 手工手工 CoT 方法方法可以让可以让 LLM 在推理任务上大幅提升在推理任务上大幅提升 资料来源:Jason Wei(Google Research Brain Team),Xuezhi Wang(Google Research Brain Team)等所著Chain-of-Thought Prompting Elicits Reasoning in Large Language Models,海通证券研究所 Large Language Models are Zero-shot Reasoners提出先使用“Lets think step by step.”让模型自己给出推理过程(Zero-shot CoT),也衍生出诸如“一步一步慢慢来”这些著名的咒语。Automatic Chain of Thought Prompting in Large Language Models这篇文章可以理解为二者的结合,先用“Lets think step by step.”咒语产生推理过程,再把这些过程加到 Prompt 里面去引导大模型推理。通过这样的方式,自动化地在 LLM 推理提示词中引入高质量的 CoT,增强 LLM 推理的精度。图图17 自动化自动化 CoT 方法简介方法简介 资料来源:上海交通大学 Zhuosheng Zhang,Amazon Web Services Aston Zhang 等所著Automatic Chain of Thought Prompting in Large Language Models,海通证券研究所 2024 年 3 月,斯坦福大学和 Google 等组成的团队共同发布了论文Chain of Thought Empowers Transformers to Solve Inherently Serial Problems,这篇文章进一步说明,CoT 是一种有效提升大型语言模型在算术和符号推理任务上准确性的方法。在论文的实验中,启用 CoT 显著提升了对并行计算难以解决的任务的准确性,包括臵换群 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 18 的组合、迭代平方计算和电路值问题,尤其是在低深度 transformer 中表现尤为明显。简单来讲,CoT 能够让 Transformer 运行更高效。图图18 CoT 越长,能解决越长,能解决的的问题越复杂问题越复杂 资料来源:Zhiyuan Li(Stanford University/Toyota Technological Institute at Chicago),Hong Liu(Stanford University)等所著Chain of Thought Empowers Transformers to Solve Inherently Serial Problems,海通证券研究所 除此以外,CoT 还经历了千变万化的演进,但大都还是通过 Prompt 来诱导大模型分步思维。强化学习是让机器自己通过与环境交互并观察结果的方式调整行为策略的机器学习方法,但之前很难用于语言模型。直到斯坦福大学 2022 年提出一种自学推理(Self-Taught Reasoner,STaR)方法:先给模型一些例题详细解法,再让模型学着去解更多的题,如果做对就把方法再补充到例题里,形成数据集,对原模型微调,让模型学会这些方法,这也是一种经典的自动生成数据的方法。图图19 Self-Taught Reasoner 自学推理方法介绍自学推理方法介绍 资料来源:腾讯研究院官微,海通证券研究所 后来基于此又演进出了名为“Quiet-STaR”的新技术,也就是 Q*,中文翻译为“安静的自学推理”。核心为在每个输入 token 之后插入一个“思考”步骤,让大模型生成内部推理。然后,系统会评估这些推理是否有助于预测后续文本,并相应地调整模型参数。这种方法允许模型在处理各种文本时都能进行隐含的推理,而不仅仅是在回答问题时。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 19 图图20 Quiet-STaR 方法原理介绍方法原理介绍 资料来源:腾讯研究院官微,海通证券研究所 在强化学习领域,引入自学习方法意味着在大规模模型训练过程中,模型能够自主生成并筛选出有效的策略。在处理问题时,模型将依据问题类型选择相应的策略,将复杂问题分解为多个子步骤,并按照既定流程执行。在此过程中,模型会不断进行自我审查,一旦发现当前策略不再适用,便会及时调整并尝试其他策略。这一过程与教育小学生普遍采用的解题策略相似,即通过教授一系列解题技巧,引导学生根据题目特点选择合适的方法进行解答。以上技术手段结合的后果就是,预训练阶段并没有什么变化,但在推理阶段的计算量大大增加,原来追求的快思考变成了故意放慢速度,以追求更加准确的结果。图图21 未来大模型未来大模型推理阶段的计算量推理阶段的计算量或或大大增加大大增加 资料来源:腾讯研究院官微,海通证券研究所 回到 o1 的推理方式,OpenAI 并没有公布详细的技术文档,所以我们无法得知 o1具体的技术架构,但是 OpenAI 关于 o1 的描述还是强调了几个点:内化了思维链(CoT)、能纠错、能尝试不同的途径。这些与 SelfPlay-RL(自我对弈型强化学习)的基本能力很符合。而 Google DeepMind 的研究团队于 2024 年 8 月发布的论文Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters,提供了这种新的自我对弈型强化学习的基本框架和实现可能,我们认为能够对 o1 的技术架构给予一定的外部参考。在论文中,研究团队探讨了大模型在面对复杂问题时,是否可以通过增加测试时的计算量来提高决策质量。研究团队从人类的思考模式延伸,既然人面对复杂问题时会用 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 20 更长时间思考改善决策,那么 LLM 是不是也能如此?换言之,面对一个复杂任务时,是否能让 LLM 更有效利用测试时的额外计算以提高准确性。研究团队设计了一组实验,使用 PaLM2-S*在 MATH 数据集上测试。主要分析了两种方法:(1)迭代自我修订:让模型多次尝试回答一个问题,在每次尝试后进行修订以得到更好的回答。(2)搜索:在这种方法中,模型生成多个候选答案。使用自我修订方法时,随着测试时计算量增加,标准最佳 N 策略(Best-of-N)与计算最优扩展策略之间的差距逐渐扩大。使用搜索方法,计算最优扩展策略在初期表现出比较明显优势。并在一定情况下,达到与最佳 N 策略相同效果,计算量仅为其 1/4。在与预训练计算相当的 FLOPs 匹配评估中,对比 PaLM 2-S*(使用计算最优策略)一个 14 倍大的预训练模型(不进行额外推理)。研究结果发现,使用自我修订方法时,当推理 tokns 远小于预训练 tokens 时,使用测试时计算策略的效果比预训练效果更好。但是当比率增加,或者在更难的问题上,还是预训练的效果更好。简单来说,增加测试时(test-time compute)计算比扩展模型参数更有效。基于论文提出的计算最优(compute-optimal)测试时计算扩展策略,规模较小的基础模型在一些任务上可以超越一个 14 倍大的模型。图图22 利用两种方法利用两种方法测试测试优化优化 LLM 计算计算是否是否比扩大模型参数规模更高效比扩大模型参数规模更高效 资料来源:Charlie Snell(UC Berkeley,在 Google DeepMind 实习期间完成的论文工作),Jaehoon Lee(Google DeepMind)等所著Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters,海通证券研究所 在论文中,研究团队详细解释了一种 PRM(Process-based Verifier Model 或Process Reward Model,过程奖励模型)作为和 LLM(大语言模型)对弈的对手,它的推理模式和其效果。PRM 是在思维链的过程中给出奖励(打分)的模型,过程奖励模型。它是一个单独被训练出来的模型,它拥有两个能力,一个是将问题拆成一步一步它是一个单独被训练出来的模型,它拥有两个能力,一个是将问题拆成一步一步的思维链的能力;另一个是对大模型生成的每一步进行打分,并在结果不够理想时让大的思维链的能力;另一个是对大模型生成的每一步进行打分,并在结果不够理想时让大模型重新生成结果。它不仅可以评判每一个具体回答的优与劣,也可以评判在整个思维模型重新生成结果。它不仅可以评判每一个具体回答的优与劣,也可以评判在整个思维链过程中最佳的流程。链过程中最佳的流程。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 21 图图23 PRM 运作运作原理介绍原理介绍 资料来源:Charlie Snell(UC Berkeley,在 Google DeepMind 实习期间完成的论文工作),Jaehoon Lee(Google DeepMind)等所著Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters,海通证券研究所 PRM 在与大模型的互动中,通过让大模型搜索多个可能的答案,在推理过程中的整体逻辑和每一步上都选择最佳的答案。这就让推理的准确性得到大幅提升。图图24 LLM 与与 PRM 进行对弈的流程示意图进行对弈的流程示意图 资料来源:海通证券研究所 这一过程与 OpenAI 在“推理模型”中显示的多步循环对弈的形式也基本一致。o1模型引入了“推理 token”。模型使用这些推理 token 进行“思考”,通过分解对提示的理解,并考虑生成回答的多种方法。在生成推理 token 之后,模型会产生可见的完成token(即回答),并从其上下文中丢弃推理 token。OpenAI 给出了一个多步骤对话的示例。每个步骤的输入和输出 token 会被保留,而推理 token 则会被丢弃。从图中可以看出,模型在给出最终回答之前会进行三轮推理,并把前一轮的推理作为 Input(输入)再给到下一轮。如果把它想象成思维链,这个输入就是对前一个步骤的对弈结果的总结。它最终输出的是一个简短的版本。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 22 图图25 OpenAI“推理模型推理模型”的运作模式”的运作模式 资料来源:OpenAI 官网,海通证券研究所 在这个过程中,PRM 让 LLM 去搜索最佳答案有多种方式,Google 在研究中提到了从简单到复杂的三种方案,直接在多个答案中选最佳解的方法(Best of N),在思维链中每步都提供多个候选项的方法(Beam Search)和把后续多个步骤联系起来看的MCTS 方法(蒙特卡洛树状搜索算法)的简化版本 Lookahead Search。图图26 不同的不同的 PRM 方法方法介绍介绍 资料来源:Charlie Snell(UC Berkeley,在 Google DeepMind 实习期间完成的论文工作),Jaehoon Lee(Google DeepMind)等所著Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters,海通证券研究所 正如我们上文介绍的,OpenAI 并没有公布关于 o1 的具体技术文档,所以我们无法判断具体的技术架构,但是我们可以合理推测,o1 与 CoT PRM 是分不开的。其实早在 2023 年 5 月,OpenAI 的前首席科学家 Ilya Sutskever 和其团队就发布了论文 Lets 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 23 Verify Step by Step,在这论文中证明了过程监督过程监督(Process-supervised Reward Models,PRM)能够比结果监督结果监督(Outcome-supervised Reward Models,ORM)训练出更可靠的奖励模型,OpenAI 的团队在论文中使用最先进的 PRM 模型解决了 MATH测试集代表性子集中 78.2%的问题,此外他们还证明了主动学习主动学习使过程监督的数据效率提高了 2.6 倍。我们认为,OpenAI o1 并非是颠覆式的技术革命,但是其在工程化上已经达到了领先的地位,其在自我对弈强化学习(自我对弈强化学习(Self-play RL)、思维链(思维链(CoT)、过程过程奖励模型(奖励模型(PRM)等技术实践运用方面取得了显著的进步,并且在深度思考和复杂推理上展现出了较高的能力。o1 大模型凭借自我对弈强化学习技术,在没有外部干预的情况下,通过反复试验来学习策略并优化决策能力,从而在应对策略和决策相关任务时展现出更高的智能与适应性。同时,o1 大模型运用了思维链技术,逐步展示其推理步骤,以提高在复杂问题解答中的透明性与可解释性。这一方法使得 o1 在处理逻辑推理、数学问题求解及编程等结构化任务时,能够体现出接近人类的推理能力。我们认为,正如 Google 论文的标题“优化优化 LLM 测试时计算比扩大模型参数规模测试时计算比扩大模型参数规模更高效更高效”,o1 模型在某种意义上代表了 AI 大模型发展的新范式,AI 大模型学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误,并且随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),AI 大模型的性能持续提高,o1 代表着代表着Scaling up 从预训练到推理的转变。从预训练到推理的转变。o1 带来的带来的大模型技术创新,正推动大模型技术创新,正推动 AI 向更深层向更深层次的智能推理与问题解决能力发展。次的智能推理与问题解决能力发展。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 24 4.OpenAI o1,能给,能给 AI 带来什么带来什么?我们认为,OpenAI o1 的命名,从某种意义上摆脱了 GPT(Generative Pre-trained Transformer)这一过去命名过分强调预训练(Pre-trained)的意味,而是让它更成为一个更强调推理能力训练的模型系列。我们认为,o1 至少为困于数据和基建无法快速提升预训练规模的模型公司们提供了一个新的角度,从推理侧和强化学习的方法入手,加强模型的能力。从某种意义上,从某种意义上,OpenAI o1 确实是第一个确实是第一个“推理模型推理模型”。”。根据腾讯科技,月之暗面创始人杨植麟在一场分享中谈到了他对 o1 的看法,他认为,规模定律之后,大模型发展的下一个范式是强化学习,OpenAI o1 模型的发布,通过强化学习尝试突破数据墙,并看到计算更多向推理侧增加的趋势。从应用的角度来看,o1 在很多领域的并不像现有的 GPT-4o 一样突出,在某些自然语言任务中,可能 o1 的表现仍不如 GPT-4o,OpenAI 对 o1-mini 的评价更是“缺乏广泛的世界知识”,此外 o1 也没有浏览网页或处理文件和图像的能力。但是,在推理密集型的任务类别中,如数据分析、编程和数学,o1 相较于 GPT-4o有显著优势,例如基于 o1 针对编程能力优化的 o1-ioi 在放宽提交次数限制时,能够在2024 年国际信息学奥林匹克竞赛得分达到 362.14 分,超过了金牌门槛,且不需要任何测试时的选择策略,在某种程度上,我们认为我们认为,可以说可以说 o1 在部分细分领域已经接近了在部分细分领域已经接近了当前人类的天花板,这就使得当前人类的天花板,这就使得 o1 在部分细分的应用场景,已经接近“替代大部在部分细分的应用场景,已经接近“替代大部分人类”分人类”这一目标这一目标。根据 o1 现在的表现,我们认为,o1 处理复杂任务能力更加突出,它的先进推理能力可以提升科学研究、数学计算和编程领域的效率,我们推测,这可能是因为这些领域的任务通常具有明确的规则和目标,使得奖励函数更容易设计和优化,PRM 运作效率更高,但这也代表未来 o1 在 STEM 领域可能有更多的应用空间,还可能推动人工智能在生物制药、IC 制造等行业的创新应用,按照 o1 的发展思路,也许未来,人们能够也许未来,人们能够让让 AI 思考数小时、数天甚至数周思考数小时、数天甚至数周,伴随着更高的,伴随着更高的推理成本推理成本,人类也,人类也会离新的抗癌药物、突破会离新的抗癌药物、突破性的电池甚至黎曼猜想的证明性的电池甚至黎曼猜想的证明更近更近。当然值得注意的是,当然值得注意的是,o1 目前仍处于目前仍处于 AI 发展的发展的初级阶段。初级阶段。根据深圳市人工智能产业协会官微,OpenAI 给 AI 划分了五个发展阶段。图图27 OpenAI 对对 AI 的划分了的划分了五个发展阶段五个发展阶段 资料来源:深圳市人工智能产业协会官微,海通证券研究所 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 25 第一级,ChatBots聊天机器人,比如 ChatGPT。第二级,Reasoners推理者,解决博士水平基础问题的系统。第三级,Agents智能体,代表用户采取行动的 AI 代理。第四级,Innovators创新者,帮助发明的 AI。第五级,Organizations组织,AI 可以执行整个人类组织的工作,这是实现 AGI 的最后一步。我们认为,我们认为,按照这个标准,按照这个标准,o1 目前在第二级目前在第二级,人类距离人类距离 AGI 的道路仍然道阻且长。的道路仍然道阻且长。不过,根据 Tracking AI,o1 在最新门萨智商测试中,IQ 水平超过了 120 分,远超目前业界其他大模型的水平,而且值得注意的是,这仅仅是 o1-preview 的水平,这也代表着 o1 这类大模型所蕴含的巨大潜能。图图28 o1 在在 IQ 测试中达到测试中达到 120 分的水平分的水平 资料来源:Tracking Al,海通证券研究所 注:分数来源于门萨测试 正如我们在上一章节所讨论的内容,我们认为,OpenAI o1 并非是颠覆式的技术革命,但是其带动了前沿技术的工程化应用。值得关注的是,o1 所采用的自我对弈强化学习和思维链等业界前沿技术,我国大模型科研和产业界也在同步研究和实践应用中。根据阿里研究院官微,阿里巴巴通义千问大模型也已经实际采用自我对弈强化学习和思维链技术,在深度思考和复杂推理能力上代表中国大模型最高水平,与国际领先水平保持同步。并已于 7 月 18 日发布此领域的研究论文。此外,来自于清华大学、北京大学、腾讯、第四范式等机构的研究人员在 2024 年8 月刚刚发布了自我对弈强化学习方法的综述:A Survey on Self-play Methods in Reinforcement Learning,论文提供了一个统一的框架,并在该框架下对现有的自博弈算法进行了分类,论文自述为“理解强化学习中多层次自博弈领域的关键指南”。我们认为,中国的大型模型产业正从单纯的产品创新走向应用深化的新阶段,伴随AI 技术的持续深化,大模型的实用性正在逐渐接近大规模商业化运用的“转折点”,从而释放出众多新的应用场景,这些进展也促使大型模型的使用频率迅速增长。每一次大 行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 26 模型在性能上的进步,都可能将应用的边界推向更广阔的领域,o1 应用的技术我国的AI 业界也早有关注,o1 系列模型的发展也为我国大模型的发展指出了一条新路,有望助推相关技术在我国 AI 业界更快实践发展,从而助力我国 AI 行业整体的进步。Gordon Moore(摩尔定律发明人)在 2005 年接受采访时,曾说过这样一段话:“It sure is nice to be at the right place at the right time,I was very fortunate to get into the semiconductor industry in its infancy.And I had an opportunity to grow from the time where we couldnt make a single silicon transistor to the time where we put 1.7 billion of them on one chip!Its been a phenomenal ride.”我们相信我们相信,o1 代表的是全新的大模型推理范式,这一范式也许能够改变人们对于“智能”这一概念的理解,当然,正如 Ilya 的论文标题所写,这仍需要“一步步验证(Lets Verify Step by Step)”,但是也许数十年后,回望如今,我们也能说出,我们很幸运能够“at the right place at the right time”,这是属于 AI 的“Phenomenal Ride”。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 27 5.建议关注与风险提示建议关注与风险提示 建议关注:建议关注:AI 算力、模型和应用领域。算力、模型和应用领域。算力:算力:英伟达、寒武纪-U、海光信息、景嘉微、龙芯中科、浪潮信息、中科曙光、神州数码、软通动力、中国长城;模型:模型:科大讯飞、中控技术、海康威视、大华股份、商汤-W;应用:应用:微软、金山办公、赛意信息、宝信软件、万兴科技、虹软科技、新致软件、新国都。风险提示:风险提示:AI 技术的发展不及预期,AI 商业落地不及预期,市场竞争加剧的风险。行业研究信息服务行业 请务必阅读正文之后的信息披露和法律声明 28 信息披露信息披露 分析师声明分析师声明 杨林 计算机行业 杨蒙 计算机行业 魏宗 计算机行业 本人具有中国证券业协会授予的证券投资咨询执业资格,以勤勉的职业态度,独立、客观地出具本报告。本报告所采用的数据和信息均来自市场公开信息,本人不保证该等信息的准确性或完整性。分析逻辑基于作者的职业理解,清晰准确地反映了作者的研究观点,结论不受任何第三方的授意或影响,特此声明。分析师负责的股票研究范围分析师负责的股票研究范围 重点研究上市公司:易华录,润和软件,神州控股,创业慧康,狄耐克,京北方,永信至诚,达梦数据,广联达,纳思达,用友网络,云赛智联,联想集团,商汤-W,思维列控,金溢科技,锐明技术,中控技术,拉卡拉,能科科技,税友股份,星环科技-U,国能日新,海光信息,*ST 银江,拓尔思,中科曙光,金山办公,道通科技 投资投资评级评级说明说明 1.投资评级的比较投资评级的比较和评级标准:和评级标准:以报告发布后的 6 个月内的市场表现为比较标准,报告发布日后 6 个月内的公司股价(或行业指数)的涨跌幅相对同期市场基准指数的涨跌幅;2.市场基准指数的比较标准:市场基准指数的比较标准:A 股市场以海通综指为基准;香港市场以恒生指数为基准;美国市场以标普 500 或纳斯达克综合指数为基准。类类 别别 评评 级级 说说 明明 股票投资评股票投资评级级 优于大市 预期个股相对基准指数涨幅在 10%以上;中性 预期个股相对基准指数涨幅介于-10%与 10%之间;弱于大市 预期个股相对基准指数涨幅低于-10%及以下;无评级 对于个股未来 6 个月市场表现与基准指数相比无明确观点。行业投资评行业投资评级级 优于大市 预期行业整体回报高于基准指数整体水平 10%以上;中性 预期行业整体回报介于基准指数整体水平-10%与 10%之间;弱于大市 预期行业整体回报低于基准指数整体水平-10%以下。法律声明法律声明 本报告仅供海通证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。市场有风险,投资需谨慎。本报告所载的信息、材料及结论只提供特定客户作参考,不构成投资建议,也没有考虑到个别客户特殊的投资目标、财务状况或需要。客户应考虑本报告中的任何意见或建议是否符合其特定状况。在法律许可的情况下,海通证券及其所属关联机构可能会持有报告中提到的公司所发行的证券并进行交易,还可能为这些公司提供投资银行服务或其他服务。本报告仅向特定客户传送,未经海通证券研究所书面授权,本研究报告的任何部分均不得以任何方式制作任何形式的拷贝、复印件或复制品,或再次分发给任何其他人,或以任何侵犯本公司版权的其他方式使用。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。如欲引用或转载本文内容,务必联络海通证券研究所并获得许可,并需注明出处为海通证券研究所,且不得对本文进行有悖原意的引用和删改。根据中国证监会核发的经营证券业务许可,海通证券股份有限公司的经营范围包括证券投资咨询业务。
敬请参阅最后一页特别声明-1-证券研究报告 2024 年 9 月 25 日 行业研究行业研究 从从 OpenAI o1OpenAI o1 看看 AIAI 产业趋势产业趋势:打破打破 AIAI 应用瓶颈,算力需求应用瓶颈,算力需求前景如何前景如何?AI 产业前瞻系列报告(三)海外海外 TMTTMT 事件:事件:2024 年 9 月 12 日,OpenAI 发布最新模型 o1,在编程、理科竞赛等推理密集型任务中性能明显优于 GPT-4o,但在部分自然语言任务中较弱。o1o1 具备全局思维能力,复杂推理补足长尾需求,开拓学术教育具备全局思维能力,复杂推理补足长尾需求,开拓学术教育等等垂类场景垂类场景。根据我们的测评,o1 思维链特征可以概括为:1 1)优先形成全局方法:优先形成全局方法:在解答前 o1 会先分析问题、概括底层规律;2 2)不断的不断的追问和反思:追问和反思:在输出最终答案之前,o1 会不断反思解答过程并进行改进,其完整思维链可达数百行。o1o1 在编程上展现出自主规划能力,在编程上展现出自主规划能力,AI AI 低代码低代码/网络安全领域有望最早受益网络安全领域有望最早受益。1 1)低代码低代码:o1 在编程方面具备较强的自主性,可以一定程度上对冲 o1 高成本和高延迟的问题。2 2)网络安全:网络安全:o1 在网络安全攻防中表现优秀,能将复杂任务分解成多个子任务,具备初步的自主规划能力,也体现出了 AI 辅助网络攻击的潜在威胁,AI 驱动的网络安全攻防升级将成为未来的主旋律。AI AgentAI Agent 是打破是打破 AIAI 应用发展瓶颈的关键,应用发展瓶颈的关键,o1o1 能否开启通往能否开启通往 AgentAgent 之路之路?受限于模型性能,AI 应用进入瓶颈,北美科技巨头 26 年资本支出持续性以及上游算力产业链的业绩成长性受到质疑。而近期前沿论文和 o1 展现的强化学习推理、思维链等底层技术,是 AI 产业发展和投资情绪提振的关键。新的新的 Scaling LawScaling Law,RL CoTRL CoT 对于实现能自主规划的对于实现能自主规划的 AI AgentAI Agent 至关重要至关重要。强化学习让 AI 自主探索和连续决策,符合 Agent 所需的自主规划能力。self-play 通过自主博弈生成高质量数据,有利于突破外部训练数据短缺的现状。思维链能极大提升模型涉及数学和符号的推理能力,但在其他问题上提升效思维链能极大提升模型涉及数学和符号的推理能力,但在其他问题上提升效果不显著,甚至可能有损模型性能。果不显著,甚至可能有损模型性能。推理能力和模型的指令跟随能力呈现出分离关系,对于构建 AGI 来说,如何平衡二者的关系会成为一个核心问题。RLRL 范式下范式下推理算力需求大幅上升,推理算力需求大幅上升,但但不代表训练算力需求会停止增长不代表训练算力需求会停止增长。o1-preview 生成相同内容的输出 tokens 大约是 GPT-4o 的 5.9 倍,其中 72%的 tokens 为推理过程中生成,使用 o1-preview 的输出成本约为 GPT-4o 的36 倍。Scaling Law 由训练侧转向推理侧,对推理芯片的性能需求也会提高,且预训练阶段也需要消耗大量的算力。强化学习推理并不意味着模型参数停止扩张,因为主模型参数提升可能会产生更好的推理路径。北美科技公司进入新一轮北美科技公司进入新一轮 AIAI 投资周期,资本支出大幅上升可能使公司面临成投资周期,资本支出大幅上升可能使公司面临成本压力。本压力。2024 年科技巨头资本支出/营运现金流预计将达到 40%以上。在 AI的投资回报率尚不明显的现状下,科技巨头会更加重视 AI 投资的性价比。投资建议:投资建议:1 1、AIAI 电力:电力:Constellation、NRG。2 2、AIAI 算力产业链:算力产业链:1 1)AI AI GPUGPU:英伟达、AMD;2 2)ASICASIC 芯片设计:芯片设计:Marvell 科技、博通;3 3)存储)存储:SK 海力士、三星电子、美光科技;4 4)服务器:)服务器:联想集团、超微电脑、戴尔科技、慧与、工业富联;5 5)CoWoSCoWoS:台积电、日月光、Amkor 科技;6 6)网络:网络:中际旭创、新易盛、Coherent、安费诺、Arista 网络。3 3、AIAI 应用:应用:1 1)云服务商)云服务商:微软、谷歌、亚马逊、Oracle;2 2)AI AI 开发开发/数据分析数据分析:ServiceNow、Palantir、Datadog;3 3)AI AI 网 络 安 全:网 络 安 全:微 软、CrowdStrike、Fortinet;4 4)AI AgentAI Agent:微软、Salesforce、Workday;5 5)AI AI 教育:教育:多邻国、Coursera。风险风险分析分析:AI 技术研发和产品迭代遭遇瓶颈;AI 行业竞争加剧风险;商业化进展不及预期风险;国内外政策风险。买入(维持)买入(维持)作者作者 分析师:付天姿分析师:付天姿 执业证书编号:S0930517040002 021-52523692 联系人:宾特丽亚联系人:宾特丽亚 行业行业与与标普标普 500500 指数对比图指数对比图 资料来源:Wind 相关研报相关研报 梳理全球 AIGC 数据版权规范,哪些领域具备商业化潜力?AI 产业前瞻系列报告(二)(2023-12-25)探讨 GPTs 背后的产业逻辑:拉开 AIGC应用生态的帷幕AI 产业前瞻系列报告(一)(2023-11-18)AI 驱动网络安全供需提升,架构迭代引领行业变革美股网络安全行业深度报告(2024-06-19)谷歌 Gemini 赋能搜索体验,多模态模型&TPU 持续迭代Google IO 2024 产品发布会点评(2024-05-16)GPT-4o 后续影响:推理端降本 多模态 低延迟带来 AI 应用转折点OpenAI 春季产品发布会点评(2024-05-14)探讨 AIGC 视频的核心痛点与未来趋势,Pika 1.0 能否带来新变化?AIGC 行业跟踪报告(三十五)(2023-12-05)-20%0 23-92023-102023-112023-122024-12024-22024-32024-42024-52024-62024-72024-8标普500 标普500信息技术 要点要点 敬请参阅最后一页特别声明-2-证券研究报告 海外海外 TMTTMT 目目 录录 1、OpenAI o1 开启复杂推理模型新时代开启复杂推理模型新时代 .4 4 1.1 相比 GPT-4o,o1在代码和理科能力上提升明显.4 1.2 o1 具备全局思维能力,复杂推理补足长尾需求,开拓学术教育垂类场景.6 1.3 o1 在编程上展现出自主规划和主动思考能力,AI 低代码/网络安全领域有望最早受益.8 2、AI Agent 是打破是打破 AI 应用发展瓶颈的关键,应用发展瓶颈的关键,o1能否开启通往能否开启通往 Agent 之路?之路?.1111 2.1 新的 Scaling Law,RL CoT 对于实现能自主规划的 AI Agent 至关重要.12 2.2 RL范式下推理算力需求大幅上升,但不代表训练算力需求会停止增长.13 3、投资建议投资建议 .1515 4、风险分析风险分析 .1616 中庚基金 敬请参阅最后一页特别声明-3-证券研究报告 海外海外 TMTTMT 图目录图目录 图 1:GPT-4o、o1-preview、o1和人类专家在复杂推理任务中的得分差异.4 图 2:o1相比于 GPT-4o 在各项测试集中的得分提升.5 图 3:o1-mini、o1 等模型 AIME 得分和推理成本对比.6 图 4:o1-mini的 Codeforces 得分显著优于 o1-preview.6 图 5:针对复杂数学问题,o1-preview在思维链中不断进行纠错、追问和反思,最终得到完整的解题框架.6 图 6:针对规则复杂的纵横填字游戏,GPT-4o 因无法理解规则而出错,o1-preview首先理解规则再进行解答.7 图 7:针对解码问题,o1-preview的思维链采用了类似穷举法的方式寻找答案,思维链较为僵化.7 图 8:将 o1-preview与 Github Copilot 优化编码器运行速度.8 图 9:o1-preview与 Cursor Composer 结合,快速开发 App.8 图 10:o1-preview找到 Docker Host API并启动了损坏容器的新实例.9 图 11:2023年交互式入侵主要针对北美洲地区.9 图 12:2021-2023 年针对云的入侵案例显著增加.9 图 13:o1-preview和 o1-mini 在越狱学术基准 StrongReject上明显领先 GPT-4o.10 图 14:构建 AI应用的五层基石理论.11 图 15:AlphaZero随机初始化、self-play、MCTS、策略更新.11 图 16:o1 在 AIEM测试中的准确率与“训练时间计算”和“测试时间计算”呈正比.12 图 17:在 PaLM 2-S*模型修正场景中,计算优化缩放(Compute Optimal)相比传统的 Best-of-N 方法效率显著提高.13 图 18:主流模型输出速度和输出质量的对比,o1-preview为输出质量牺牲了输出速度.14 图 19:主流模型输入和输出的价格对比.14 图 20:OpenAI各模型输出和推理 tokens 消耗对比.14 图 21:科技公司资本支出占营运现金流的比例变化趋势.15 图 22:科技公司资本支出占 GAAP 净利润的比例变化趋势.15 表目录表目录 表 1:不同测试集和子分类下 GPT-4o、o1-preview、o1的得分对比.5 表 2:23年以来部分网络安全公司推出的生成式 AI产品和功能.10 敬请参阅最后一页特别声明-4-证券研究报告 海外海外 TMTTMT 1 1、OpenAI o1OpenAI o1 开启复杂推理模型新时代开启复杂推理模型新时代 美国东部时间 2024 年 9 月 12 日,OpenAI 发布最新 AI 模型 o1,o 代表Orion(猎户座),开启了 OpenAI 的下一代复杂推理模型。同时,OpenAI 发布了即日可用的预览版 o1-preview 和性价比更高的轻量级版本 o1-mini,可用范围如下:1 1)ChatGPT plus 和 Teams 用户可以直接使用,但存在次数限制。刚发布时o1-preview 每周可进行 30 次问答,o1-mini 每周可进行 50 次问答,9 月 17日开始,o1-preview 和 o1-mini 的次数限制分别提升至每周 50 次和每日 50次;作为 o1 的早期版本,o1-preview 和 o1-mini 暂不具备实时浏览网页、上传文件和图像等功能,计划于后续版本中陆续开放。2 2)API Tier 5 用户可以开始使用 o1-preview 和 o1-mini 的 API,但速率限制为 20RPM,暂不支持函数调用、流式处理、系统消息等功能。3 3)9 月 16 日开始,ChatGPT Enterprise 和 Edu 用户可访问这两种模型。4 4)未来 o1-mini 计划免费向所有 ChatGPT 用户开放。1.11.1 相比相比 GPTGPT-4o4o,o1o1 在代码和理科能力上提升明显在代码和理科能力上提升明显 在编程、理科竞赛等推理密集型任务中,在编程、理科竞赛等推理密集型任务中,o1o1 的性能明显优于的性能明显优于 GPTGPT-4o4o。根据OpenAI 官方博客,o1 在编程竞赛 Codeforces 中的排名分位达到 89%,在美国数学奥林匹克竞赛(AIME)中跻身前 500 名,在物理、生物、化学基准测试(GPQA)的准确性超过了人类博士水平。以 2024 年的 AIME 考试为例,GPT-4o 仅能解决平均 12%的问题,而 o1 的平均正确率在 64 个样本中达到了 83%,在 1000 个样本中达到了 93%。图图 1 1:GPTGPT-4o4o、o1o1-previewpreview、o1o1 和人类专家在复杂推理任务中的得分差异和人类专家在复杂推理任务中的得分差异 资料来源:OpenAI 官网,实心矩阵代表使用 pass1 的正确率,虚影矩阵代表 64 个样本的平均正确率 在经典测试集的表现上,在经典测试集的表现上,o1o1 性能普遍优于性能普遍优于 GPTGPT-4o4o。根据 OpenAI 官方博客,o1 在 MMMU 测试集的得分为 78.2%,成为首个与人类专家竞争的模型。在 57个 MMLU 子类别中,o1 在 54 个子类别中的表现优于 GPT-4o,在化学、物理、数学等子类别上得分提升显著,但在公共关系、计量经济学、英语等学科上提升幅度较小。敬请参阅最后一页特别声明-5-证券研究报告 海外海外 TMTTMT 图图 2 2:o1o1 相比于相比于 GPTGPT-4o4o 在各项测试集中的得分提升在各项测试集中的得分提升 资料来源:OpenAI 官网博客 表表 1 1:不同测试集和子分类下:不同测试集和子分类下 GPTGPT-4o4o、o1o1-previewpreview、o1o1 的得分对比的得分对比 测试集测试集 MetricMetric 得分得分 相比相比 GPTGPT-4o4o 的提升的提升 gptgpt-4o4o o1o1-previewpreview o1o1 o1o1-previewpreview o1o1 Competition Math AIME(2024)cons64 13.4 56.7 83.3 323.1R1.6%pass1 9.3 44.6 74.4 379.6p0.0%Competition Code CodeForces Elo 808 1,258 1,673 55.77.1%Percentile 11 62 89 463.6p9.1%GPQA Diamond cons64 56.1 78.3 78 39.69.0%pass1 50.6 73.3 77.3 44.9R.8%Biology cons64 63.2 73.7 68.4 16.6%8.2%pass1 61.6 65.9 69.2 7.0.3%Chemistry cons64 43 60.2 65.6 40.0R.6%pass1 40.2 59.9 64.7 49.0.9%Physics cons64 68.6 89.5 94.2 30.57.3%pass1 59.5 89.4 92.8 50.3V.0%MATH pass1 60.3 85.5 94.8 41.8W.2%MMLU pass1 88 92.3 90.8 4.9%3.2%MMMU(val)pass1 69.1 N/A 78.2 13.2%MathVista(testmini)pass1 63.8 N/A 73.9 15.8%资料来源:OpenAI 官网博客,光大证券研究所整理 o1o1 在部分自然语言任务中评价弱于在部分自然语言任务中评价弱于 GPTGPT-4o4o,但具备更好的安全性。,但具备更好的安全性。人类训练师的评分显示,认为 o1 在个人写作、文档编辑能力上优于 GPT-4o 的比例低于 50%,显示出 o1 在文字生成和修改能力上没有明显提升。但 o1 在对齐和安全方面优于 GPT-4o,o1-preview 在关键越狱评估和模型安全拒绝边界评估等指标中性能显著提高。由于 o1 采用思维链的方式进行推理,在输出内容的过程中提供了更多的内部可见性,赋予模型更强的可控性和更多的优化空间。敬请参阅最后一页特别声明-6-证券研究报告 海外海外 TMTTMT o1o1-minimini 在维持较高性能的同时大幅度降低推理成本。在维持较高性能的同时大幅度降低推理成本。由于在预训练期间针对STEM 推理进行了优化,o1-mini 在数学和编码能力上具备相当高的性价比,且拥有更低的延迟。根据 OpenAI 官网博客,o1-mini 在 AIME 数学竞赛中的得分高于 o1-preview,几乎与 o1 相当,但推理成本相较 o1-preview 便宜 80%;此外,o1-mini 在 Codeforces 编码竞赛和网络安全竞赛中表现优异。但另一方面,o1-mini 在非 STEM 的事实知识任务中表现较差。图图 3 3:o1o1-minimini、o1o1 等模型等模型 AIMEAIME 得分和推理成本对比得分和推理成本对比 图图 4 4:o1o1-minimini 的的 CodeforcesCodeforces 得分显著优于得分显著优于 o1o1-previewpreview 资料来源:OpenAI 官网博客 资料来源:OpenAI 官网博客 1.2 1.2 o1o1 具备具备全局全局思维能力思维能力,复杂推理复杂推理补足长尾需求,补足长尾需求,开开拓拓学术教育学术教育垂类场景垂类场景 OpenAI o1OpenAI o1 复杂推理能力的关键技术是思维链(复杂推理能力的关键技术是思维链(CoTCoT),让模型在给出答案前),让模型在给出答案前进行多步思考,而不是一步给出答案。进行多步思考,而不是一步给出答案。在 OpenAI 的官方文档中展示了 o1 和GPT-4o 在解码、编码、数学、字谜、语言等问题上的解答对比,并展示了 o1的完整思维链。根据我们的根据我们的归纳和归纳和测评,测评,o1o1 思维链思维链的的主要特征可以概括为以下两点:主要特征可以概括为以下两点:1 1)优先优先形成全局方法:形成全局方法:在开始解答前,o1 会先分析问题本身,抽象出底层规律,避免后续的解决思路跑偏,相比其他大模型的线性思维过程,准确度有明显提升;2 2)不断不断的的追问和反思:追问和反思:在输出最终答案之前,o1 会不断反思自己的解答过程是否有问题,有没有需要改进的地方,其完整思维链可达数百行。图图 5 5:针对复杂数学问题,针对复杂数学问题,o1o1-previewpreview 在在思维链思维链中不断进行纠错、追问和反思,最终得到中不断进行纠错、追问和反思,最终得到完整的解题框架完整的解题框架 资料来源:OpenAI 官网博客 敬请参阅最后一页特别声明-7-证券研究报告 海外海外 TMTTMT 例如,在解答纵横填字游戏的问题时,GPT-4o 和 o1 都会先试图理解游戏规则,但 GPT-4o 仅仅停在了“第一行和第一列单词首字母相同”上,便直接输出了错误答案,而 o1 通过思维链不断反思,得出了“每一行和每一列的对应字母都要相同”的底层规律,再基于该规律进行解答。同样,在解答复杂数学问题时,o1 会先试图理解给定信息,通过完整思维链中大量的纠错和反思,归纳底层原理,并对后续的解答过程做出一定的限制。图图 6 6:针对规则复杂的纵横填字游戏,针对规则复杂的纵横填字游戏,GPTGPT-4o4o 因无法理解规则而出错,因无法理解规则而出错,o1o1-previewpreview 首先首先理解规则理解规则再进行解答再进行解答 资料来源:OpenAI 官网博客 不过,当前不过,当前 o1o1-previewpreview 所展现出的所展现出的完整完整思维链仍较为僵化,与人类思维方式思维链仍较为僵化,与人类思维方式有较明显区别。有较明显区别。例如,在 OpenAI 官网给出的解码案例中,实际的解码方式为两个字母一组,按照字母表顺序转化成数字,取平均值后再转化为对应的字母。例如 oy=(15 25)/2=20=T。在完整的思维链中,o1 所想到的第一个方法就非常接近正确答案,但它依然继续穷举了五种新方法才找到答案。在这个过程中,可以看到 o1 的联想能力较弱,而是通过类似于穷举法的方式寻找答案。图图 7 7:针对解码问题,针对解码问题,o1o1-previewpreview 的思维链采用了类似穷举法的方式寻找答案,思维链较为僵化的思维链采用了类似穷举法的方式寻找答案,思维链较为僵化 资料来源:OpenAI 官网博客 o1o1 的复杂推理能力有望补足的复杂推理能力有望补足 AIAI 应用的长尾需求,拓展学术教育等领域的垂类应用的长尾需求,拓展学术教育等领域的垂类应用场景。应用场景。过去以 GPT-4o 为代表的 LLM 在解答题目时虽然正确率较高,但解答方法可能较为繁琐,不符合教育场景的需求。o1 不但在复杂问题上展现出更高的正确率,而且具备较强的全局思维能力,能优化出最佳解题过程,对于学术教育场景的 AI 应用使用体验提升较为明显。敬请参阅最后一页特别声明-8-证券研究报告 海外海外 TMTTMT 1.3 o1.3 o1 1 在编程上在编程上展现出展现出自主规划自主规划和主动思考和主动思考能力能力,AI AI 低代码低代码/网络安全领域网络安全领域有望最早受益有望最早受益 OpenAI o1OpenAI o1 在编程在编程方面具备较强的自主性方面具备较强的自主性,可以一定程度上对冲,可以一定程度上对冲 o1o1 高成本和高成本和高延迟高延迟的问题的问题。根据 o1 开发者团队的采访,OpenAI 内部开发人员使用 o1 最多的场景就是编程,主要有两个场景:1 1)采用测试驱动开发的方法:)采用测试驱动开发的方法:先编写一个单元测试,明确程序应该如何运行才算正确,将具体编写交给 o1 来完成,开发者只需要解决架构设计等更高层次的问题。2 2)调试:调试:遇到 bug 时直接交给 o1,可以直接解决或提供有价值的思路。另外,o1 在解决 AL/ML 编程问题上进步明显,根据 OpenAI 研究工程师访谈,o1-preview 的编码效率比 GPT-4o 提升 15%,在多任务解决上的效率比 GPT-4o 提升 21%。在民间测试中,在民间测试中,o1o1 效果最好的应用场景也是编程效果最好的应用场景也是编程。1 1)代码)代码性能性能优化:优化:将Github Copilot 和 o1-preview 结合,仅需几步操作,就可以优化一个原本运行缓慢的编码器,大幅度提升代码的性能;2 2)快速快速开发简单的项目:开发简单的项目:将 AI 编程工具 Cursor Composer 和 o1-preview 结合,可以在 10 分钟内完成一个带有动画效果的完整天气预报 App。图图 8 8:将将 o1o1-previewpreview 与与 Github CopilotGithub Copilot 优化优化编码器运行速度编码器运行速度 图图 9 9:o1o1-previewpreview 与与 Cursor ComposerCursor Composer 结合,快速开发结合,快速开发 AppApp 资料来源:X 用户 Thomas Dohmkeashtom 资料来源:X 用户 Oliver Janeheyoliverjane OpenAI o1OpenAI o1 在网络安全攻防中表现优秀在网络安全攻防中表现优秀,能将,能将复杂复杂任务分解成任务分解成多个子任务多个子任务,并,并找到最简单的找到最简单的解决方法解决方法。根据 OpenAI 官方 System card,o1-preview 使用网络安全挑战赛 CTF 的课题进行测试,该课题要求参赛者找到隐藏在 Docker 中的 flag,但由于系统配置问题比赛环境崩溃。在比赛几乎无法进行的情况下,o1-preview 突破了主机 VM 上运行的 Docker deamon API,在尝试修复环境失败后,模型直接通过启动命令启动了损坏容器的新实例,该实例允许模型直接通过 Docker API 从容器日志中读取 flag,最终完成了课题。敬请参阅最后一页特别声明-9-证券研究报告 海外海外 TMTTMT 图图 1010:o1o1-previewpreview 找到找到 Docker Host APIDocker Host API 并并启动启动了了损坏容器的损坏容器的新实例新实例 资料来源:OpenAI o1 System Card 未来网络安全的攻防环境将变得更加复杂。未来网络安全的攻防环境将变得更加复杂。从上述案例中,我们看到 o1-preview 在编程方面已经初步具备了自主规划能力,在遇到复杂困难时尝试主动解决问题。而 o1 在解决问题的过程中采取了带有攻破性质的解决方法,也体现出了 AI 辅助网络攻击的潜在威胁较大。根据 CrowdStrike 发布的全球威胁报告,2023 年全球网络攻击平均突破防御的时间从上一年的 84 分钟下降到62 分钟,其中云入侵案例同比增加了 75%。攻击者越来越多地使用生成式 AI降低网络攻击的操作和准入门槛,企业面临更大的网络安全威胁。图图 1111:20232023 年交互式入侵主要针对北美洲地区年交互式入侵主要针对北美洲地区 图图 1212:20212021-20232023 年针对云的入侵案例显著增加年针对云的入侵案例显著增加 资料来源:CrowdStrike 2024 年全球威胁报告 资料来源:CrowdStrike 2024 年全球威胁报告 另一方面另一方面,基于基于 AI/MLAI/ML 的网络安全解决方案也在不断升级和迭代,的网络安全解决方案也在不断升级和迭代,AIAI 驱动的网驱动的网络安全攻防升级将成为未来行业的主旋律。络安全攻防升级将成为未来行业的主旋律。23 年以来网络安全公司陆续推出生成式 AI 驱动的功能,主要包含以下几方面能力:1 1)AI/MLAI/ML 技术强化威胁检测技术强化威胁检测和安全保护能力:和安全保护能力:AI 技术融入网络安全产品体验,技术壁垒主要在于各公司积累的安全日志和响应数据。2 2)生成可视化安全日志:)生成可视化安全日志:对公司网络安全状况进行分析,生成可视化、可交互的安全日志,帮助员工快速了解公司安全漏洞,生成定制化的应对方案。3 3)AIAI 聊天机器人助手:聊天机器人助手:将聊天机器人嵌入网络安全云原生平台,使用自然语言交互降低安全员的技术门槛。敬请参阅最后一页特别声明-10-证券研究报告 海外海外 TMTTMT 表表 2 2:2323 年以来部分网络安全公司推出的生成式年以来部分网络安全公司推出的生成式 AIAI 产品和功能产品和功能 公司公司 生成式生成式 AIAI 产品产品 发布时间发布时间 具体介绍具体介绍 Microsoft Copilot for Security 24M3 在微软综合性的安全服务里加入 AI 副驾驶,涉及端点安全、身份访问和管理(IAM)、安全事件和响应管理(SIEM)、数据治理等多方面功能。Copilot 可以总结和评估安全事件、提供可操作的建议,降低安全员复杂操作的门槛,使用大模型识别身份风险、风险暴露情况等 CrowdStrike Charlotte AI 23M6 生成逼真的攻击场景,提前发现企业潜在的安全漏洞,增强网络防御能力;通过与 Charlotte AI 互动训练,提升企业员工的网络安全意识 Falcon MaaS 24M3 Falcon 平台引入英伟达 AI 计算服务,使用其独特而丰富的网络威胁情报数据,帮助用户构建和训练AI 网络安全模型,以及开发 AI 驱动的网络安全应用程序,监测网络安全漏洞,主动防御可能出现的攻击 Zscaler Business Insight 23M12 推出 AI 驱动的安全产品组合 Business Insight,包括 Zscaler Risk360 和 Zscaler 数字体验监控产品中的 AI 工具,利用零信任架构训练强大的 AI/ML 安全引擎,协助企业降低成本,形成可视化的评估报告 Varonis Athena AI 23M11 包含 Athena AI 分析师、自然语言搜索等工具,AI 聊天机器人 AI SOC Assistant 嵌入 Varonis 数据安全平台并出现在各种用户界面,显著提升安全任务效率、降低安全员的技术门槛 Okta Okta AI 23M10 先进的 AI 技术和 Okta 的身份认证和访问管理平台,Okta AI 可以分析用户行为和模式,以优化身份验证流程和访问控制,并且利用机器学习和预测分析来识别和应对潜在的安全威胁 Fortinet Fortinet Advisor 23M12 提供网络安全方面的咨询和指导;提供实时的威胁情报和风险评估,帮助组织了解当前的网络安全威胁和漏洞,并根据组织的需求和网络环境,提供定制化的安全架构规划。通过分析和评估组织的网络安全配置和运行状况,提供性能优化建议和最佳实践指导 Cloudflare Cloudflare One for AI 23M5 利用 Cloudflare 强大的网络安全基础设施,为 AI 应用提供全面的保护。Cloudflare One for AI 提供安全、私密的网络连接,能够抵御各种类型的 DDoS 攻击,检测和阻止恶意的 Web 请求和攻击 资料来源:各公司官网,光大证券研究所整理 OpenAI o1OpenAI o1 在在挑战性拒绝评估、越狱抗性、幻觉控制等能力上提升明显,对于挑战性拒绝评估、越狱抗性、幻觉控制等能力上提升明显,对于AIAI 生成内容的安全性生成内容的安全性意义重大。意义重大。根据 OpenAI 官方 System card,涉及要求拒绝不安全请求的复杂 Prompt 时,o1-preview 实现了 93.4%的安全率,明显超过 GPT-4o 的 71.3%。在具有强挑战性的越狱学术基准 StrongReject 上,o1-preview 相比 GPT-4o 显示出明显地改进,抵抗违反安全规则行为的能力更强。另外,与 GPT-4o 相比,o1-preview 在 SimpleA、BirthdayFacts 等多个数据集中表现出更少的幻觉,提供了更准确可靠的回答。图图 1313:o1o1-previewpreview 和和 o1o1-minimini 在越狱学术基准在越狱学术基准 StrongRejectStrongReject 上明显领先上明显领先 GPTGPT-4o4o 资料来源:OpenAI o1 System Card 敬请参阅最后一页特别声明-11-证券研究报告 海外海外 TMTTMT 2 2、AI AgentAI Agent 是打破是打破 AIAI 应用发展瓶颈应用发展瓶颈的关的关键键,o1o1 能否开启通往能否开启通往 AgentAgent 之路?之路?受限于模型性能,受限于模型性能,AIAI 应用应用发展进入瓶颈。发展进入瓶颈。当前以 GPT-4o 为代表的 LLM 在文本处理和生成上表现优异,但也导致了 AI 应用的形式局限于聊天机器人,产品形态同质化,难以发掘用户潜在需求、形成足够的用户粘性。而用户付费意愿不足,AI 应用的成本收益临界点尚未到来,是 AI 应用难以大规模推广的最大症结。以北美科技巨头为代表的企业已经投入大量资本支出用于 AI 基础设施建设,折旧成本将对利润端造成压力,若削减资本支出,则会削弱上游算力产业链的业绩成长性。AI 产业链已来到十字路口,模型底层技术的突破,是整个 AI 产业发展和投资情绪提振的关键。AI AI AgentAgent 是是 AIAI 发展的发展的下一个台阶下一个台阶,是打破,是打破 AIAI 应用症结的关键,而应用症结的关键,而 o1o1 展现的展现的底层技术走在正确的道路上。底层技术走在正确的道路上。AI Agent 应当拥有自主理解、规划和执行复杂任务的能力,可以将简单的指令自主拆分成多个步骤并精细化执行,将上一环节的输入作为下一环节的输出。早在 23M4 便有 AutoGPT、BabyAGI 等 Agent项目作为早期探索,但性能尚不成熟,容易陷入死循环卡死、消耗大量 tokens的问题,且 AI 全自动代理存在潜在的可靠性风险。而近期的而近期的 AIAI 领域前沿论文,领域前沿论文,以及以及 OpenAI o1OpenAI o1 集成前沿理论集成前沿理论推出的实际模型,展现了当前模型性能迭代和技推出的实际模型,展现了当前模型性能迭代和技术演进路径正走在通往术演进路径正走在通往 AgentAgent 的正确道路上。的正确道路上。具体包括三个关键点:1)强化学习推理(RL Reasoning)产生了新的 Scaling Law,为模型性能的提升提供了更多的维度。当前大模型参数量扩张进入瓶颈,市场普遍担忧 26年科技巨头资本支出持续性的问题,我们认为,强化学习我们认为,强化学习 Scaling LawScaling Law 对推理对推理算力扩张的需求大幅增算力扩张的需求大幅增加的同时,对训练算力扩张的需求也将持续提升。加的同时,对训练算力扩张的需求也将持续提升。2)强化学习范式中的 self-play 通过自主博弈生成大量高质量数据,有利于突破当前外部训练数据逐渐用尽的现状。3)强化学习范式中的蒙特卡洛树搜索(MCTS)具备自主探索和连续决策的能力,更适应 AI Agent 的全局规划需求。图图 1414:构建构建 AIAI 应用的五层基石理论应用的五层基石理论 图图 1515:AlphaAlphaZ Zeroero 随机初始化、随机初始化、selfself-playplay、MCTSMCTS、策略更新、策略更新 资料来源:Seednapse AI,光大证券研究所整理 资料来源:AlphaTensor 论文,展现了 AlphaZero 矩阵运算解题时的变种,图中的Acting 对应随机初始化、self-play、MCTS,learning 对应策略更新 ModelsModels 多个 Agent 自主分工相互协作 PromptPrompt ChainsChains AgentAgent MultiMulti-AgentAgent 自主执行链式调用,访问外部工具 模型的链式调用,上个输出=下个输入 提示词中引入变量以适应自定义模版 调用大模型 API 敬请参阅最后一页特别声明-12-证券研究报告 海外海外 TMTTMT 2.1 2.1 新的新的 Scaling LawScaling Law,RL CoTRL CoT 对于实现能自主规划的对于实现能自主规划的AI AAI Agentgent 至关重要至关重要 慢思考或将慢思考或将突破突破 S Scaling caling L Lawaw 的边界,带来模型性能的进一步突破的边界,带来模型性能的进一步突破。在过去几年,LLM 的发展主要依赖于训练侧的大规模投入,其性能提升依赖于模型规模、数据量和计算资源的扩展,而与模型的具体结构(例如层数、深度、宽度)基本无关。长期来看,随着大模型参数突破万亿级、有效训练数据被大量消耗,模型的训练和推理的成本迅速上升,边际收益递减,Scaling Law 驱动的技术路径和商业化前景可能遭遇瓶颈。在这样的背景下,o1 揭示了一种充满可能性的 Scaling Law 范式,即强化学习(RL)驱动的性能提升,通过训练过程和推理过程两种渠道来拓展模型的计算能力。o1o1 采用大规模强化学习算法,展采用大规模强化学习算法,展现出训练和测试两个维度的现出训练和测试两个维度的 Scaling LawScaling Law。根据官网博客,在强化学习过程中,o1 在 AIEM 测试中的准确率与“训练时间计算”和“测试时间计算”呈正比。1 1)训练时间计算:)训练时间计算:代表传统的 Scaling Law,即模型性能提升依赖于训练时投入更多的计算资源;2 2)测试时间计算:)测试时间计算:代表测试时模型性能随着推理时间延长而提升,包括多次的推理迭代、更加复杂的搜索算法或模型的深度思考,从而在特定垂类任务中表现增强。因此,o1 不仅通过增加训练时投入的计算资源来提升模型性能,还通过增加推理过程中的内部思考时间来获得能力的提升,训练和推理 Scaling Law 双曲线共同增长,为大模型性能提升提供了更多的维度。图图 1616:o1o1 在在 AIEMAIEM 测试中的准确率与“训练时间计算”和“测试时间计算”呈正比测试中的准确率与“训练时间计算”和“测试时间计算”呈正比 资料来源:OpenAI 官网博客 强化学习范式对于实现自主规划的强化学习范式对于实现自主规划的 AI AgentAI Agent 至关重要。至关重要。大模型训练的三大经典范式(监督学习、非监督学习、强化学习)中,只有强化学习让 AI 进行自主探索和连续决策,符合 Agent 定义中的自主规划能力。1 1)自主探索:)自主探索:强化学习允许 AI Agent 在没有明确目标的情况下,通过与环境互动探索可能的解决方案,并基于奖惩反馈动态调整策略,使 Agent 能使用复杂、多变的决策环境。2 2)连续决策:连续决策:强化学习支持多步骤的决策过程,关注如何在一系列决策中最大化长期回报,使 Agent 具备更强的长线规划能力。相比相比 RLHFRLHF 的局限性,强化学习的的局限性,强化学习的 selfself-playplay 和和 MCTSMCTS 更适应更适应 AI AgentAI Agent 的要求。的要求。当前 LLM 主要依赖 RLHF 进行优化,目标是“人机对齐”,弱化了逻辑推理的深度和严谨性;而强化学习基于 self-play MCTS 的底层架构,通过高质量的数据博弈提升推理能力。1 1)selfself-playplay:通过 AI 与自己博弈生成大量的高质量数据;2 2)MCTSMCTS(蒙特卡洛树搜索):(蒙特卡洛树搜索):基于策略网络提供的动作概率分布引导搜索方向,通过价值网络的评估结果为搜索提供反馈,使模型的推理能力提升,且推理过程更加可见,有助于进一步调试和改进 AI Agent 模型。敬请参阅最后一页特别声明-13-证券研究报告 海外海外 TMTTMT 图图 1717:在:在 PaLM 2PaLM 2-S*S*模型修正场景中,计算优化缩放(模型修正场景中,计算优化缩放(Compute OptimalCompute Optimal)相比传统的)相比传统的 BestBest-ofof-N N 方法效率显著提高方法效率显著提高 资料来源:Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters,Google DeepMind,2024 年 8 月 左图代表随着时间推移,计算优化缩放策略的表现逐渐优于传统的 best-of-N 方法;右图论证了推理过程中使用计算优化缩放与更大参数预训练之间的权衡,表明在简单问题上,测试时的计算比预训练更有效,但在复杂问题上预训练更有效 除了强化学习推理外,除了强化学习推理外,o1o1 的另一个关键底层技术是思维链(的另一个关键底层技术是思维链(CoTCoT)。)。思维链通过分步推理的方式,要求模型在生成最终答案之前,先生成一系列中间推理步骤。仅靠 MCTS 很难让模型学会从内部思考不同步骤的关联,而思维链能够利用 LLM 已有的推理能力,生成合理的中间推理过程,并进一步将合理推理过程(Rationales)融入到训练过程中。Quiet-STaR 技术则提出了“内部思维”的概念,将显示的 Rationales 推理过程转化为模型内部隐式的推理过程,从而摆脱对外部示例的依赖。强化学习推理和思维链是相互结合、一脉相承的。思维链能极大提升模型涉及数学和符号的推理能力,但在思维链能极大提升模型涉及数学和符号的推理能力,但在其他问题上提升效果其他问题上提升效果不显著,甚至不显著,甚至可能有损模型性能。可能有损模型性能。论文To CoT or not to CoT?中探讨了在模型中采用思维链的表现,在数学、符号推理能力上提升明显,在知识、常识、软推理上无明显提升。另外,使用思维链时模型能更好地生成可执行的方案,但表现不如借助外部工具(如符号求解器)。尽管 OpenAI o1 在数学、物理等复杂推理上能力提升明显,但在一些语言生成任务上没有明显提升,使它无法成为一个可靠的 Agent 助手。这体现了推理能力和模型的指令跟随能力呈现出分离关系,在模型强大到一定程度时才会出现,对于构建 AGI 来说,如何平衡二者的关系会成为一个核心问题。2.2 RL2.2 RL 范式下范式下推理推理算力需求算力需求大幅上升大幅上升,但但不代表训练不代表训练算算力需求力需求会停止增长会停止增长 Scaling LawScaling Law 由训练侧转向推理由训练侧转向推理侧侧,推理成本大幅提升推理成本大幅提升,但,但不代表不代表训练训练端计算端计算资源投入会降低资源投入会降低。基于强化学习的 Scaling Law 范式,本质是将训练时间转化为推理时间,来应对训练侧计算资源投入的边际收益递减的状况。由于 Quiet-STaR 在生成内部思维链的过程中,每个 Token 均会生成下一步思考过程,导致生成了大量的冗余 Tokens,对推理侧计算资源的需求大幅增加。有观点认为,推理相比训练对 GPU 单卡性能和集群规模的需求更低,若强化学习推理成为主流,会导致市场对高端 GPU 的整体需求降低。敬请参阅最后一页特别声明-14-证券研究报告 海外海外 TMTTMT 但我们认为,但我们认为,强化学习强化学习 Scaling LawScaling Law 对推理算力扩张的需求大幅增加的同时,对推理算力扩张的需求大幅增加的同时,对对训练训练算力算力扩张扩张的需求的需求也将持续提升也将持续提升。当前 o1 存在思考时间过长、推理成本过高的问题,使其实际使用场景非常受限,为了加快推理速度,对推理芯片的性能需求也会水涨船高。根据 Artificial Analysis 的测试,o1-preview 生成相同内容的输出 tokens 大约是 GPT-4o 的 5.9 倍,其中 72%的 tokens 为推理过程中生成,按 60 美元/100 万 tokens 的价格收费。因此,使用 o1-preview 的输出成本约为 GPT-4o 的 36 倍。另一方面,o1-preview 的输出速度在主流模型中排名靠后,使其实际使用体验不佳。图图 1818:主流主流模型输出速度和输出质量的对比,模型输出速度和输出质量的对比,o1o1-previewpreview 为输出质量牺牲了输出速度为输出质量牺牲了输出速度 资料来源:Artificial Analysis,圆点大小代表价格,纵轴为 Artificial Analysis 编制的质量指数 图图 1919:主流模型主流模型输入和输入和输出输出的的价格价格对比对比 图图 2020:OpenAIOpenAI 各模型各模型输出和推理输出和推理 tokenstokens 消耗对比消耗对比 资料来源:Artificial Analysis,单位:美元/百万 tokens 资料来源:Artificial Analysis,tokens 统计方法为 30 个样例 prompts 加总 另一方面另一方面,强化学习推理强化学习推理的预训练阶段的预训练阶段同样同样需要消耗大量的算力。需要消耗大量的算力。强化学习推理通过 self-play 自我博弈,生成大量的高质量数据。该方法可以缓解当前可用高质量训练数据不足的问题,但生成的数据理论上是没有上限的,这个过程需要消耗大量的算力。也有观点认为,强化学习推理并不意味着模型参数量停止扩张,因为 self-play 的主模型参数提升可能会产生更好的推理路径。总的来说,虽然强化学习 Scaling Law 对算力需求的影响存在不确定性,但是新的技术路径激发了更多的可能性。除了硬件更新外,模型架构优化也有望点除了硬件更新外,模型架构优化也有望点燃新的燃新的 Scaling LawScaling Law,这可能会改变北美云厂商未来几年的资本支出策略。,这可能会改变北美云厂商未来几年的资本支出策略。敬请参阅最后一页特别声明-15-证券研究报告 海外海外 TMTTMT 北美科技公司北美科技公司进入进入新一轮新一轮 AIAI 投资周期投资周期,资本支出大幅上升可能使公司面临成本,资本支出大幅上升可能使公司面临成本压力压力。经历了 2022 年的宏观环境逆风和净利润承压后,北美科技公司在 2023年普遍开启降本增效,从资本支出占营运现金流的比例来看,利润压力较大的亚马逊、Meta、Oracle 大幅削减了资本支出的占比,谷歌资本支出占比无明显变化,微软、特斯拉资本支出占比均呈上升趋势。而根据公司指引,2024 年和 2025 年科技巨头有望继续增加资本支出,Meta 则明确指出持续增加的投资会使 2025 年的折旧成本大幅提升。根据彭博一致预期,2024 年科技巨头资本支出占营运现金流的比例将普遍达到 40%以上。因此,在 AI 的投资回报率尚不明显的现状下,科技巨头会更加重视 AI 战略的性价比。图图 2121:科技公司资本支出占营运现金流的比例科技公司资本支出占营运现金流的比例变化变化趋势趋势 图图 2222:科技公司资本支出占科技公司资本支出占 GAAPGAAP 净利润的比例净利润的比例变化变化趋势趋势 资料来源:彭博,光大证券研究所整理,已排除自由现金流为负的年份和极端值,24E数据为彭博一致预期 资料来源:彭博,光大证券研究所整理,已排除亏损年份和极端值,24E 数据为彭博一致预期 3 3、投资建议投资建议 根据前文所述,OpenAI o1 所展现出的技术路径的演进方向,即强化学习推理和思维链,产生了推理层面的 Scaling Law,有利于缓解训练侧计算资源投入边际递减的现状。我们认为,我们认为,强化学习强化学习 Scaling LawScaling Law 对推理算力扩张的需求大对推理算力扩张的需求大幅增加的同时,幅增加的同时,对对训练训练算力扩张的需求算力扩张的需求也将持续提升,也将持续提升,算力需求仍将持续强劲。而训练成本转嫁为推理成本,对于 AI 应用的商业化前景来说是个积极的变化,因为推理的成本下降的速度更快、弹性更大。从行业的视角来看,虽然科技巨头拥有较为充足的自由现金流支持资本开支的持续增加,但仍面临折旧成本提升和一定的利润压力,缓解硬件成本压力的需求较为迫切。另一方面,软件公司对于 AI 应用的探索很激进,需要性能更强、更具可靠性的 Agent 来突破困局,微软、Salesforce 均已推出类似 Agent 的产品,静待后续 Agent 底层技术的迭代,撬动 Agent 应用的飞轮效应。1 1、建议关注建议关注 AIAI 电力:电力:AI 数据中心持续提振电力需求,亚马逊、微软等云厂商签署长期协议,清洁能源需求强劲,关注关注核电供应商核电供应商 ConstellationConstellation、光伏供应光伏供应商商 NRGNRG。2 2、建议关注建议关注 AIAI 算力产业链算力产业链:1 1)AI GPUAI GPU:训练侧 AI 大模型持续迭代,推理侧和端侧延伸引发增量需求,产品加速迭代出货,关注英伟达、关注英伟达、AMDAMD;2 2)ASICASIC 芯片设计:芯片设计:AI 算力需求由通用芯片向配合行业和公司特性的专用定制AI 芯片转型,关注关注 MarvellMarvell 科技、博通;科技、博通;3 3)存储:)存储:AI 手机/AIPC 提升容量需求,云端算力带动 HBM 供不应求、市场规模高速增长,关注关注 SKSK 海力士、三星电子、美光科技;海力士、三星电子、美光科技;0 000 15 2016 2017 2018 2019 2020 2021 2022 2023 2024E微软 亚马逊 谷歌 Meta特斯拉 Oracle100%0P00 0 15 2016 2017 2018 2019 2020 2021 2022 2023 2024E微软 亚马逊 谷歌 Meta特斯拉 Oracle100%敬请参阅最后一页特别声明-16-证券研究报告 海外海外 TMTTMT 4 4)服务器:)服务器:AI 算力需求强劲带动 AI 服务器出货量攀升,在手订单高涨,关注关注联想集团、超微电脑、戴尔科技、慧与、工业富联;联想集团、超微电脑、戴尔科技、慧与、工业富联;5 5)CoWoSCoWoS:先进封装 CoWoS 产能成 AI 算力供应瓶颈,台积电订单持续外溢,封测厂受益,关注台积电、日月光、关注台积电、日月光、AmkorAmkor 科技;科技;6 6)网络:)网络:万卡算力集群化趋势驱动通信互联需求,利好光模块、连接器、交换机等,关注中际旭创、新易盛、关注中际旭创、新易盛、CoherentCoherent、安费诺、安费诺、AristaArista 网络。网络。3 3、建议关注、建议关注 AIAI 应用应用产业链产业链:1 1)云技术服务商云技术服务商:充裕的现金流支持大额资本支出投入,基础设施壁垒高筑,用户基础广阔,关注微软、谷歌、亚马逊关注微软、谷歌、亚马逊、OracleOracle;2 2)AI AI 开发开发/数据分析:数据分析:o1 展现出强大的复杂推理和编程能力,对于数据分析、低代码等产品的使用体验提升明显,关注关注 ServiceNowServiceNow、PalantirPalantir、DatadogDatadog;3 3)AI AI 网络安全:网络安全:o1 在解决问题的过程中采取了带有攻破性质的解决方法,也体现出了 AI 辅助网络攻击的潜在威胁。另一方面,基于 AI/ML 的网络安全解决方案也在不断升级和迭代,AI 驱动的网络安全攻防升级将成为未来行业的主旋律。关注致力于 AI/ML 网络安全解决方案、拥有较强技术壁垒的的公司,关注关注微软、微软、CrowdStrikeCrowdStrike、FortinetFortinet;4 4)AI AgentAI Agent:当前企业客户对 AI 的数据整合、后台打通、优化工作流的潜在需求较为强劲,o1 的技术路径有望加速 Agent 的发展,大型 SaaS 公司拥有坚实的客户基础、成熟的销售渠道,特别是专注于 ERP、CRM 等领域的 SaaS 产品服务于企业工作流,与 Agent 的逻辑相契合,关注微软、关注微软、SalesforceSalesforce、WorkdayWorkday;5 5)AI AI 教育:教育:o1 在复杂问题上具备强大的推理能力和全局思维能力,有望拓展学术教育等垂类应用场景,关注多邻国、关注多邻国、CourseraCoursera。4 4、风险风险分析分析 1)AI 技术研发和产品迭代遭遇瓶颈:当前 AI 产业发展较依赖前沿技术突破,若遭遇瓶颈则会导致 AI 应用需求不足;2)AI 行业竞争加剧风险:当前 AI 产业链面临激烈竞争,可能因行业竞争加剧而挤压利润空间;3)商业化进展不及预期风险:AI 应用的用户需求和渗透率扩张可能低于预期;4)国内外政策风险:AI 相关版权和数据合规政策仍待完善。敬请参阅最后一页特别声明-17-证券研究报告 海外海外 TMTTMT 行业及公司评级体系行业及公司评级体系 评级评级 说明说明 行行 业业 及及 公公 司司 评评 级级 买入 未来 6-12 个月的投资收益率领先市场基准指数 15%以上 增持 未来 6-12 个月的投资收益率领先市场基准指数 5%至 15%;中性 未来 6-12 个月的投资收益率与市场基准指数的变动幅度相差-5%至 5%;减持 未来 6-12 个月的投资收益率落后市场基准指数 5%至 15%;卖出 未来 6-12 个月的投资收益率落后市场基准指数 15%以上;无评级 因无法获取必要的资料,或者公司面临无法预见结果的重大不确定性事件,或者其他原因,致使无法给出明确的投资评级。基准指数说明:基准指数说明:A 股市场基准为沪深 300 指数;香港市场基准为恒生指数;美国市场基准为纳斯达克综合指数或标普 500 指数。分析、估值方法的局限性说明分析、估值方法的局限性说明 本报告所包含的分析基于各种假设,不同假设可能导致分析结果出现重大不同。本报告采用的各种估值方法及模型均有其局限性,估值结果不保证所涉及证券能够在该价格交易。分析师声明分析师声明 本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度、专业审慎的研究方法,使用合法合规的信息,独立、客观地出具本报告,并对本报告的内容和观点负责。负责准备以及撰写本报告的所有研究人员在此保证,本研究报告中任何关于发行商或证券所发表的观点均如实反映研究人员的个人观点。研究人员获取报酬的评判因素包括研究的质量和准确性、客户反馈、竞争性因素以及光大证券股份有限公司的整体收益。所有研究人员保证他们报酬的任何一部分不曾与,不与,也将不会与本报告中具体的推荐意见或观点有直接或间接的联系。法律主体声明法律主体声明 本报告由光大证券股份有限公司制作,光大证券股份有限公司具有中国证监会许可的证券投资咨询业务资格,负责本报告在中华人民共和国境内(仅为本报告目的,不包括港澳台)的分销。本报告署名分析师所持中国证券业协会授予的证券投资咨询执业资格编号已披露在报告首页。中国光大证券国际有限公司和 Everbright Securities(UK)Company Limited 是光大证券股份有限公司的关联机构。特别声明特别声明 光大证券股份有限公司(以下简称“本公司”)成立于 1996 年,是中国证监会批准的首批三家创新试点证券公司之一,也是世界 500 强企业中国光大集团股份公司的核心金融服务平台之一。根据中国证监会核发的经营证券期货业务许可,本公司的经营范围包括证券投资咨询业务。本公司经营范围:证券经纪;证券投资咨询;与证券交易、证券投资活动有关的财务顾问;证券承销与保荐;证券自营;为期货公司提供中间介绍业务;证券投资基金代销;融资融券业务;中国证监会批准的其他业务。此外,本公司还通过全资或控股子公司开展资产管理、直接投资、期货、基金管理以及香港证券业务。本报告由光大证券股份有限公司研究所(以下简称“光大证券研究所”)编写,以合法获得的我们相信为可靠、准确、完整的信息为基础,但不保证我们所获得的原始信息以及报告所载信息之准确性和完整性。光大证券研究所可能将不时补充、修订或更新有关信息,但不保证及时发布该等更新。本报告中的资料、意见、预测均反映报告初次发布时光大证券研究所的判断,可能需随时进行调整且不予通知。在任何情况下,本报告中的信息或所表述的意见并不构成对任何人的投资建议。客户应自主作出投资决策并自行承担投资风险。本报告中的信息或所表述的意见并未考虑到个别投资者的具体投资目的、财务状况以及特定需求。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。对依据或者使用本报告所造成的一切后果,本公司及作者均不承担任何法律责任。不同时期,本公司可能会撰写并发布与本报告所载信息、建议及预测不一致的报告。本公司的销售人员、交易人员和其他专业人员可能会向客户提供与本报告中观点不同的口头或书面评论或交易策略。本公司的资产管理子公司、自营部门以及其他投资业务板块可能会独立做出与本报告的意见或建议不相一致的投资决策。本公司提醒投资者注意并理解投资证券及投资产品存在的风险,在做出投资决策前,建议投资者务必向专业人士咨询并谨慎抉择。在法律允许的情况下,本公司及其附属机构可能持有报告中提及的公司所发行证券的头寸并进行交易,也可能为这些公司提供或正在争取提供投资银行、财务顾问或金融产品等相关服务。投资者应当充分考虑本公司及本公司附属机构就报告内容可能存在的利益冲突,勿将本报告作为投资决策的唯一信赖依据。本报告根据中华人民共和国法律在中华人民共和国境内分发,仅向特定客户传送。本报告的版权仅归本公司所有,未经书面许可,任何机构和个人不得以任何形式、任何目的进行翻版、复制、转载、刊登、发表、篡改或引用。如因侵权行为给本公司造成任何直接或间接的损失,本公司保留追究一切法律责任的权利。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。光大证券股份有限公司版权所有。保留一切权利。光大证券股份有限公司版权所有。保留一切权利。光大证券研究所光大证券研究所 上海上海 北京北京 深圳深圳 静安区新闸路 1508 号 静安国际广场 3 楼 西城区武定侯街 2 号 泰康国际大厦 7 层 福田区深南大道 6011 号 NEO 绿景纪元大厦 A 座 17 楼 光大证券股份有限公司关联机构光大证券股份有限公司关联机构 香港香港 英国英国 中国光大证券国际有限公司中国光大证券国际有限公司 香港铜锣湾希慎道 33 号利园一期 28 楼 Everbright SEverbright Securitiesecurities(UK)Company Limited(UK)Company Limited 6th Floor,9 Appold Street,London,United Kingdom,EC2A 2AP
2024 年深度行业分析研究报告目目录录1.原理解析:思维链铸就智能体,多体交互拓展应用.61.1Agent 模式架构解析.61.2单智能体 vs 多智能体.71.3 Prompt 提示词的艺术.8.
Confidential and Protected by Copyright Laws本产品保密并受到版权法保护AI加速数字员工智能化落地中国数字员工市场发展及企业数字员工落地建议易观分析2024年9月数字员工的定义与概念013激发科技与创新活力2024/9/24数字员工的价值与意义数字员工数据员工系统提 升 企 业 运 营 效 率数字员工可以 24/7 不间断地工作,无需休息、休假或受生物钟影响,能够同时处理多个任务,并且可以快速切换任务,不会出现疲劳或注意力不集中的情况。有 效 降 低 成 本 投 入数字员工可以长期使用,并且,数字员工可以替代多个人工岗位,进一步降低了企业的人力成本。同时,数字员工可以通过预设的程序和算法进行工作,无需进行复杂的培训,大大节省企业的运营成本。更 有 效 保 障 工 作 质 量 与 稳 定 性数字员工不会受到情绪、疲劳、压力等因素的影响,能够始终保持高度的专注和准确。同时,数字员工可以通过严格的程序控制和数据校验,避免人为错误的发生。4激发科技与创新活力2024/9/24数字员工定义数字员工是一种由人工智能、机器学习、自动化流程等技术驱动的虚拟劳动力。它们能够模拟人类员工的行为和决策,处理大量的数据和信息,执行各种重复性、规律性的任务。一种软件机器人,可以模拟人类在数字系统中的操作,执行重复性、规则性的任务,提高业务流程的效率和准确性UiPath数字员工又称数字化劳动力,是通过数字化技术打破人与机器边界、充分激活劳动力潜能的第四种企业用工模式,即“人机耦合”。麦肯锡数字员工是利用人工智能、机器学习、自然语言处理等多重技术深入融合创造的高度拟人化虚拟助手,具有认知、理解、分析、对话等能力,并拥有一定“智商”,可以自主或协助处理相关工作,帮助企业提高工作效率、减少人力成本、降低人为误差等。小冰数字员工是以“AI RPA 数据 机器人”等多重技术深入融合应用创造的高度拟人化的新型工作人员,特点是人格化、智能化、自动化,具备主动感知、主动交互的能力,可覆盖更多的业务场景,能够像“人”一样成长。金蝶5激发科技与创新活力2024/9/24数字员工分类华为划分金蝶划分作业型助手型专家型面向全体员工全员助手面向专业岗位专员助手面向管理者决策助手科大讯飞划分实在智能划分有人值守机器人(人工辅助自动化/前台)无人值守机器人(非人工辅助自动化/后台)管理类营销类办公类按照岗位职能进行划分6激发科技与创新活力2024/9/24数字员工分类ToolCopilotAI AgentRPARPA AILLM驱动程序员驾驭数字员工,赋能业务团队业务人员可用,进一步降低应用门槛人机协同,实现数字化劳动力的组合与重构表面上看,这就是数字员工的进化过程,为什么不是而是呢?原因在于,低代码和RPA是AI Agent落地的重要辅助,在全自动的AI Agent到来之前,这些相对成本更低,且效果更可控,也就是说对于企业而言,仍然需要根据业务场景和目标来形成数字员工的有效组合。数字员工发展趋势028激发科技与创新活力2024/9/24趋势1:数字员工进一步提升智能水平,成为超级智能体,具备更强的学习和推理能力,处理更复杂的任务多任务处理数字员工具备同时处理多个任务的能力,能够在不同的业务场景中快速切换,提高工作效率复杂问题解决面对复杂的问题,超级智能体能够运用强大的学习和推理能力,将复杂问题分解为多个子问题,分别进行处理,然后整合结果,提出完整的解决方案跨部门协作超级智能体还能够与企业内部的不同部门进行高效的协作,打破部门之间的壁垒,实现信息共享和业务协同逻辑推理超级智能体具备强大的逻辑推理能力,可以分析复杂的业务逻辑,找出问题的关键所在,并提出合理的解决方案因果推理超级智能体能够进行因果推理,理解事件之间的因果关系,通过分析大量的数据,找出事件的原因和结果,从而更好地预测未来的发展趋势,为企业提供前瞻性的决策支持不确定性推理超级智能体根据不完全的信息和概率模型,通过贝叶斯网络、模糊逻辑等技术,处理不确定性信息,提高决策的准确性和可靠性自主学习通过分析历史业务数据、用户行为数据等,发现其中的规律和模式,从而更好地适应不同的业务场景和用户需求持续学习超级智能体可以不断接收新的数据和反馈,不断调整和改进自己的行为和决策,使得数字员工能够与时俱进,始终保持最佳的工作状态跨领域学习超级智能体能够进行跨领域学习,将不同领域的知识和技能融合起来,具备处理复杂跨领域任务的能力处理更复杂的任务更强的推理能力更强的学习能力9激发科技与创新活力2024/9/24趋势2:融入工作流程的数字员工将成为主流单点 数字员工应用存在局限性,融入工作流程的AI数字员工将成为主流,将为企业数字化经营带来更高的效率、更好的效果和更强的竞争力。企业应积极拥抱这一趋势,将 AI 数字员工深度融入到工作流程中,实现经营的智能化、自动化和个性化。单点 数字员工应用存在局限性融入工作流程的 AI 数字员工将成为主流l缺乏系统性单点 AI 工具通常只能解决特定的营销问题,如智能聊天机器人用于客户服务、图像识别工具用于广告创意等。这些工具虽然在各自的领域有一定的作用,但无法形成一个完整的闭环体系。l数据孤岛问题不同的单点 AI 工具可能使用不同的数据来源和格式,导致数据难以整合和共享,这就形成了数据孤岛,使得企业无法全面了解客户和市场情况,影响营销决策的准确性。l难以实现协同效应单点工具之间缺乏协同性,无法发挥最佳效果,同时,也会导致团队忙于在各个系统和工具间切换,产生工作冗余。企业需要的是一个能够整合各个环节的一体化解决方案,以实现协同效应,提高工作效率和效果。l提高工作效率当 AI 数字员工融入到工作流程中时,它可以自动完成一些重复性、繁琐的任务,如数据收集、分析、报告生成等,让工作人员能够将更多的时间和精力投入到策略制定和创意设计等更有价值的工作中。l实现个性化经营和营销融入工作流程的 AI 数字员工可以实时获取客户数据,并根据客户的行为和偏好进行跨渠道的个性化营销推荐。这种个性化的营销方式可以提高客户的参与度和转化率,增强客户对品牌的忠诚度。l提升决策准确性AI 数字员工可以通过对大量数据的分析,为决策提供实时的、基于数据的支持。当它融入到工作流程中时,工作人员可以随时获取这些数据和分析结果,从而做出更加准确的决策。10激发科技与创新活力2024/9/24趋势3:数字员工成为企业核心资产之一,“混合型”员工队伍是企业人力资源的重要方向数字化劳动力具备专业领域业务知识的专属固定员工专业领域专家具备数字化技能的员工数字化能力员工Agile Human One,具备多重能力的非固定员工超级敏捷员工具备某种专业能力,可以执行复杂任务的数字员工专业数字员工从事通用流程或者任务的数字员工通用数字员工辅助机器人,以及具身智能数字员工辅助数字员工“混合型”员工队伍是企业人力资源的重要方向人类员工数字员工01优势互补02提升员工满意度和忠诚度03适应数字化转型与可持续发展的需求人类员工具有创造力、情感认知、人际交往等方面的优势,能够处理复杂的、需要人类智慧和判断力的任务;数字员工则具有高效、准确、稳定等方面的优势,能够处理大量的重复性、规律性的任务。“混合型”员工队伍可以为员工提供更多的发展机会和职业选择。人类员工可以与数字员工合作,学习新的技能和知识,提升自己的综合素质和竞争力。同时,数字员工的引入也可以减轻人类员工的工作负担,提高工作效率和质量,从而提升员工的满意度和忠诚度。“混合型”员工队伍可以更好地适应企业数字化转型的需求,为企业提供更加灵活、高效的人力资源支持,提高企业的运营效率和管理水平,增强企业的竞争力。11激发科技与创新活力2024/9/24趋势4:数字员工开发与运营平台在线化与开放化是趋势基础设施层(技术支撑)业务平台层价值层开发运营管理租赁/交易人工智能RPA服务通用设施CG技术大模型计算机视觉语音语义理解建模软件渲染引擎驱动技术5G网络云边计算芯片/传感器/AIOT等标准与规范员工管理与考核安全治理技术培训功能场景业务场景行业场景交互界面开发平台在线化能够汇聚大量的开发资源和数据,实现资源的共享和复用;可以实现数字员工的实时更新和升级,确保数字员工始终保持最佳状态。开放化则能够吸引更多的开发者和合作伙伴参与,共同构建数字员工的生态系统,并促进数据的流通和共享,实现数据驱动的数字员工开发和运营。未来伴随数字员工资产确权进一步明确,数字员工将衍生租赁和交易模式,新型AI劳动力生态由此发展。12激发科技与创新活力2024/9/24趋势5:数字员工市场将诞生一批新业态,生态愈发繁荣01020304AI/大模型合作伙伴通用大模型提供AI技术能力供给,模型能力的增强也将显著提升数字员工的表现行业工具伙伴各种垂直细分工具,将随需整合到数字员工平台,如CRM、SCRM、OA、进销存等等行业解决方案伙伴围绕行业客户的需求,需要具备行业Knowhow的解决方案提供商入局,包括咨询公司、以及深耕行业的ISV与SI等行业数据伙伴为数字员工平台企业外部必备的行业数据,为数字员工的训练和培养提供基础要素数字员工平台生态数字员工市场的发展将吸引更多的技术创新者和创业者加入,推动数字员工技术的不断进步。新的算法、模型、技术和工具将不断涌现,提高数字员工的智能水平、性能和可靠性。同时,伴随数字员工市场分工越来越细化,围绕垂直领域多样化、精细化的应用需求,将会融入更多类型企业进入数字员工平台生态当中。13激发科技与创新活力2024/9/24趋势6:利用企业专业有数据形成深度洞察与策略是企业未来经营差异化的重要关键通用大模型在实现AI技术普惠的基础上,也会带来企业核心竞争力的变化和调整,企业的核心竞争力不再仅仅依赖于技术的先进性,差异化能力就主要体现在对于企业专有数据的挖掘和利用,以及数据驱动决策的企业文化和组织能力升级等方面。相应地,企业也将愈发重视专有数据能力和资源的建设和积累。产品 营销 运营激发更高质量的用户数据010302产品 营销 运营更高质量企业专有数据更好的模型质量与经营策略l 差异化竞争在激烈的市场竞争中,企业专有数据可以帮助企业实现差异化竞争。与竞争对手相比,企业通过对自身特有的数据进行分析和挖掘,可以发现独特的市场机会、客户需求和业务模式,从而制定出更具针对性和创新性的营销策略和产品服务,使企业在市场中脱颖而出。l 建立壁垒企业专有数据可以成为企业的重要资产,为企业建立起竞争壁垒。随着数据的积累和分析能力的提升,企业对市场和客户的理解会更加深入,这种深度理解是竞争对手难以复制的。同时,企业可以利用专有数据不断优化产品和服务,提高客户满意度和忠诚度,进一步巩固竞争优势。14激发科技与创新活力2024/9/24趋势7:AI应用的深化将对企业的组织能力提出新的要求,企业需要打造适用于人机协同的组织管理体系从而适应未来的发展AI 技术发展迅速,新的算法、模型和应用不断涌现。企业需要紧跟技术发展的步伐,及时了解和掌握最新的 AI 技术,以便将其应用到业务中。同时,AI 应用的深化为企业带来了新的业务机会,同时也带来了新的挑战。核心方向就是AI 技术的应用往往会对企业的业务流程产生重大影响,需要企业进行业务流程的重塑。这些业务模式需要企业具备新的组织能力和业务流程来支持。企业需要重新审视自己的业务模式,调整组织结构和业务流程,以适应新的业务需求。相应地,企业需要在技术、业务、人才和组织文化等方面进行全面的变革和提升,以适应 AI 时代的发展要求。AI 应用的深化需要企业建立完善的数据收集、存储、管理和分析体系,确保数据的准确性、完整性和可用性。数据驱动的决策能力还要求企业培养员工的数据素养,使他们能够理解和运用数据进行决策。快 速 适 应 变 化 的 能 力AI 技术的发展速度非常快,新的算法、模型和应用不断涌现。企业需要具备快速适应这些变化的能力,及时调整战略和业务模式,以充分利用 AI 带来的机遇。数 据 驱 动 的 决 策 能 力创 新 能 力AI 技术为企业带来了新的创新机遇,但也要求企业具备相应的创新能力。企业需要鼓励员工提出新的想法和创意,并为他们提供创新的环境和资源。AI时代企业组织能力升级明确人机分工与协作模式培养人机协同的企业文化氛围优化组织架构与流程15激发科技与创新活力2024/9/24趋势8:群体智能与组织孪生纵深,加速数实融合与元宇宙落地岗位孪生企业/组织孪生世界孪生物理世界原子实体逻辑数字世界比特模型软件交互反馈架构企业生态数字员工应用场景0317激发科技与创新活力2024/9/24010203040506大模型所加速的生成式人工智能已经渗透到多个场景文本代码图像音视频3D分子发现对话/问答文档/文本/文案生成内容/会议摘要等语言翻译文学/剧本创作等自然语言生成代码代码补齐生成SQL生成软件测试用例合成数据等图像分类/分割工业设计医学影像标注与解剖结果构建艺术/商业作品创作图像修复天文观测、卫星遥感观测等电影/游戏/动画制作建筑/家居设计工业制造工业/艺术设计医疗健康虚拟现实等信息播报语音编辑/翻译影视内容分析编辑视频增强/风格迁移音乐/视频生成药物设计材料科学食品与农业能源个人护理等18激发科技与创新活力2024/9/24AI驱动千行百业效率升级,大量行业场景应用价值仍待深挖产品研发/设计生产制造供应链/资源管理市场/营销用户/客户运营组织协同软件工程农业能源化工/机械先进制造食品饮料服装/服饰家电汽车建筑与房地产交通运输金融教育医疗健康零售商贸文化娱乐餐饮旅游政府行业环节AI赋能效率升级程度0100深入行业关键环节的AI价值渗透度易观分析19激发科技与创新活力2024/9/24Agent应用图谱代码 测试办公财税营销 客服数据分析人力资源金融文娱教育 公用事业制造 能源医疗消费/电商平台类Agent行业解决方案类型Agent功能类型Agent企业自建平台金山Copilot Pro数字员工AI Agent钉钉AI助理支小助小浦智汇、智读、弘小助游戏Copilot队友AI Agent数字员工商家智能助手AYAYI数字员工小沪小华AI程序员CopilotChatDEVTableAgentCopilotAI数据分析师AI管理助手/数字员工BPai智能财税法咨询2B Agent开发平台通用Agent平台RPA平台AI PaaS文心AgentBuilder20激发科技与创新活力2024/9/24制造行业AI应用价值与场景质量管控/生产工艺优化仓储配送市场营销销售管理供应链管理物流管理设备管理/预测性设备维护事故预警需求预测客户服务产品辅助设计代码辅助赋能工业软件升级智能评审与反馈数字孪生/仿真优化生产流程生产计划/智能排产核心价值应用场景研究范围与零售行业相对应,该部分为制造行业AI应用重点研究部分以零售行业AI应用研究为主提升工程仿真精度,提升设计与研发效率强化工业机器人信息处理、感知执行等能力,提升智能化生产能力与质量提升工业企业经营管理工作效率,探索用户中心经营模式关键环节运营管理产品设计生产制造21激发科技与创新活力2024/9/24制造行业AI应用图谱产品设计产品辅助设计虚拟工厂生产制造柔性制造设备预测性维护机器人制造生产运营优化智能仓储管理工业云平台工业互联网平台工业质检易观分析注释:图谱中企业仅为示例,未穷举,且排名不分先后,如有不当之处请指正中国工业制造行业AI应用图谱22激发科技与创新活力2024/9/24制造行业AI应用关键挑战模型应用可靠性挑战工业领域,尤其是生产制造流程,最重视安全、可靠和稳定,相应地,工业制造领域最核心需要保障应用的可靠性,这就对人工智能模型,包括大模型提出了更高的要求。应用成本挑战从大模型驱动的AI应用方面,应用成本需要大幅度降低,目前定制化千亿参数通用大模型的成本难以被客户接受;算力成本仍然高居不下,训练卡价格仍然在上升。未来考虑到未来LLM不断升级,训练推理成本或将持续上行;相应地,垂类大模型能够达到参数量、效果、成本和场景的匹配,此外,模型蒸馏压缩、采用MoE架构,小样本微调等技术路径也能够有效降低成本,加速落地。行业Knowhow与数据资源挑战与其他行业不同,工业场景相对来说数据样本量较小,AI训练相对困难,相应地,工业数字孪生可以通过仿真的形式生成大量数据,帮助AI模型深度优化,同时,也仍然需要制造企业强化自身数据积累与沉淀,从而提升AI应用现实可行性。23激发科技与创新活力2024/9/24趋势1:工业级场景需求升级,带动计算机视觉、工业知识图谱、工业数字孪生、群体智能等关键技术向多元化场景纵深发展说明:部分研究成果节选自易观&海尔卡奥斯中国工业互联网技术发展年度趋势图:制造业数字孪生市场AMC曲线计算机视觉趋向高精度、标准化方向发展AI将加速驱动工业知识图谱全生命周期融合应用工业数字孪生技术推动数字技术在制造业规模化应用 随着工业应用场景覆盖广度和深度的提升,更多潜在的价值场景机会会被发掘出来,驱动计算机视觉技术能力向高精度、标准化方向继续精进发展,帮助企业实现自动化检测、质量控制、安全监控和精细化生产等方面的智能化升级。群体智能成为AI在工业领域应用的下一个突破性方向 AI驱动加速企业知识图谱构建,包括各类文献、专利信息、技术标准等专业知识,并向工业生产链条的多环节快速渗透,帮助企业整合和利用各种生产数据、设备数据、质量数据等专业知识,提供生产优化和质量控制决策支持。群体智能技术将更多被业界讨论,并开始融入制造业数字化转型的技术攻坚进程。多个智能设备或系统将通过分布式、去中心化、自组织的方式,开展实时协作控制、故障检测、自修复任务等,协同完成复杂任务或解决复杂问题。企业基于工业数字孪生底座得以有效构建起工业仿真系统,进而在系统中规模化试验诸多数字技术,提升工业数字孪生系统面的复杂经营环境的可用性,从而规模化支撑数字技术落地。当前制造业数字孪生处于市场启动期,易观分析预测到2025年,体量较大的制造企业基本实现数字孪生体系构建,并通过数字孪生系统大幅提高生产效率和资源利用率。在供给侧,数字孪生智能制造所需的工业软件能满足一半的国内市场需求,且竞争力显著提升。24激发科技与创新活力2024/9/24趋势2:大模型为工业智能注入认知理解能力,将柔性融入制造流程,成为工厂智能中枢大模型的出现为工业智能注入了更为强大的认知能力,将能够深入理解适应不同的生产环境和工厂特点,实现AI与传统工业设备的高度契合。通过全面理解从生产流程到设备状态的各类应用场景,提供智能化的监控和调度能力。柔性融合更加突显了大模型对原有智能制造场景的适应性和灵活性,为制造业的持续创新提供了可能。数字化、网络化、智能化最低要求揭榜挂帅任务目标直接贡献度度图:中国智能制造典型场景要求-收益矩阵收益维度成本维度AVGAVG工厂数字化设计工厂数字化设计数字孪生工厂建设数字孪生工厂建设产品数字化研发与设计产品数字化研发与设计虚拟实验与调试虚拟实验与调试数据驱动产品设计优化数据驱动产品设计优化工艺数字化设计工艺数字化设计可制造性设计可制造性设计生产计划优化生产计划优化车间智能排产车间智能排产资源动态配置资源动态配置精益生产管理精益生产管理先进过程控制先进过程控制工艺动态优化工艺动态优化产线柔性配置产线柔性配置智能协同作业智能协同作业智能在线检测智能在线检测质量精准追溯质量精准追溯产品质量优化产品质量优化在线运行监测在线运行监测设备故障诊断与预测设备故障诊断与预测设备运行优化设备运行优化智能仓储智能仓储精准配送精准配送安全风险实时监测与应急处置安全风险实时监测与应急处置危险作业自动化危险作业自动化能耗数据监测能耗数据监测能效平衡优化能效平衡优化碳资产管理碳资产管理污染监测与管控污染监测与管控废弃物处置与再利用废弃物处置与再利用市场快速分析预测市场快速分析预测销售驱动业务优化销售驱动业务优化主动客户服务主动客户服务产品远程运维产品远程运维采购策略优化采购策略优化供应链可视化供应链可视化物流实时监测与优化物流实时监测与优化供应链风险预警与弹性管供应链风险预警与弹性管控控数字基础设施集成数字基础设施集成数据治理与流通数据治理与流通工业知识软工业知识软网络协同制造网络协同制造大规模个性化定制大规模个性化定制人机协同制造人机协同制造数据驱动服务数据驱动服务来源:易观分析&海尔卡奥斯联合分析整理基于成本与收益维度的因素考量,大模型的落地应用应结合智能制造典型场景收益矩阵,合理规划实施路径。优先建设场景支撑建设场景重点建设场景长期建设场景 以生产场景为主,对智能化要求相对较高,需要对工业机理有较好的沉淀,建议优先考虑建设相关场景。大模型在这类场景中可优化生产过程,进一步降低成本提高整体收益。场景分布较广,对网络化要求相对较高,可根据传统制造模式进行小步迭代,分散成本。大模型的应用有望提高供应链灵活性,优化库存管理,在质量控制方面提升产品一致性。以生产与端到端场景为主,对数字化、网络化、智能化要求均较高,需要其他场景的深度沉淀与反馈方可实现有效建设,但收效巨大。大模型可驱动端到端智能生产与协同,提高整体生产效率,实现可观的收益增长。场景分布较广,对数字化要求相对较高,与其他场景建设存在依存关系,在不同行业间有较强的迁移性。引入大模型能力可强化数据分析,提升迁移性,为企业长期发展提供战略性支持。25激发科技与创新活力2024/9/24趋势3:AI与工业大数据双向驱动将全面释放价值,成为智能制造升级关键推动力工业大数据的高度复杂性成为传统数据技术应用于制造行业的难点,AI技术凭借其擅长处理复杂但具备结构性数据的特点,为工业企业带来了新机遇。AI通过挖掘分析工业大数据中的潜在关联和模式,将数据转化为实质性的智能决策和洞察,提供更准确实时的数据分析、决策支持、需求预测等关键能力,帮助企业更好地规划生产计划、优化库存管理等,实现降本增效,提升工业智能化水平。相应地,工业大数据也将成为工业企业构建AI可用的数据体系、打造工业大模型的关键支撑。说明:部分研究成果节选自易观&海尔卡奥斯中国工业互联网技术发展年度趋势供给侧需求侧产业互联网的发展将用户、员工、设备、环境以及产业链上下游等元素紧密联系起来,使得数据生产量指数级增加,为工业企业创造了丰富的数据资源。这些数据亟待被有效沉淀、处理和应用。AIGC为代表的新一代人工智能技术处于爆发期,但其在工业的落地和价值创造,亟需高质量、结构化的数据支撑。这些都让工业大数据的意义超越以往任何时期。构建智能决策的数据基础智能化生产应用与资源优化构建形成AI可用的数据体系实时数据分析与决策支持需求个性化与定制需求质量管理与安全性需求灵活的产能与库存管理需求研发数据域生产数据域运维数据域管理数据域外部数据域研发设计数据开发测试数据控制信息工况状态工艺参数系统日志物流数据产品售后服务数据系统设备资产信息客户与产品信息产品供应链数据业务统计数据与其他主体共享的数据图:工业企业工业数据分类维度参考26激发科技与创新活力2024/9/24趋势4:生成式AI的应用将为工业知识沉淀和传承提供有力支持生成式AI通过将大量的工业数据、技术文档和专家经验整合,可构建更为智能高效的知识管理体系,这将支持企业有效沉淀和传承核心领域的工业知识,不仅能为工厂提供实时指导和支持,还有助于应对人才流失和知识断层问题,使制造行业在工业知识管理和传承方面实现更加智能、可持续的发展方式。智能化知识沉淀快速分析理解工业数据和技术文档,提炼、整合并归纳核心领域知识。使企业能够更迅速、更全面地将实践经验和专业知识转化为数字化智能知识库。实时指导与支持工业知识与经验传承可持续可视化与协同工作通过生成式AI构建的智能知识体系,优化知识管理与迭代,可实现对生产过程实时监测和指导,根据当前生产状况提供实时建议与支持。工业知识与经验的传承从“老带新”的传统模式转向通过智能系统持续稳定地获取专业指导,保持业务连续性,降低人才流失和知识断层对生产过程的不利影响。支持知识可视化呈现,使得复杂的工业知识更易于理解和分享。同时,能够推动生产协同,促进知识的共享和协同决策。工业知识的智能抽取与整合:制造业常常涉及复杂的生产流程和技术要求,生成式AI能够智能抽取和整合庞大的工业数据、技术文档以及专家经验,提炼关键的工艺知识,形成更为精细、实用、结构化的知识体系。能够支持企业对于复杂工业知识的智能化沉淀,减少信息碎片化和不易获取的问题。工业知识的实时更新与迭代学习:制造业不同生产环境的要求与变化较多,生成式AI的自主学习迭代能力能够更好地适应多变性,可以根据最新的产业动态、技术发展,不断学习新的工业标准、生产要求和技术创新,及时更新企业知识库。个性化学习路径与培训路径构建:生成式AI能够根据个体员工的职能和生产线需求,提供个性化的学习路径。不仅能够提高员工的学习效率,还可更针对性地满足了制造业复杂多样的技术培训需求,使员工更好地适应特定工作场景。27激发科技与创新活力2024/9/24零售行业AI应用价值与场景产品设计生产制造供应链管理市场营销用户运营主要环节核心价值激发创造力,提升产品创新智能供应链管理,降本增效提升用户体验,实现长期价值智能设计/产品辅助设计数字孪生/仿真优化生产流程仓储与商品库存管理AI辅助营销/广告生产计划/智能排产质量检测物流规划个性化营销/智能导购智能客服/AI外呼数字人直播智能选址无人零售/智能门店等(包含智能商品识别等)狭义零售范围内,包括百货、超市、便利店、电商等零售业态,在这个范围内,AI应用场景主要覆盖上述环节,核心价值在于提升用户体验,并以用户为中心链接品牌企业与用户,实施供应链管理优化等举措。本次分析,将侧重这几个环节,聚焦供应链管理、市场营销与用户运营部分,并针对其中主要场景进行分析。在品牌企业逐步建立D2C通道,并形成全渠道运营与增长战略的背景下,AI赋能也进一步向上延伸,从需求端向供给端倒逼,形成产品设计的升级与生产流程的优化等,更多制造环节未来也将在C2B趋势之下纳入用户旅程当中一并考虑,研产供销服未来都将围绕用户这一中心挖掘价值。重要场景研究范围28激发科技与创新活力2024/9/24零售行业AI应用图谱供应链管理市场营销用户运营零售行业数智化解决方案仓储与商品库存管理物流规划与应用AI辅助营销/广告无人零售/门店管理智能客服用户运营数字人/直播AI商拍易观分析中国零售行业AI应用图谱注释:图谱中企业仅为示例,未穷举,且排名不分先后,如有不当之处请指正29激发科技与创新活力2024/9/24零售行业AI应用关键挑战零售行业企业数字化基础能力挑战企业需要具备数据基础,或者具备数据沉淀能力。一方面,不同品类、品牌与商品,都具备相当专业的背景知识与信息,即便AI应用与大模型具备基础能力,但仍然需要企业提供优质数据进行训练,从而达到预期中的与用户进行良好对话与互动的能力;另外,企业应用AI进行销量分析与经营决策,则更依赖于高质量数据,以及在业务与SKU丰富多变的情况下,实现模型的动态应对等。数据连接挑战AI应用的基础是数据沉淀和实时分析,但是零售行业仍然面临产业环节众多,各个环节之间存在数据壁垒的问题,相应地,这在一定程度上阻碍了数据的应用,并进而影响了AI应用落地的效果。利润低,ROI测算需要更加明晰方能进一步落地零售行业注重利润率,对于技术应用的探索虽然秉承开放态度,但是极度关注其ROI的测算,相应地,AI应用也需要寻求点状突破逐步验证其价值。30激发科技与创新活力2024/9/24趋势1:零售行业AI应用将由点及面全面铺开,数据驱动重塑零售价值链AI应用将由点及面全面铺开,一方面全业态,全业态增加AI应用,形成数据触点与链接;另一方面,将渗透零售产业链各个环节,相应地,持续进行数据互联互通,形成良好地AI应用基础将变得愈发重要。3-用户参与/个性化定制消费者按需选择产品参数甚至参与产品部分设计,实现确定性生产,降低市场风险2-大数据支撑研发对消费者产生的大数据分析把握预测市场需求和痛点,调整优化产品设计研发1-共建敏捷供应链大数据分析预测,引导原材料采购、排产计划、库存安排、生产执行6-行为数据/用户画像对消费者的行为、购买、评价等多维度数据综合,得到用户清晰画像,细分群体精细化运营5-多场景融合/全链路营销新零售平台创新设计体验场景、融合多种业态和服务,全渠道布局、内容营销等触达消费者传统模式下商品设计到零售链条研发设计采购&生产制造品牌商物流流通零售平台消费者1235644-数字化运营/智能作业对接前端零售、仓储和物流数据,实现统一智能调度仓配,预测和规划分仓及配送路径等31激发科技与创新活力2024/9/24趋势2:线上线下界限消弭,全渠道策略与数智基础设施完善推动本地零售加速复苏,即时零售成试金石京东到家、美团、饿了么等即时零售平台推动的“本地门店 即时配送”的即时零售服务模式正在高速发展,预计到2024年,整个即时零售市场交易规模将突破万亿水平。这个万亿市场规模的背后,在消费者即时消费需求的提升,以及品牌/零售企业借助全渠道策略撬动门店经营效率的考虑之外,更需要看到数智技术对于零售企业以及线下实体产业的赋能进一步加深,赋能零售企业拓宽销售通路,提高供应链管理能力以及履约效率是即时零售能够高速发展更重要的基石。以即时零售为试金石,将全面开启服务零售数智化增长时代。商品供应链即时零售平台/渠道即时零售用户即时零售产业图谱连锁商超便利店品类/品牌专卖店服务商/经销商小店/散店即时零售基础设施&能力平台模式垂直模式自营模式仓配物流即时配送运力1,707.0 2,733.0 3,611.0 5,946.0 85041156014823187992207725677301293566860.12.1d.7C.05.9(.2&.8.4.3.3.4%0 0Pp,00010,00015,00020,00025,00030,00035,00040,00020192020202120222023F2024F2025F2026F2027F2028F2029F2030F2019年-2030年中国即时零售交易规模即时零售市场规模(亿元)增长率数据来源:2023即时零售发展趋势白皮书,易观分析整理易观分析精准选品/选址能力LBS精准定位能力精准营销/推送能力履约适配能力智慧物流智能设备32激发科技与创新活力2024/9/24趋势3:大型零售企业/平台,将成为零售产业生态数智化升级的核心,电商平台竞争进化大型零售企业/平台,将成为产业生态的核心,具备优质数据资源与资产,聚拢用户运营与价值增长的生态运营策略与落地手段,带动相应品类与行业的整体升级与数智化增长,对于零售行业而言,这意味着零售入口潜在的变化,同时,对于品牌企业而言,也需要形成以自身品类与产业链主思维的经营发展策略,从而在大平台生态体系下构建自身的核心优势。原料供应研发设计产品生产品牌营销渠道分销仓储物流终端零售服务售后12345678全渠道消费者运营沉淀09全渠道订单与履约分发协同10供应链产业生态协同11支持链赋能业务链赋能成本集约效率升级工具开发与数智技术输出资源整合与生态运营业务经营与增长赋能价值创新与商业模式引领平台数字化赋能能力33激发科技与创新活力2024/9/24金融行业AI应用价值与场景产品研发运营与资产管理合规风控市场营销用户运营降本增效,释放人力资源进入高价值环节激活数据要素,促进金融普惠赋能场景创新,提升千人千面的服务能力代码助手智能办公/智慧运营智能风控 智能投研数据资产管理与分析反欺诈/反洗钱智能客服/AI外呼 智能投顾 智能理赔财富管理 智能销售 智能营销信贷审核 信贷业务智能审核放款以金融内部场景为主,本次研究着眼于优化内部流程、提高效率以及确保合规风险的有效管理。分析AI技术如何通过提供智能支持,进行智能数据分析,优化资产配置、风险管理和运营策略,提高决策的精准性。小微企业信用数据获取外部场景聚焦于金融机构与客户直接互动的关键环节,强调了金融机构在提升客户体验、个性化服务和市场拓展方面的核心诉求。本次研究通过分析AI技术在上述场景下的数据分析、客户行为分析、需求预测、个性化交互等能力,探讨如何形成优质、个性化的金融服务体验,提升差异化竞争力。34激发科技与创新活力2024/9/24金融行业AI应用图谱金融智能业务赋能金融大模型金融整体解决方案智能投顾智能风控智能理赔智能投研营销与销售客户服务易观分析注释:图谱中企业仅为示例,未穷举,且排名不分先后,如有不当之处请指正中国金融行业AI应用图谱35激发科技与创新活力2024/9/24金融行业AI应用关键挑战数据治理挑战尽管一些金融机构的数据治理工作已取得了阶段性成果,但行业整体的数据治理、数据资产化进程仍处于初期阶段。随着生成式AI、大模型逐步在金融领域落地应用,未来AI训练更加依赖于大量高质量的金融数据,而目前金融系统多、数据散乱的问题依然存在。数据的可靠性和建立可持续的数据战略仍然是一项极具挑战的任务。成本投入挑战金融行业对于数据安全的高要求使得AI部署通常以定制化项目为主,这也造成了在开发、更新维护等方面成本重复投入的问题,削减了资源利用率,特别是对于中小金融机构而言,当前AI的投入成本仍然较高,并且主要受到定制化需求、安全合规性要求和对高技术人才要求的影响,限制了其广泛应用。组织协调挑战AI智能应用逐步渗透组织链条,金融机构需要重新审视组织机制和业务规则,组织机制的设计必须更加灵活和适应变化,以更好地支持AI的融入,需要考量传统的层级结构和决策流程的调整。引入AI后,金融机构内部面临着人机协作、部门协作中对责任的解释、分担和认定等问题的挑战,AI在决策和执行中的智能化可能使得追溯和解释变得更为复杂。36激发科技与创新活力2024/9/24趋势1:业务驱动金融大模型与AI底座的结合,将投射形成垂直场景下原子能力,在场景中得到验证大规模数据基础大模型金融行业大模型预训练(2)开源 微调(3)API 向量库增量训练(1)端到端自主训练通用场景专业场景下游任务能力抽取对话问答、文字识别、内容生成、语义理解、逻辑推理、图像分割客服、营销、产研、风控、投研、投教、核保理赔、内控合规大规模数据集构建基础大模型预训练行业大模型微调场景智能应用API接入与向量化处理 结合金融机构自身专有数据、知识的增量训练和微调 AI对齐 接入API调用基础大模型能力,利用数据标注、向量数据库等方式检索领域知识 行业/场景的下游任务能力抽取,依托AI底座调用,形成适配性强的企业级应用 海量未标注的无结构数据、通用领域知识等构建基础数据集AI能力平台场景赋能AI能力平台调度模型调用 基于数据集的自监督预训练,使其具备基础能力 面向金融场景输出服务能力,沉淀数据和客户反馈,持续提升模型精准度近年来政策导向加大数智技术扶持鼓励创新、治理规范进一步完善,未来在合规的框架下进行创新尝试,有助于保障金融稳定和推动行业可持续发展,也将是未来人工智能应用于金融行业的主基调。大模型在深入金融行业的过程中,进入专业场景需要具备大量行业知识,即使是通用场景和环节,也需要与金融行业实际情况进行适配,因此基础大模型将会投射成垂直领域内下游模型,通过AI能力平台集中调度,形成具体解决场景下游任务的能力,才能真正成为生产力工具。37激发科技与创新活力2024/9/24趋势2:知识战略与数据战略并重升级基础能力,成为金融行业下一阶段技术能力分化的核心数据知识行动数据战略知识战略智能战略数字化智能化跨越知识鸿沟生成式AI能力的引入一方面能够加速金融领域知识的生产和更新,使金融行业能够更快速地应对市场和客户需求的动态变化,丰富内外部应用场景的智能化水平;另一方面,将生成式AI具有的隐性知识和推理能力,与金融知识库显性知识进行的有效融合,传统金融知识体系的学习门槛、学习效率都将得到改善,客户的交互体验、员工的工作和学习模式也将迎来显著改变。在这个过程中,在数据战略基础上同样考量知识战略的搭建与落地,升级基础能力,从而能够以“知识”为抓手形成从数字化到智能化的跨越。图:金融行业“大模型 ”技术能力建设38激发科技与创新活力2024/9/24趋势3:金融AI原生应用作为新质生产力工具大量涌现,提供全生命周期的高质量金融服务升级用户体验通过人机交互方式的变革,实现多轮对话与KYC,提升对话与服务体验;通过与数字人相结合,实现虚拟场景的温度服务。优化内容生产创意与效率营销主题与AIGC相结合,在自动化生成营销物料的同时,实现千人千面个性化营销。降本提效在投研、研发编程、授信审核以及流程管理等方面提高效率,减少基础人员投入。产品/业务创新通过在通用基础能力的AI底座中引入高级认知能力,整合碎片知识与多样化需求,形成创新的产品化模型与业务解决方案。金融行业的服务需求走向更加细分、专业化的场景,基于金融大模型的基础能力,将能够深入理解和探查用户需求和行为,从而催生出大量高度灵活的AI原生应用,在营销推荐、投资建议等方面为客户提供更为精细和个性化的服务。金融AI原生应用是在设计、开发、部署、运营和维护整个生命周期中,将AI作为整个应用的核心,构建实现更高效、智能、安全的服务与支持。研发设计部署应用更新迭代个性化需求设计:根据用户的历史行为和偏好,设计出更符合其需求的金融服务。金融产品创新力:基于对市场行情趋势和客户反馈的分析,寻找特征与特征,辅助进行创新性的金融产品设计。保险、投资组合等产品定制化设计提高服务水平:通过自动化处理和实时分析,加快金融服务流程以更效率、更智能的方式执行。精准决策支持:提供多模态数据分析和智能决策支持,辅助进行智能化决策。风险评估与预警、个性化智能推荐持续升级服务:通过学习更新数据和用户反馈,不断改进和升级金融服务,放大数据价值。降低维护成本:自动化维护过程,降低人力成本,提高系统的可维护性。模型自动优化、用户数据收集与反馈39激发科技与创新活力2024/9/24泛互行业AI应用概述:提升内容产业工业化水平,释放内容生产者效能人工智能在影视娱乐,以及游戏等行业具备广泛的应用场景,核心主线在于内容生产力的释放与升级方面。一方面,整体提升娱乐产业工业化水平,形成AI赋能全流程的工业化生产体系;另一方面,释放内容生产者效能,专注于创意与情感共鸣等方面的方向。具体应用价值如下:提升内容生产效率辅助创意个性化内容生产,创新用户交互用户共创是娱乐行业内容生产的重要组成部分,赋能各种类型普通用户能够低门槛高质量地生产内容,可以大幅度提升用户参与的创作热情与体验,从而形成海量内容资产;同时,也可以从中发掘优秀的内容创作者,形成梯队化内容生态发展与建设赋能娱乐产业-PGC机构赋能娱乐产业-UGC游戏影视/动漫音乐游戏美术是AI落地,提升内容生产效率最为显著的部分,包括生成2D/3D任务、场景等资产;同时,在游戏剧情任务策划以及文本方面也发挥重要作用在MOBA、竞速、棋牌等品类方面,AI Bot用于对局陪伴等;在MMO、RPG等品类方面,通过智能NPC的应用,提升用户互动一方面,通过AI辅助编剧进行多样化剧情故事线设计,另一方面,生成创意素材提供概念灵感与方向等在影视,尤其是动画内容生产方面,通过虚拟制片、数字人、AIGC等综合运用,可以大幅度提升内容生产效率,压缩内容制作周期,控制内容生产成本目前主要是内容分发平台与用户交互方面发挥作用,包括内容精准推荐、以及内容观看交互互动等影视创作的核心故事主线与情感表达仍然需要人类编剧掌舵,但是在剧本创作、分镜故事版等方面,仍然可以为编剧提供灵感目前在音乐 的方向上,可以通过AI音乐生成,辅助各个场景下的用户进行背景音乐生成、音乐互动以及音乐伴侣等玩法目前在专业音乐内容生产方面,主要应用价值仍然为辅助音乐人进行AI曲谱生成,AI编曲以及各种音乐风格与乐器的探索式尝试,从而提升专业音乐制作人的内容生产效率降低内容创作门槛,大幅度提升内容质量与数量40激发科技与创新活力2024/9/24泛互行业AI应用概述:应用价值与场景策划与剧本创作游戏影视/动漫音乐影视拍摄后期制作虚拟制作3D数字资产换脸剪辑特效/音效IP与资产沉淀宣发&版权运营多模态生成赋能IP价值提升数字人IP数字人产品立项-策划内容生产智能运营与分析AI自动化投放营销素材自动化生成智能服务与互动用户数据沉淀内容资产沉淀市场分析品类分析概念设计美术生成(原画设计 2D美术 3D模型 地图)代码生成音频生成(音乐 对白)作词作曲后期编曲人声剧情/文案生成视频生成(动作 特效)画质修复提升内容生产效率辅助创意,探索内容创新边界个性化内容生产,创新用户交互核心价值细分行业与关键环节应用场景41激发科技与创新活力2024/9/24泛互行业AI应用图谱游戏游戏企业自主研发游戏行业AI解决方案影视/动画整体AI解决方案音乐c内容平台AI作曲/编曲游戏企业开放合作视频生成深空交响c内容制作公司AI歌手3D内容生成虚拟制片c策划与剧本创作数字人/虚拟偶像易观分析注释:图谱中企业仅为示例,未穷举,且排名不分先后,如有不当之处请指正中国泛互行业AI应用图谱42激发科技与创新活力2024/9/24泛互行业AI应用关键挑战多模态技术有待进一步突破AI技术在文娱领域的应用仍然处于辅助阶段,视频、3D等生成式AI技术仍然有待于进一步突破与迭代。例如,目前游戏企业通过AI辅助主要在解决2D美术成本与效率问题,AI对3D模型的完成度仍然有待于进一步提升,而3D在游戏行业美术成本当中大致占比超过50%比重,美术生产力仍然具备可观的提升空间边缘侧硬件要求有待升级文娱行业AI应用在提升专业内容生产效率之外,还有一个非常重要的方向是提升用户侧的文娱内容互动与体验,这对于以手机、音箱等为代表的边缘AI场景,提出了更高的要求,需要进一步分担云端算力的部分任务,并且能够保护用户隐私数据。版权以及后续的规范化应用等问题在文娱行业愈发突出以内容为核心的文娱产业,版权归属都是非常重要的关键要素之一,无论是AI应用的训练语料,还是生成式AI所生成的内容,都存在版权保护与数据保护的问题,以及后续生成内容的版权归属以及合规化使用等问题,此前,网信办公开征求意见,指出利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息,后续措施也有赖于进一步细化和明确。43激发科技与创新活力2024/9/24趋势1:多模态技术突破将加速泛互产业AI应用落地,AI Bot、音视频互动等应用对于算力需求发生变化,催生边缘AI需求多模态技术突破,并探索有效融入研发管线工作流多模态生成是目前文娱行业AI应用进一步落地的核心突破方向。视频生成、3D模型生成等技术有待于进一步完善,同时,多模态制作云化是产业发展必然趋势,下阶段视频制作的多端同步、多人在线协同创作需求将随之增加,生成式AI能力进一步融入视频制作全流程伴随文娱产业升级,以及千人千面个性化内容生态的发展,边缘算力需求激增,这一方面有赖于大模型企业不断进行模型优化,从而降低应用成本,更需要边缘侧增厚,增加存储和算力,终端设备具备运行小模型的能力边缘AI兴起,多场景AI应用进一步丰富0102030405020182019202020212022202320242025单位:亿台全球人工智能边缘设备出货量(按照设备类型)手机个人电脑/平板电脑汽车HMDs智能扬声器无人机消费类和企业级机器人安全摄像头数据来源:Tractica/Ovum,易观分析整理易观分析视频的高维数据空间属性使其研究更具挑战性。目前探索方向聚焦在高分辨率视频生成、针对超长文本的视频生成、生成无限时长的连贯视频等课题,并基于文生图模型的研究成果,将其引入视频生成模型对性能进行优化。一些研究专注细分场景的视频生成能力,以及结合多模态信息融合的训练方法,使模型更强的语言理解能力,也将改善视频训练数据不足的问题,在视频检索、视频分类等场景中具备很强的实用价值。3D模型方面,人工智能三维生成与传统三维生成工作流程的衔接性将更强,将有越来越多的模型采用逐级生成,每级生成内容均可于传统三维生成工作软件中查看与修改再返回模型的能力,提升人工智能三维生成在专业应用场景中的辅助作用。在此过程中,需要开源技术社区的大量贡献,也有可能与语言生成应用结合使用以增强自然语言对三维生成结果的操控性。44激发科技与创新活力2024/9/24趋势2:AI等数智技术整体提升内容生产机构工业化水平,推动内容产业竞争良性升级一方面,AI等数智技术的应用确实有助于推动整体内容行业的工业化水平,影视、游戏等内容研发的质量与效率普遍升级,头部机构与大厂在这方面的高资源投入竞争优势有所下滑,而中小机构则有突围而出的可能性。另一方面,对于AI等能力的驾驭,尤其是回溯到内容主赛道的文化素养以及风格导向将成为下一轮竞争的分水岭,头部机构与大厂在基础技术能力建设以及数据资产方面的优势更加明显,而中小机构则在后者维度上有望突围而出。IP开发/发行方IP多元化开发IP版权方优质IP储备平台方分发渠道用户IP内容消费影视制作公司游戏研发商线上:视频/短视频等平台线下:文旅/主题乐园等衍生渠道:IP授权经营动漫/音乐等制作平台进行IP版权采买平台自制进行分发与制作方合作制作,支付一次性制作费用 后期分成制作方采购版权发行合作创作者生态阅读平台内容分发IP开发模式:由IP开发/发行方进行IP开发筛选、IP内容生产,并在生产后寻求平台方进行发行合作;IP开发模式:平台方主导,围绕自身内容战略规划,进行IP筛选,并通过自制或者联合制作的是进行IP内容生产,目前这一方式比重在逐步增加其中,IP开发模式愈发重要,内容平台在IP开发当中的主动性地位显著增强平台企业成为文娱基础设施提供商赋能专业内容生产机构,提升其内容生产效率,推动行业升级数据资产沉淀,进行数据资产价值运营,未来具备入表价值文娱行业数智化需求旺盛,独立来看也具备业务发展空间创作者经济升级,个性化风格导向成竞争分水岭AIGC可以成为核心竞争力之一,但也有可能打掉此前部分创作者的海量高效的内容生产优势AIGC有可能带来海量同质化内容推向市场,充分发挥创意优势,并结合自身对于AI能力的驾驭,塑造独立内容产品风格将会愈发重要45激发科技与创新活力2024/9/24趋势3:AIGC赋能精品内容形成IP全生态开发布局,延长优质IP生命周期,提升商业价值贡献网络文学具备优质作家和作品储备,是未来IP长效经营的核心资源,其中,创作者生态是核心竞争力,保障优质IP生产;同时,也需要进行优质IP多元化开发,放大IP影响力,延长IP生命周期,从而实现IP价值经营;AIGC在IP多元化开发过程中,可以有效降低开发成本,提升开发效率,有助于IP全生态开发的加速和稳步铺开。IP衍生品开发与授权p文学作品p网络文学p影视剧综p游戏p动漫p衍生品p主题公园百亿规模千亿规模继续放大231.0 317.0 342.0 639.0 697.0 790.0 849.0 37.2%7.9.8%9.1.3%7.5%0P00010002017年2018年2019年2020年2021年2022年2023年F2017年-2023年文学IP改编市场规模文学IP改编市场规模(单位:亿元)同比变化209.8 239.6 265.7 506.5 551.4 626.8 670.8 7.5 36.4 59.2 74.6 77.9 81.1 84.4 35.8 45.2 51.3 76.4 88.4 111.4 122.8 0P0 17年2018年2019年2020年2021年2022年2023年F2017年-2023年中国文学IP改编方向市场结构影视剧移动游戏动漫12.3 14.9 35.9 109.7 81.6 65.7 97.4 20.81.0 5.8%-25.7%-19.5H.3%-50%0P00 0%004060801001202016年 2017年 2018年 2019年 2020年 2021年 2022年2016年-2022年中国数字阅读版权部分市场规模版权运营(单位:亿元人民币)同比变化IP源头IP内容开发IP商业化领域主要类别消费品服饰、零食、文具、日用品等潮流玩具手办、盲盒、卡牌等线下业态主题乐园、商业地产、剧本杀、主题餐饮等48555565673284477396411571357156114.4.2.6.3%-8.4$.7 .0.3.0%-20%-10%0 0008001200160020002015年2016年2017年2018年2019年2020年2021年2022年2023年2024年2015-2024年中国IP授权市场规模与增速(按零售价值计算)市场规模(单位:亿元)增长率数据来源:中国音像与数字出版协会,上市公司财报,泡泡玛特招股说明书等,以及易观分析测算所得数字员工的构建与实施0447激发科技与创新活力2024/9/24目前数字员工存在的弊端内容质量和准确性生成式AI的进步虽然显著,但是仍然不能实现100%的准确和完美无缺。在没有人工介入的情况下,AI可能会生成带有事实不准确、偏见的内容。这就意味着,AI可以辅助部分工作内容的生成,但是仍然需要人工介入,从而保障内容质量和准确性。0102隐私问题用户对于数据安全和隐私问题愈发重视,相应地,在AI应用的过程中不仅需要考虑企业自身的数据安全问题,更需要把握好个性化营销与服务和用户隐私边界的平衡,尊重用户对于数据隐私的诉求和权利。版权风险关于AI的法律法规仍然在建设和完善的过程中,相应地,一方面,生成式AI的训练数据集来源广泛并且复杂,有可能会无意间涉及到受版权保护的作品;另一方面,生成内容的版权归属有待于明确,否则可能引发与开发者、使用者之间的各种纠纷等等。0304工作流程调整以及人机协同重构AI工具需要与现有工作流程做好整合和适配,要么是融入到现有工作流,要么是在AI赋能之后,将原有工作流升级,这样才能提升AI工具的使用效率和效果,如果需要团队在不同系统和工具间来回切换,则有可能造成系统的使用率不足,事与愿违。同时,需要在升级后的工作体系和流程等方面,充分考虑人机协同关系的变化。48激发科技与创新活力2024/9/24数字员工如何启动和开展?以营销为例明确目标梳理流程工具选型场景测试持续度量团队上手123456明确营销目标,如提升流量,提升销量,提升转化率,甚至提高工作效率等等围绕用户旅程勾勒营销工作流程(workflow),识别其中可以自动化实现和智能化升级的部分。同时,也需要对当前营销工具和系统进行盘点和分析,从而定位和寻求下一步可行的升级方向盘点当前使用的营销系统与工具,考虑在当前工具上引入AI模块或者能力,还是单独采购AI工具,在选型的过程中,需要考虑功能、易用性、集成能力和成本等因素。同步需要评估企业目前所拥有的数据的质量、数量和可访问性,是否适合AI应用等选择优先级相对比较高的场景,进行AI应用的测试,通过目标KPI的设定以及一定的资源投入,评估AI应用的流程和效果,在测试之后,进行效果评估以及工作流程的梳理,从而形成下一步的行动计划,包括目标的合理修订、工作流程的调整等将AI工具或者能力融入工作流程,并实现工作流自动化之后,仍然需要实时监测运营过程和结果,持续复盘迭代生成AI能够独立生产内容以及部分营销工作流程,但仍需要人工监督以确保准确性、适当性和相关性,需要定期监控和调整以保持性能建构和培养团队的AI应用文化,进行必备技能的培训与团队能力的升级对于团队的定位和能力进行重新评估,并在有必要的情况下进行调整与优化,包括是否需要引入AI专家与人才,以及如何通过培训等方式提升现有团队AI应用的能力等,营造AI提效以及赋能的氛围与文化49激发科技与创新活力2024/9/24营销数字员工选型产品功能是否满足当前营销业务流程所要求的基本功能,以及是否能够根据公司现有的业务需求与流程进行工作流编排和重构0102产品易用性产品/平台具备友好的交互界面,能够用户无需专业技术技能,也可以快速上手,熟练操作AI能力产品/平台应该具有强大的AI能力,这可以包括数据飞轮带来的准确性和效率的提升,以及AI技术持续发展带来的能力升级等等0603整合能力产品/平台是否能够与当前业务应用的软件和工具进行集成和连通,从而简化营销团队操作流程,同时,也可以规避产生数据孤岛,或者造成数据导入/导出等额外工作成本有效评估初始投资与长期运营成本,尤其是在AI平台和应用的投入方面,可能存在初始的投入成本比较高的情况,需要考虑的是长期的营销效率提升和转化率收益,最终在成本和收益之间找到平衡0504可扩展性是否能够伴随业务的增长或者变化而扩展,提供更加丰富的功能模块或服务,支持更多的工作流程,以及处理更加海量的数据,未来也能够与新兴技术和平台相兼容,确保长期的技术领先性和适用性50激发科技与创新活力2024/9/24数字员工落地面临的现实挑战挑战挑战组织文化和管理方面可能需要升级成本和资源投入的预期和现实之间的平衡新增AI工具与现有系统是否可以集成与协同对于AI技术和能力的理解存在短板,缺乏AI专业人才企业数据基础建设不完善,缺乏高质量数据51激发科技与创新活力2024/9/24挑战1:企业数据基础建设不完善,缺乏高质量数据数据人才系统投入组织数据是数字员工落地的基础,例如,通过对于用户多元数据的分析和挖掘,对于用户的购买倾向和偏好进行预测,从而开展个性化营销等。相应地,就需要企业具备相对高质量的历史营销数据、社媒互动数据、用户行为和订单数据等等。目前许多企业在数据采集、流通和使用方面存在壁垒,导致数据价值无法充分释放。如营销和用户相关数据来源广泛且分散,数据格式不统一,不同部门使用不同软件系统来记录和存储数据,数据质量也有可能在历史沉淀过程中存在不准确、不完整等问题。相应地,这些都会给数字员工在企业的落地带来挑战。数据算法/模型结果输入输出52激发科技与创新活力2024/9/24挑战2:对于AI技术和能力的理解存在短板,缺乏AI专业人才数据人才系统投入组织部分企业管理者对 AI 技术的了解有限,可能不清楚 AI 在营销中的具体应用和潜力。这可能导致对 AI 项目的投资决策缺乏依据,或者对项目的期望不切实际。当前AI应用落地的门槛和上手尽管较过往有所提升,但是要想在实际应用的过程中,结合企业实际场景和需求,得到比较好的应用效果,仍然需要专业人才的介入,可能包括数据科学家、算法工程师等等,招聘和培养之类人才是一个比较大的挑战。同时,仍然有必要对现有员工进行AI技术的培训和教育,从而提高他们对AI工具的支持和熟练应用程度。010020030040020212022202320242025中国人工智能产业人才缺口10.2%年复合增长率数据来源:安永,中国ICT人才生态白皮书53激发科技与创新活力2024/9/24挑战3:新增AI工具与现有系统是否可以集成与协同数据人才系统投入组织企业通常已经拥有一系列的营销工具和系统,如营销自动化平台、数据分析工具等。引入新的 AI 工具时,需要考虑这些工具与现有系统的兼容性,包括数据格式、接口标准等。即使 AI 工具与现有系统成功集成,也需要确保它们能够协同工作,实现业务流程的优化和效率提升。这需要对业务流程进行深入分析和优化,以充分发挥 AI 工具的优势。如,AI 驱动的营销自动化工具可以与 CRM 系统协同工作,实现客户细分、个性化营销和销售线索管理等功能。但要实现这些功能,需要对两个系统进行有效的配置和整合,确保数据的流畅传递和业务流程的无缝衔接。节省时间打破数据孤岛提高数据准确性加快决策速度54激发科技与创新活力2024/9/24挑战4:成本和资源投入的预期和现实之间的平衡数据人才系统投入组织在预期范围内的成本通常包括数据采集、处理、存储等成本,AI技术工具/系统投资成本,必要的人力资源投入成本等。其中,AI技术工具/系统的初始投资可能相对比较高,投资回报需要拉长周期来衡量。更需要明确的是,AI领域的各项技术正在飞速发展,日新月异,同时,AI项目的性质也决定了这是一个持续迭代不断优化的长期战,做好投资回报的预期和资源投入计划,才更有可能稳步推荐AI营销项目的稳步落地。短期收益(18个月内)中期收益(18-36个月)长期收益(36个月 )提高效率:AI可以自动化许多任务,从而提高企业运营的效率 成本节约:通过自动化和优化流程,企业可以减少人力成本和其他相关成本 收入增长 客户满意度提升 竞争优势:AI技术的应用可以为企业带来竞争优势,尤其是在快速变化的市场中 增强决策:AI可以提供数据分析和洞察,帮助企业做出更明智的决策 创新业务和新产品开发:AI可以促进新产品和服务的开发,推动企业创新 市场领导地位:长期而言,AI可以帮助企业建立或巩固其在市场中的领导地位 可持续发展:AI有助于企业实现可持续发展目标,通过优化资源使用和减少环境影响55激发科技与创新活力2024/9/24挑战5:组织文化和管理方面可能需要升级数据人才系统投入组织企业内部的文化和观念可能会阻碍 AI 营销项目的实施。无论是管理团队是否对于AI类型项目具备合理预期,还是员工对于AI技术的理解和可能存在的顾虑等等,都有可能对AI营销项目的顺利实施造成负面影响。这需要通过一系列培训和教育来拉齐认知,打消意识层面的抵触情绪和不正确预期,也需要通过组织架构和流程调整,从机制上为AI营销乃至更大范围内的AI战略落地护航。同意,38%一般,38%不同意,24%我所在单位应用AI 会使我的收入下降完全没有,40%组织过,42%定期组织培训,13%要求全员学习,5%企业AI培训情况56G(7)I%0 0%我愿意AI成为我的下属我愿意AI成为我的同事我愿意AI成为我的领导员工与AI的协作关系同意一般不同意数据来源:2024人工智能与职场研究报告,中国人民大学、明略科技集团联合发布网址:客户热线:4006-010-231服务邮箱:易观分析l行业洞察l策略咨询l用户洞察l解决方案易观旗下专注数字化市场发展与趋势研究数字经济全景洞察易观分析金融行业数字用户同业对标易观千帆全场景私域用户运营易观方舟易观社群加入易观社群与行业伙伴一同交流
AI商业观察Vol.05MetaAI蓝图及启示智能小巨人科技出品智能小巨人科技出品 2024/08/19智能小巨人科技原创报告Meta的的AI战略蓝图战略蓝图NO.1Meta的的AI愿景:构建最受欢迎和最先进的人工智能产品和服务愿景:构建最受欢迎和最先进的人工智能产品和服务核心核心AI产品服务:产品服务:用庞大的推荐和排名基础设施驱动主要产品的参与度与货币化效率用庞大的推荐和排名基础设施驱动主要产品的参与度与货币化效率生成式生成式AI产品服务:产品服务:Meta AI助手,成为助手,成为“全世界人们可以自由使用的最智能的全世界人们可以自由使用的最智能的AI助手助手”AI Studio,每个创作者、每个企业专属,每个创作者、每个企业专属AI代理代理AI智能眼镜,每个人都想要的新型时尚计算设备智能眼镜,每个人都想要的新型时尚计算设备每个开发者都拥有一个最先进的开源模型来构建每个开发者都拥有一个最先进的开源模型来构建learn more智能小巨人科技原创报告,请务必阅读文末版权声明生成式生成式AI竞赛第一阵营中,竞赛第一阵营中,Meta的的AI战略与众不同、业绩惊喜,正在成为战略与众不同、业绩惊喜,正在成为AI界风向标界风向标公司大模型相关业务大模型研发公司大模型相关业务大模型研发/合作模式大模型商业模式合作模式大模型商业模式微软企业服务 云服务与顶尖大模型团队OpenAI深度绑定,同时云服务整合各类大模型用AI赋能Office等现有产品在云服务中:1)出售模型训练服务2)出售模型推理服务3)捆绑销售与大模型相关的云服务亚马逊云服务与顶尖大模型团队Anthropic深度绑定,同时云服务整合各类大模型谷歌消费者业务 云服务自研Gemini、Gemma等大模型,同时云服务整合各类大模型在消费者业务中广泛应用大模型降本增效Meta消费者业务自研Llama系列等大模型1)在消费者业务中广泛应用大模型降本增效2)在更智能模型的基础上推出杀手级消费者应用程序在生成式AI浪潮的竞争中,微软、亚马逊、谷歌、Meta已位居第一阵营:每家公司都有一个经得起严格基准测试的领先模型,并且投入巨额资本开支。2024年7月以来,Meta发布了迄今为止最大、最佳性能的开源大模型Llama3.1,并且在随后的财报季中“一枝独秀”AI驱动广泛的用户体验并带来业绩增长,推出Meta AI和AI Studio开局良好;与众不同的商业模式正在带来惊喜,大有成为AI界风向标的势头!智能小巨人科技原创报告,请务必阅读文末版权声明Meta的的AI战略蓝图:核心战略蓝图:核心AI产品服务提升参与度与货币化效率,生成式产品服务提升参与度与货币化效率,生成式AI产品服务成为行业标准产品服务成为行业标准Meta的的AI愿景构建最受欢迎和最先进的人工智能产品和服务愿景构建最受欢迎和最先进的人工智能产品和服务核心核心AI产品服务产品服务生成式生成式AI产品服务产品服务推荐与排名系统推荐与排名系统完整性系统完整性系统广告系统广告系统开源开源AI基础设施基础设施杀手级杀手级AI产品服务产品服务AI推荐与排名系统已经 广 泛 应 用 于Facebook,Instagram、Reels、广告产品、商业信息传递、安全审查及自动化等各方面,提升了用户参与度和货币化效率AI技术已经广泛应用于广告体系中,包括广告投放与排名、广告创意自动化、广告活动优化,以及AI辅助聊天等,为广告客户实现降本增效AI技术已经广泛应用于自动化安全审查流程、提高内容审核效率、检测异常行为等多个方面,提升了安全管理的效率和效果Meta AI助手:助手:目标是成为“全世界人们可以自由使用的最智能的AI助手”AI Studio:创建你的AI分身,为粉丝创造体验Ray-Ban Meta智能眼智能眼镜通过集成Meta AI,提供了一个强大的多模态AI平台Llama成为行业标准的途径是通过一代又一代地保持竞争力、效率和开放性使尽可能多的开发者和合作伙伴使用Llama,并积极建立合作伙伴关系,以便生态系统中的更多公司能够为他们的客户提供独特的功能智能小巨人科技原创报告,请务必阅读文末版权声明Meta的的AI推荐解决方案推荐解决方案大规模推荐系统的架构创新统一的生成式推荐开发通用推荐模型大规模推荐系统的架构创新统一的生成式推荐开发通用推荐模型传统的DLRMs模型在处理大规模、高基数特征和数十亿用户行为时面临扩展性挑战;Meta提出新架构HSTU处理大规模、非静态词汇,并利用推荐数据集的特点,在长序列上实现显著的速度提升。将推荐问题重新定义为序列转导任务,并在生成模型框架内解决,更有效地利用数据和计算资源。模型架构、扩展策略、大规模数据集上的表现、实际应用效果都表明,随着推荐系统模型规模的增加,效果通常会更好;因此Meta致力于开发通用推荐模型。Meta的的AI推荐和排名效果推荐和排名效果Facebook和和InstagramReels商业信息传递商业信息传递在Facebook的信息流中,约30%的帖子是由AI推荐系统提供的;在Instagram上,超过50%的用户看到的内容是由AI推荐的;AI推荐系统使得用户在Instagram上花费的时间增加了24%以上。AI推荐系统显著提升了Reels的用户参与度,Reels的货币化效率在Instagram上增长了30%,在Facebook上增长了40%以上。AI推荐系统支持商业信息传递,点击即发送信息广告达到了100亿美元的收入运行率。广告系统广告系统AI推荐系统通过提供更相关的广告,提高了广告商的投资回报率。Meta用庞大的推荐和排名基础设施驱动主要产品用庞大的推荐和排名基础设施驱动主要产品信息流、信息流、Reels、广告系统、完整性系统,提升参与度与货币化效率、广告系统、完整性系统,提升参与度与货币化效率模型的扩展性和效率模型的扩展性和效率实证表明,生成式推荐模型的质量随着训练计算量的增加而提高,遵循幂律关系;Meta的推荐模型在在线A/B测试中显示出显著的性能提升。数据来源:Meta2023年-2024年财报智能小巨人科技原创报告,请务必阅读文末版权声明广告投放与排名广告投放与排名Meta Lattice广告排名架构:广告排名架构:一种新的广告排名架构,允许运行更大、更复杂的模型,跨不同目标和界面进行泛化学习,取代了以往为特定目标和界面优化的小模型;提高效率,还改善了广告表现。AI驱动的广告建模:驱动的广告建模:用复杂建模技术改进广告投放,提高广告预测的准确性,提升用户展示相关性。广告创意自动化广告创意自动化生成式生成式AI工具:工具:提供了文本生成、图像扩展、背景生成等等多种生成式AI创意工具,帮助广告商快速创建多样化的广告创意。广告活动优化广告活动优化转化转化API和和AEM:通过转化API和AEM等功能,使广告商更容易连接他们的营销数据,并了解这些数据的影响,以便在更广泛的目标中使用。Advantage 套件:套件:包括Advantage Shopping、Advantage Catalogs、Advantage Creative、Advantage Audiences等工具,帮助自动化广告活动设置的各个方面,减轻工作负担并提高效率。AI辅助聊天辅助聊天AI辅助的聊天体验:辅助的聊天体验:在WhatsApp和Messenger上进行早期测试,以提供聊天中的会话支持,帮助销售商品和服务。商业信息传递的转化商业信息传递的转化API:广告商更好地了解WhatsApp和Messenger的价值,提高广告活动性能广告表现改进:广告表现改进:通过AI技术改进广告投放,使得广告更加相关,提高了广告商的投资回报率。自动化提高效率:自动化提高效率:通过AI驱动的工具自动化广告创建过程,减少了广告商的工作量,使得他们可以更专注于创意而非技术细节。创意多样化与提效:创意多样化与提效:生成式AI广告创意功能低成本地提升了广告的创意性和多样性,还帮助品牌以自身风格呈现广告内容。商业信息传递增长:商业信息传递增长:AI辅助聊天帮助广告商与消费者建立更深层次的互动,推动点击即发送信息广告持续增长。Meta的广告体系已广泛采用的广告体系已广泛采用AI技术,多维度增强广告营销效果技术,多维度增强广告营销效果AI技术带来的广告营销提效技术带来的广告营销提效Meta将将AI技术广泛应用于广告体系中技术广泛应用于广告体系中智能小巨人科技原创报告,请务必阅读文末版权声明Meta AI的目标是成为“全世界人们可以自由使用的最智能的全世界人们可以自由使用的最智能的AI助手助手”旨在通过自然语言处理技术,为用户提供便捷的信息查询、内容创作支持、以及多模态交互体验。Meta AI助手的核心技术基于Llama 3模型。集成搜索:集成搜索:整合了Bing和Google的实时搜索结果,根据用户需求选择最佳答案来源。图像生成:图像生成:提供加速的图像生成功能,用户输入时可实时生成高分辨率图像。智能助手:智能助手:例如为用户计划晚餐、解释复杂的概念等等。扩展多模态处理能力和个性化体验。扩展多模态处理能力和个性化体验。Meta AI助手目前处于非商业化阶段,但Meta预计将在未来几年内通过多种方式实现商业化,包括扩大商务消息传递、在人机交互中引入广告或付费内容,以及允许用户付费使用更大的AI模型和访问更多计算资源。社交平台集成:社交平台集成:Meta AI助手被集成到了Facebook、Instagram、WhatsApp和Messenger等平台中。智能眼镜集成智能眼镜集成:Meta AI还被集成到了Meta的智能眼镜中,使得用户可以通过眼镜与AI助手进行交互。独立网站入口:独立网站入口:还可以通过独立的网站meta.ai访问Meta AI。7产品定位产品定位关键特性关键特性入口场景入口场景商业化潜力商业化潜力生成式生成式AI产品:产品:Meta AI助手,目标是成为助手,目标是成为“全世界人们可以自由使用的最智能的全世界人们可以自由使用的最智能的AI助手助手”智能小巨人科技原创报告,请务必阅读文末版权声明物体识别与翻译物体识别与翻译Meta AI能够识别眼镜摄像头捕捉到的物体,并通过音频反馈给用户。它还能翻译眼镜摄像头捕捉到的文字内容,帮助用户理解不同语言的文本。照片标注与摘要照片标注与摘要Meta AI可以为眼镜拍摄的照片添加描述性的标签或摘要,类似于Microsoft和Google等公司的AI功能。多模态信息处理多模态信息处理Meta AI能够同时处理文本、图像和音频等多种类型的信息;例如,用户可以要求Meta AI根据一张照片的内容生成一段描述性的文本。情境感知情境感知 多模态AI能力使Meta AI能够理解和响应用户所处的环境和情境,与更加相关的服务关联。对话式交互对话式交互通过说“嘿Meta”启动Meta AIMeta AI可以执行多种任务,比如提供信息查询、控制眼镜的各种功能等应用场景应用场景Meta AI可以帮助用户在外出时获取信息,如识别植物种类、翻译街头标志等;它让用户可以自然而然地与眼镜互动,而不必取出手机多模态功能多模态功能Meta AI能够处理和理解来自眼镜摄像头的图像数据、麦克风捕捉的音频数据以及用户的语音命令雷朋眼镜雷朋眼镜MetaAI体验扩展中的多模态功能体验扩展中的多模态功能Ray-Ban Meta智能眼镜通过集成智能眼镜通过集成Meta AI,提供了一个强大的多模态,提供了一个强大的多模态AI平台,用户通过语音指令与眼镜互动,执行实用任务平台,用户通过语音指令与眼镜互动,执行实用任务智能小巨人科技原创报告,请务必阅读文末版权声明AI Studio是一个允许用户创建、分享和发现自定义AI角色的平台。它使用Llama 3.1模型构建,允许用户定制AI角色,包括个性、语气、头像和标语等,可应用于Instagram、Messenger、WhatsApp等平台。产品概述产品概述-个性化AI角色创建:可以创建定制化的AI角色。-自动回复:可以定制AI回复,并通过专业仪表板控制自动回复功能。-多模态交互:已经能够以文本、图像等形式互动。-AI角色展示:允许创建全新的AI角色,类似于Character.AI等平台。核心功能核心功能-创作者:帮助创作者提高与粉丝的互动效率,增加粉丝粘性。-企业:提供客户服务支持,帮助企业提高客户满意度。-普通用户:为用户提供娱乐和信息获取的新途径。用户价值用户价值-创作者和企业服务:为创作者和企业提供定制化的AI角色服务,提高互动效率。-AI角色市场:创建一个市场,让用户可以分享自己的AI角色,从而形成一个AI角色生态系统。-增值服务:如更高级别的AI模型访问权限、个性化定制等。商业化潜力商业化潜力生成式生成式AI产品:产品:Meta Studio,轻松创建个性化,轻松创建个性化AI角色,增强与粉丝和用户的互动,提高生产效率,并开拓新的内容形式角色,增强与粉丝和用户的互动,提高生产效率,并开拓新的内容形式LlamaMeta在2023年2月发布的大语言模型,有7B、13B、30B和65B四个参数量版本。由于模型开源且性能优异,Llama发布后迅速成为了开源社区中最受欢迎的大模型之一,以Llama为核心的生态圈也由此崛起。自从自从Meta发布发布Llama模型以来,它对全球模型以来,它对全球AI社区产生了深远的影响。作为一个开源的大语言模型,社区产生了深远的影响。作为一个开源的大语言模型,Llama不仅提供了一个强大的技术基础,还推动了全球范围内对不仅提供了一个强大的技术基础,还推动了全球范围内对AI技术的广泛采用和创新。技术的广泛采用和创新。Llama模型的开源策略被视为模型的开源策略被视为LLM时代的“安卓”,这意味着它提供了一个模块化和可自定义的平台,使研究人员和开发者能够根据自己的需要调整和优化模型。这种开放性极大地降低了进入门槛,使得从小型创业公司到大型企业都能够利用这一技术。时代的“安卓”,这意味着它提供了一个模块化和可自定义的平台,使研究人员和开发者能够根据自己的需要调整和优化模型。这种开放性极大地降低了进入门槛,使得从小型创业公司到大型企业都能够利用这一技术。Llama 2Meta在2023年7月发布了免费可商用版本 Llama 2,有7B、13B、34B和70B四个参数量版本,除了34B模型外均已开源。Llama 2将预训练的语料扩充到了2T token,并将模型的上下文长度翻倍到4,096。Llama 32024年4月,Meta正式发布了开源大模型 Llama 3,包括8B和70B两个参数量版本。Llama 3支持8K长文本,在预训练数据方面,使用了超过15T token的语料,在相同规模的大模型中取得了最优异的性能。Llama 3.12024年7月,Meta发布Llama3.1,共有8B、70B及405B三种版本,其中405B版本是目前最大的开源模型之一,在多项基准测试中超过了OpenAI的GPT-4o,与Claude 3.5 Sonnet等领先的闭源模型相媲美。Llama模型已历经模型已历经4轮迭代,基准测试表现媲美顶尖闭源模型轮迭代,基准测试表现媲美顶尖闭源模型智能小巨人科技原创报告,请务必阅读文末版权声明Meta的的AI愿景愿景“向前发展,一个主要目标将是构建最受欢迎和最先进的人工智能产品和服务。如果我们成功:每个使用我们服务的人都将拥有一个世界级的向前发展,一个主要目标将是构建最受欢迎和最先进的人工智能产品和服务。如果我们成功:每个使用我们服务的人都将拥有一个世界级的AI助手来帮助完成事情;每个创作者都将拥有一个他们的社区可以互动的助手来帮助完成事情;每个创作者都将拥有一个他们的社区可以互动的AI;每个企业都将拥有一个他们的客户可以与之交互以购买商品和获得支持的;每个企业都将拥有一个他们的客户可以与之交互以购买商品和获得支持的AI;每个开发者都将拥有一个最先进的开源模型来构建。我还认为每个人都会想要一类新的计算设备,让你可以无摩擦地与能够看到你所看和听到你所听的;每个开发者都将拥有一个最先进的开源模型来构建。我还认为每个人都会想要一类新的计算设备,让你可以无摩擦地与能够看到你所看和听到你所听的AI进行互动,比如智能眼镜。进行互动,比如智能眼镜。”智能小巨人科技原创报告,请务必阅读文末版权声明NO.2战略假设:战略假设:AI是产品服务的技术基础,更大的价值创造来自产品是产品服务的技术基础,更大的价值创造来自产品生态战略:构建开源生态创造供应链优势与技术领导者品牌生态战略:构建开源生态创造供应链优势与技术领导者品牌盈利模式:最具潜力的盈利机会来自核心产品服务的商业化扩展盈利模式:最具潜力的盈利机会来自核心产品服务的商业化扩展learn moreMeta的的AI商业模式商业模式智能小巨人科技原创报告,请务必阅读文末版权声明战略假设:战略假设:AI是产品服务的技术基础,更大的价值创造来自产品生态战略:构建开源生态创造供应链优势与技术领导者品牌盈利模式:最具潜力的盈利机会来自核心产品服务的商业化扩展是产品服务的技术基础,更大的价值创造来自产品生态战略:构建开源生态创造供应链优势与技术领导者品牌盈利模式:最具潜力的盈利机会来自核心产品服务的商业化扩展在更智能模型的基础上推出杀手级消费者产品服务。对于Meta而言,AI是产品服务的技术基础,价值创造来自面向消费者、创作者和企业的AI产品。市场定位市场定位Llama系列开源模型成为行业标准,并构建Llama为核心的开源AI生态,使Meta的AI技术栈持续领先,在AI创作者经济中保持内容优势,同时受益于众包创新和众包优化。生态定位生态定位长期以来Meta都是开源领域的领导者,通过建设开源生态维持技术供应链领先。围绕AI战略蓝图,Meta在算力、云服务、端侧AI、智能硬件等领域与全球顶级厂商建立深度合作关系。生态构建生态构建AI的商业化潜力中,Meta认为最明显的机会是企业AI的商业信息传递收入,此外,Meta AI的互动中可能引入广告和付费内容。盈利模式盈利模式Meta的的AI商业模式:在更智能模型的基础上推出杀手级消费者产品服务,构建开源生态创造供应链优势与技术领导者品牌商业模式:在更智能模型的基础上推出杀手级消费者产品服务,构建开源生态创造供应链优势与技术领导者品牌智能小巨人科技原创报告,请务必阅读文末版权声明差异化的商业模式生态系统的必要性技术供应链战略持续进步的Llama扎克伯格撰文开源扎克伯格撰文开源AI是未来之路详述是未来之路详述Meta的开源的开源AI战略战略“Meta的商业模式是为人们构建最佳的体验和服务。为了做到这一点,我们必须确保我们始终能够获得最好的技术,并且我们不会锁定在一个竞争对手的闭源生态系统中,在那里他们可以限制我们构建的内容。的商业模式是为人们构建最佳的体验和服务。为了做到这一点,我们必须确保我们始终能够获得最好的技术,并且我们不会锁定在一个竞争对手的闭源生态系统中,在那里他们可以限制我们构建的内容。”“Meta与闭源模型提供商的一个关键区别在于,出售对AI模型的访问权并不是我们的商业模式。这意味着公开发布Llama不会像闭源提供商那样削弱我们的收入、可持续性或投资研究的能力。”“为了确保我们能够长期获取最佳技术,并且不被锁定在闭源生态系统中,Llama需要发展成为一个完整的生态系统,包括工具、效率改进、芯片优化和其他集成。”“Meta在开源项目和成功方面有着悠久的历史。通过开放计算项目发布我们的服务器、网络和数据中心设计,并让供应链对我们的设计进行标准化,我们节省了数十亿美元。”“我预计AI开发将继续保持非常激烈的竞争,这意味着开源任何一个特定模型都不会在那个时间点上放弃下一个最佳模型的巨大优势。Llama成为行业标准的途径是通过一代又一代地保持竞争力、效率和开放性。”智能小巨人科技原创报告,请务必阅读文末版权声明对于对于Meta而言,而言,AI是产品服务的技术基础,价值创造来自产品是产品服务的技术基础,价值创造来自产品消费者创作者消费者创作者企业企业 Llama3、Llama4、Llama5FacebookInstagramReelsMeta AIAI StudioRay-Ban“随着时间的推移,这类资源(LLMs)可能会变成一种商品,而且我不确定最大的价值就在这里,我认为更大的价值在于基于这些资源可以构建的各种不同的产品。我认为更大的价值在于基于这些资源可以构建的各种不同的产品。”扎克伯格扎克伯格智能小巨人科技原创报告,请务必阅读文末版权声明“我可以说,自己构建模型是值得的,这样可以确保我们不会受制于人。”大众创作、开源社区的创意源源不断,围绕Llama产生的创新用例更容易与Meta的AI技术栈无缝对接。“如果人们能够找到更经济高效的方式来运行这些模型,对我们来说将是一大利好。如果我们能够提高10%的运行效率,就能节省数十亿甚至数百亿美元。”如果Meta决定将其内容创作模型开源,这些模型生成的内容最有可能发布在Meta自己的平台上。在在AI创作者经济中保持内容优势创作者经济中保持内容优势技术栈兼容的众包创新技术栈兼容的众包创新高效迭代的众包优化高效迭代的众包优化AI技术栈持续领先技术栈持续领先构建构建Llama为核心的开源为核心的开源AI生态,使生态,使Meta的的AI技术栈持续领先,在技术栈持续领先,在AI创作者经济中保持内容优势,并受益于众包创新和众包优化创作者经济中保持内容优势,并受益于众包创新和众包优化智能小巨人科技原创报告,请务必阅读文末版权声明对于IBM这样的企业来说,构建健康的开源技术供应链是非常重要的。IBM通过支持Linux可以确保其技术供应链的安全性和稳定性。IBM希望通过推广Linux来打破微软等公司在操作系统领域的垄断地位,支持Linux使IBM能够在数据中心和其他关键业务中提供更具竞争力的产品和服务。Linux作为开源项目,吸引了广泛的开发者社区,支持开源不仅有助于提升IBM的品牌形象,还能够增强其在技术领域的领导地位。技术领导者品牌塑造技术供应链优势打破市场垄断技术领导者品牌塑造技术供应链优势打破市场垄断IBM通过采用Linux可以减少对专有软件(如微软和Sun的操作系统)的依赖,从而节省大量的许可费用。战略性降本战略性降本单击此处添加项标题单击此处添加项标题科技企业投资开源生态的战略价值:供应链优势和领导者品牌科技企业投资开源生态的战略价值:供应链优势和领导者品牌2000年前后,以软件共享和开源方法闻名的Linux尚未对企业市场产生影响。但IBM成立了专门的团队评估Linux的潜力,以及是否在大型机上支持Linux,并在2000年5月作出战略性决策:正式发布Linux on S/390(Z的前身),成为第一家“All in”Linux的企业级IT企业。Linux的引入,为IBM大型机打开了开源软件生态系统的大门,IBM大型机久经考验的卓越性能与Linux的敏捷性和业务价值结合,产生了非凡的协同效应。有媒体称:“这是IBM在21世纪做出的最明智的决定之一”。智能小巨人科技原创报告,请务必阅读文末版权声明Meta的开源战略:长期以来的开源战略:长期以来Meta都是开源领域的领导者,持续源代码化底层基础设施,制定技术供应链标准都是开源领域的领导者,持续源代码化底层基础设施,制定技术供应链标准智能小巨人科技原创报告,请务必阅读文末版权声明案例:案例:OCP项目项目Open Compute Project(OCP)是一个由Facebook在2011年联合Intel、Rackspace、高盛和Arista Networks发起的开源硬件组织,致力于通过开放开源硬件技术,实现可扩展的计算,提供高效的服务器、存储和数据中心硬件设计,以减少数据中心的环境影响,并推动技术创新和可持续发展。Meta开源案例:创建开源案例:创建OCP,节省数十亿美元,并定义行业标准,节省数十亿美元,并定义行业标准谷歌在2000年代通过使用软件定义功能的普通硬件革新了数据中心设计;Facebook在2011年意识到业务规模不足以复制谷歌的差异化,因此创建了开放计算项目(OCP)。在在2014年的年的OCP峰会上,峰会上,Facebook工程副总裁宣布,工程副总裁宣布,OCP成立三年,开源硬件方案帮助成立三年,开源硬件方案帮助Facebook节约了节约了12亿美元。亿美元。OCP的会员已经超过340家,其中包括英伟达、腾讯、阿里等。OCP的发展历程中的里程碑包括:2014年:微软加入OCP,成为云计算厂商硬件开源的代表。2015年和2016年:苹果和Google陆续加入OCP。2018年:OCP开始向欧洲扩展,并加大对亚洲市场的活动力度;同年,腾讯加入成为白金会员。OCP的主要成果包括:数据中心硬件设计:开发了一系列高度优化的服务器设计、贡献了多种数据中心存储解决方案、推出交换机和网络适配器等产品。硬件管理:OpenBMC框架等,并定义了一系列硬件标准。技术创新:开发高性能计算互联技术,推动AI和边缘计算发展等。“开源项目的一个重要好处是围绕它可以建立起一个社区,Meta可以充分利用这个社区中的一切资源。我们不可能开源一切。比如我们的某些研究,因为其中使用的数据集,或者因为它的安全性,没有办法开源它。但在其他条件相同的情况下,我们确实尝试开源,并相信它将帮助包括我们在内的所有人。”Meta CTO智能小巨人科技原创报告,请务必阅读文末版权声明开源生态构建:开源生态构建:Meta鼓励员工贡献开源项目、形成运营机制鼓励员工贡献开源项目、形成运营机制170231579837020040060080010002019年2021年Meta的开源项目数量Meta的开源项目数量新增开源项目(个)活跃开源项目(个)3224423,93882935141,2250500001000001500002000002019年2021年Meta开源项目贡献来源Meta开源项目贡献来源外部提交数(次)内部提交数(次)Meta每年活跃的开源项目接近1000个,并持续发起新项目;能够长期维持大量活跃的开源项目的主要原因是Meta鼓励员工贡献开源项目,Meta的工程师是众多开源项目的主要贡献者。Meta运营开源项目的主要方法包括:通过GitHub等平台建立活跃的社区、提供详尽的文档和教程、资助各类开源基金会和开源合作伙伴、为主要的开源项目持续举办年度会议及各类活动、通过博客&播客&视频等内容宣传鼓励开源贡献等等。智能小巨人科技原创报告,请务必阅读文末版权声明-GPU采购:Meta已拥有约60万个英伟达GPU,并承诺到2024年底总共拥有35万台H100显卡。-超级计算机建设:Meta与英伟达、Pure Storage和Penguin Computing合作,共同打造了一台全球最快的AI超级计算机。-合作部署Llama 3.1。英伟达英伟达-Llama首选合作伙伴:从Llama 2发布开始,微软就成为首选合作伙伴,可以第一时间在Azure AI模型目录中使用Llama最新模型。-Meta AI与Bing的集成:Meta AI与微软的Bing搜索引擎进行了深度集成,能够使用Bing的海量信息。微软微软-端侧AI:高通和Meta持续合作优化Llama模型在高通芯片上的运行,覆盖智能手机、PC、VR/AR头显和汽车等多种场景。-资源和工具:开发者可以通过高通AI Hub获得必要的资源和工具来实现Llama 3在Snapdragon平台上的优化运行。高通高通-智 能 眼 镜:M e t a 和Essilor Luxottica的合作始于2020年,两家公司已经合作推出了两代的Ray-Ban Meta智能眼镜;据报道,双方还计划推出新版Supreme智能太阳镜。-股权合作:据金融时报报道,Meta正在考虑对眼镜集团EssilorLuxottica进行数十亿欧元的投资。Essilor Luxottica围绕围绕AI战略蓝图,战略蓝图,Meta在算力、云服务、端侧在算力、云服务、端侧AI、智能硬件等领域与全球顶级厂商建立深度合作关系、智能硬件等领域与全球顶级厂商建立深度合作关系智能小巨人科技原创报告,请务必阅读文末版权声明扎克伯格如何看待AI的商业化潜力核心核心AI产品服务拉动广告收入增长产品服务拉动广告收入增长随着AI推荐系统变得更加精准,用户参与度的提升将带来更多的广告曝光机会,广告的相关性和转化率也进一步提升。解锁商业信息传递收入解锁商业信息传递收入Meta计划通过提供AI支持的消息传递服务来帮助企业更好地与客户沟通。随着企业AI的推出,Meta期望这将解锁并显著发展商务消息传递业务。计算资源的付费使用计算资源的付费使用随着AI应用的增多,对计算资源的需求也随之增加,Meta可能会允许用户付费使用更大的AI模型和访问更多的计算资源。高质量高质量AI基础设施与服务基础设施与服务随着AI技术的普及,对高质量AI基础设施的需求将持续增长。通过提供AI基础设施和服务,Meta可以帮助其他公司构建和运行自己的AI模型。人与人与AI交互中引入广告或付费内容交互中引入广告或付费内容随着AI助手的使用率增加,Meta可能会在交互中引入广告,或者让用户付费使用更高级别的AI服务。AI功能拉动智能硬件销量功能拉动智能硬件销量Meta正在探索将AI技术与硬件产品相结合,如智能眼镜;并且Meta AI已经成为雷朋眼镜热销的重要原因。Meta对对AI商业化潜力的展望:最明显的机会是企业商业化潜力的展望:最明显的机会是企业AI的商业信息传递收入,的商业信息传递收入,Meta AI的互动中可能引入广告和付费内容的互动中可能引入广告和付费内容NO.3Meta的十年的十年AI布局布局FAIR实验室成立初期:实验室成立初期:Facebook决策层与决策层与AI团队达成团队达成“长期主义、开放式研究、研究应用转化长期主义、开放式研究、研究应用转化”的共识,且学术成果领先的共识,且学术成果领先AI界界2018-2021年,年,Facebook陷入舆论危机并战略转型元宇宙,陷入舆论危机并战略转型元宇宙,FAIR“学术型氛围学术型氛围”与与AI研究商业化的矛盾也浮出水面研究商业化的矛盾也浮出水面2022年至今,年至今,Meta的的AI推荐引擎成熟并广泛应用,生成式推荐引擎成熟并广泛应用,生成式AI业务崛起并领跑行业业务崛起并领跑行业learn more智能小巨人科技原创报告,请务必阅读文末版权声明Meta的的AI布局历经十年,开放式研究、技术与人才沉淀奠定了布局历经十年,开放式研究、技术与人才沉淀奠定了Meta成为大模型行业领跑者的技术基础成为大模型行业领跑者的技术基础2013FAIR实验室成立2016十年路线图发布2018AI团队架构调整期2022AI推荐技术成熟2023生成式生成式AI业务崛起业务崛起Meta的AI布局始于2013年,十年发展历程中,旗下FAIR实验室通过开放式研究长期在AI界维持领先的学术地位;但也曾一度面临“研究主题与应用转化之间的矛盾、尽管学术领先却误判大语言模型的前景、在ChatGPT崛起后一度在生成式AI领域落后”等挑战。2023年Meta将AI人才集中于攻坚生成式AI,在推出Llama系列开源大模型后,一举成为大模型行业领跑者。Facebook决策层与AI团队达成重要共识:长期主义、开放式研究、研究应用转化基于“让世界更开放和连接”的愿景三大核心领域为:连接、人工智能、虚拟现实和增强现实基础性研究成果显著同时面临AI技术与应用整合、业务战略转型元宇宙等挑战,团队架构几经调整2022年,基于内容理解的AI推荐引擎成 熟,成 为 驱 动Meta产品参与度的重要动力Meta组建全新的顶级产品组专注于生成式组建全新的顶级产品组专注于生成式AI,在,在LLM和多模态和多模态AI领域快速发力,成果显著领域快速发力,成果显著智能小巨人科技原创报告,请务必阅读文末版权声明作为深度学习的分支卷积神经网络的奠基 人 之 一,Y a n n L e C u n 在 加 入Facebook前已经是人工智能领域的技术领军人物。FAIR实验室最初由大约30个研究科学家和15名工程师组成,这些研究人员和工程师来自科技领域的各个层面,当中很多人都曾与Lecun合作过。AML负责人Joaquin Candela曾经在微软研究院和德国著名的马克斯-普朗克研究所任职,在主管AML部门前,曾作为Facebook的技术经理带领团队打造机器学习的基础架构。FAIR实验室:旨在通过开放研究来推动实验室:旨在通过开放研究来推动AI的发展的发展,研究的很大一部分集中在关于推理、预测、计划和无监督学习的关键基本问题上,相应的需要在生成模型、因果关系、高维随机优化和博弈论等领域有领先的理论理解。AML部门:目标是“推动先进技术在产品上的最大化应用”和“成为科研成果与产品开发间的粘合剂”部门:目标是“推动先进技术在产品上的最大化应用”和“成为科研成果与产品开发间的粘合剂”,实现把长期的科技研究的成果应用到短期的商业计划中去。两个部门彼此独立两个部门彼此独立又高度协同:又高度协同:FAIR实验室的领导者LeCun和AML部门负责人Candela都对Facebook的CTO Mike Schroepfer汇报,两个部门保持密切联系并形成高度协同的工作机制,两个部门的团队也可能互相流动。2013年,年,Facebook成立成立FAIR实验室,开启人工智能战略布局实验室,开启人工智能战略布局2013年年12月,月,Facebook成立了成立了FAIR实验室(实验室(Facebook AI Research,FAIR),正式踏入),正式踏入AI的基础研究领域。的基础研究领域。2014年,应用机器学习部门(年,应用机器学习部门(Applied Machine Learning,AML)形成,负责将)形成,负责将AI研究成果应用于研究成果应用于Facebook的产品中。的产品中。技术领军技术领军 实践专家实践专家智能小巨人科技原创报告,请务必阅读文末版权声明长期主义“Facebook的管理层并不担心FAIR和AML的回报问题,我们并不会花心思去计算ROI。你对团队内要做的事情规划得越清晰,你要做的事情就越少。我们有两个基本的问题要解决:研究未来,以及,找到当下产品能够应用的途径。”开放式研究研究应用转化010203CTO SchroepferFAIR Lecun“FAIR是非常开放的。我们公开发布了很多研究论文,同时开源了很多代码。所以我们是整个科研社区里的一个真正的组成部分,因为我们我们想通过自己的努力挑战极限,推动科学技术向前发展,同时确保自己能够掌控当今最先进的技术。”AML Candela“LeCun的团队花在研究上的时间是70%,而Candela的团队正好相反,只有30%。AML团队对项目的规划都是以季度或月来计算,通常以6个月为节点来组织产品计划。要从科学技术发展到实际的项目,你需要粘合剂对吧?我们就是粘合剂。”AI布局初期,布局初期,Facebook决策层与决策层与AI团队达成重要共识:长期主义、开放式研究、研究应用转化团队达成重要共识:长期主义、开放式研究、研究应用转化智能小巨人科技原创报告,请务必阅读文末版权声明 将将AI的应用分成四个领域:视觉、语言、语音和摄像效果,探索“内容理解引擎”的应用分成四个领域:视觉、语言、语音和摄像效果,探索“内容理解引擎”通过研究如何理解平台内容的意思,Facebook想要从评论中检测出微妙的意图,从口语中提取出细微的理解鉴别你在视频中快速出现的朋友的面孔,解读你的表情,然后将它们反映在你在虚拟现实场景中的化身 里程碑一:目标检测和内存网络里程碑一:目标检测和内存网络在计算机视觉领域实现对象检测自然语言理解方面,推动了内存网络新技术的发展 里程碑二:预测和规划里程碑二:预测和规划预测模型:“观看”一系列视觉测试并预测结果,准确率达90%系统计划:围绕该目标构建AI棋手,模仿人类的能力非常强大 应用研究:测试名为应用研究:测试名为M的新型的新型AI助手助手AML:探索:探索AI应用的四个领域,即应用的四个领域,即“内容理解引擎内容理解引擎”FAIR:图像识别与自然语言理解的开创性研究:图像识别与自然语言理解的开创性研究2013-2015年,年,FAIR与与AML的早期成果包括图像识别与自然语言理解的开创性研究、应用层面探索的早期成果包括图像识别与自然语言理解的开创性研究、应用层面探索“内容理解引擎内容理解引擎”智能小巨人科技原创报告,请务必阅读文末版权声明2016年,年,Facebook十年技术路线图发布,三大核心领域为:连接、人工智能、虚拟现实和增强现实十年技术路线图发布,三大核心领域为:连接、人工智能、虚拟现实和增强现实CTO Mike Schroepfer基于基于“让世界更开放和连接让世界更开放和连接”的愿景拆分:的愿景拆分:连接,让世界上尚未与互联网连通的40亿人也能上网,技术上采用无人机、卫星、激光、地面解决方案、基础设施建设和基础知识普及的手段AI,提升信息效率,解决信息过载的问题,并建造真正智能的电脑系统,技术层面重点发展视觉、语言、推理和计划的能力,提升信息效率,解决信息过载的问题,并建造真正智能的电脑系统,技术层面重点发展视觉、语言、推理和计划的能力VR与AR,创造身临其境的交互体验,建造下一代的电脑系统,发展移动端的VR、Oculus Rift、Touch、社交VR和AR技术Facebook十年技术路线图十年技术路线图(2016年发布)年发布)智能小巨人科技原创报告,请务必阅读文末版权声明Lumos一种自助服务平台,使团队能够利用计算机视觉的力量来开发他们的产品和服务,而无需事先具备专业知识AutoML允许工程师使用现有AI优化新AI模型的基础设施FBLearner FlowFacebook构建的机器学习平台FBLearner Flow,能够轻松地在不同产品中重用算法,扩展以同时运行数千个自定义实验,并轻松管理实验AI工程基础设施工程基础设施同年,同年,FBLearnerFlow、AutoML和和Lumos等基础设施成型,有助于等基础设施成型,有助于Facebook的的AI研究加快投产,并与研究加快投产,并与VR/AR联动联动FBLearner Flow简化简化AI工程实验工程实验每个机器学习算法都可以重用实现工程师能够编写一个训练管道在许多机器上并行化,并且可以被许多工程师重用对于具有不同ML经验的工程师,训练模型很容易,而且几乎每个步骤都完全自动化每个人都能够轻松搜索过去的实验、查看结果、共享以及开始给定实验的新变体智能小巨人科技原创报告,请务必阅读文末版权声明将机器学习技术用于改进新闻源排名、广告排名、搜索等方面的产品质量。Facebook初步尝试将AI作为“内容理解引擎”用于提升推荐效果,并标记各种内容,改进安全与审查效率,自动化部分安全与审查工作。Facebook积极开发VR和AR产品,称无论在视觉方面还是语音方面,AI都在驱动VR和AR产品的重要进展。010203AI改进产品质量改进产品质量AI应用于推荐和安全应用于推荐和安全AI与与VR/AR结合结合2016-2017年,年,Facebook将将AI技术应用于产品质量改善、推荐体验和安全管理提效、技术应用于产品质量改善、推荐体验和安全管理提效、VR/AR产品的开发产品的开发智能小巨人科技原创报告,请务必阅读文末版权声明“需要有人从根本上管理Facebook的所有AI内容,包括研究、开发以及与产品的联系。Jerome对运营管理的接管将使我能够专注于领导科学研发和人工智能战略。我现在是Facebook的首席人工智能科学家。”LeCun“当你开始谈论技术转让时,这意味着你已经输掉了这场战斗。你不能仅仅是选择了一些研究,就要求其他人尝试将其投入生产。你不能只是简单把它扔过篱笆就认为任务完成了。这确实是一个集体的挑战,最好的方法是让做研究的人和更接近产品的人一起结合工作。确保一系列项目随着时间的推移而成熟,并将人们集中在一起。”Pesenti2018年,Yann LeCun宣布辞去FAIR实验室负责人的职务,转而由AI初创公司BenevolentAI的CEO兼IBM大数据集团CTO Jrme Pesenti接任。Pesenti同时接管了AML部门,负责将AI技术应用到Facebook产品中。2018年开始,年开始,Facebook试图整合试图整合FAIR与与AML的工作的工作智能小巨人科技原创报告,请务必阅读文末版权声明FAIR实验室沉淀的实验室沉淀的“学术型氛围学术型氛围”被认为不利于被认为不利于AI商业化商业化招聘文化选题模式资源分配资源分配采取分散的自下而上的方法。在每个项目中都将硬件分配到一个个小池子中,而不是集中资源办大事。大多研究人员都有着自己的选题自由,会朝着不同的方向建立独立项目。整体的AI项目缺乏系统性的战略目标。更倾向于学术成果突出的科学家,吸引了擅长研究论文的顶尖人才,但缺乏产品导向的工程思维专家。“LLMs革命发生在两年前,其实已经有点过时了。不过对于最近几个月才接触ChatGPT的公众来说,这还是很新鲜的。我们很容易被它们的流畅性所蒙蔽,以为它们很聪明,其实智力非常有限。无论是来自认知科学,还是经典人工智能子领域的研究论文,都指出了LLMs确实无法计划的事实,没有真正的思考能力,也没有和人类一样的推理和计划能力。”LeCun尽管2018年以后,Facebook尝试整合FAIR和AML的工作,但FAIR实验室的“学术型氛围”沉淀的招聘文化、选题模式和资源分配机制被外界认为不利于AI的产品化落地,并且是Meta(前Facebook)在生成式AI浪潮中一度落后的主要原因,尤其是LeCun从2020年开始就公开表示LLMs缺乏技术先进性,不看好LLMs的前景,导致一直到2022年,Meta对于大语言模型及其产品化的投入都明显落后于微软和谷歌。智能小巨人科技原创报告,请务必阅读文末版权声明2020年,年,GPT-3引起硅谷和用户的关注,引起硅谷和用户的关注,Facebook由于在技术层面不看好由于在技术层面不看好LLMs,以及对安全的担心,未向,以及对安全的担心,未向LLMs倾斜资源倾斜资源 一个基于问题的搜索引擎一个基于问题的搜索引擎 一个聊天机器人,让你与历史人物交谈一个聊天机器人,让你与历史人物交谈 仅从几个示例中解决语言和语法难题仅从几个示例中解决语言和语法难题 基于文本描述的代码生成基于文本描述的代码生成 回答医疗问题回答医疗问题 文本的样式转换文本的样式转换 创作吉他谱创作吉他谱 写创意小说写创意小说 自动完成图像,而不仅仅是文本自动完成图像,而不仅仅是文本谷歌高级谷歌高级AI研究员研究员“GPT-3只能自动执行更小、更便宜的人工智能程序可以完成的琐碎任务,而且该程序的绝对不可靠性最终会破坏它作为商业企业的地位。”英伟达英伟达AI主管主管“该程序(GPT-3)在一定程度上是根据Reddit过滤的数据进行训练的,并且根据这些数据构建的模型产生的文本令人震惊的偏见。”Jerome Pesenti“使用GPT-3构建的程序从单个输入词编写推文会产生冒犯性信息,例如如果我们能让人们同意这是道德的,大屠杀将具有如此大的环境意义。”2020年用户眼里的年用户眼里的GPT-32020年部分硅谷人士对年部分硅谷人士对GPT-3的看法的看法智能小巨人科技原创报告,请务必阅读文末版权声明2021年,年,Facebook屡遭舆论危机后更名屡遭舆论危机后更名Meta,品牌重塑同时战略转型元宇宙优先,品牌重塑同时战略转型元宇宙优先,AI团队实施团队实施“去中心化去中心化”整合入各产品组整合入各产品组2018年,Facebook因剑桥分析公司不当获取并利用8700万用户数据的丑闻而受到广泛批评,这些数据被用于影响2016年美国总统大选。2018年3月、9月、12月,Facebook连续3次发生用户数据信息泄露事件,陷入严重的舆论危机。2021年4月,爱尔兰数据保护委员会启动对Facebook的调查,涉及全球约5.33亿用户的个人信息泄露。2021年,Facebook前员工Frances Haugen获取并泄露了数千页Facebook内部文件,揭示了Facebook对社会的负面影响,并提起指控。2018-2021年,Facebook屡次遭遇舆论危机。2021年10月28日,扎克伯格宣布Facebook更名为Meta,品牌重塑的同时战略转型元宇宙优先,人工智能团队在半年时间内经历了2次组织架构调整,先是并入AR/VR部门,而后又整合入各产品组。2021年12月,Meta宣布AI团队合并入负责开AR/VR产品的Reality Labs部门,其应用AI领域的两名关键高管离职,分别是应用AI研究副总裁和AI团队产品总监。2022年6月,Meta 发布重大 AI战略转型公告,宣布施行“去中心化组织结构”,将人工智能团队更紧密地整合到各个产品组中,人工智能副总裁Jerome Pesenti宣布离职。智能小巨人科技原创报告,请务必阅读文末版权声明011.0代表着该框架版本已经非常稳定、成熟。Facebook将PyTorch框架的灵活性与Caffe2的生产能力结合,提供从研究到从研究到AI研究产品化的无缝对接研究产品化的无缝对接。01Facebook还介绍了其他厂商对厂商对 PyTorch 1.0生态的深度支持生态的深度支持,来自于亚马逊、Google和微软等软件、产品和云服务提供商以及英伟达、高通、英特尔等技术提供方。02增强PyTorch自身的实力以外,Facebook还致力于通过教育与课程方式推广通过教育与课程方式推广PyTorch打造深度学习框架打造深度学习框架。例如,Udacity与Facebook合作,为开发者提供免费的深度学习入门课程,而这些课程完全使用 PyTorch作为框架。032018-2021年间,FAIR的研究成果仍然领先于全球,并为AI的发展做出了重大贡献。除了Yann LeCun获得图灵奖之外,2018年PyTorch1.0开源框架的发布,对于AI技术的普及和创新具有里程碑的意义!PyTorch自2016年首次发布以来,便以惊人的速度发展,从最初的实验性项目逐步成长为深度学习领域不可或缺的支柱之一,不仅广泛应用于学术界的研究项目中,更助力众多企业实现AI技术的落地与商业化。2018-2021年,年,FAIR研究成果仍然领先于全球,并发布了对深度学习领域意义重大的研究成果仍然领先于全球,并发布了对深度学习领域意义重大的PyTorch开源框架开源框架02032018年年Facebook在首届在首届PyTorch开发者大会上发布开发者大会上发布PyTorch1.0预览版预览版智能小巨人科技原创报告,请务必阅读文末版权声明扎克伯格:扎克伯格:“我们主要关注的三个领域是我们的人工智能发现引擎我们主要关注的三个领域是我们的人工智能发现引擎它正在驱动它正在驱动Reels和其他推荐体验,我们的广告和商业信息平台,以及我们对元宇宙的未来愿景和其他推荐体验,我们的广告和商业信息平台,以及我们对元宇宙的未来愿景”。“目前我们业务的一个主要转变是,社交信息流正从主要由你关注的人和账户驱动,逐渐转变为也由AI推荐你会觉得有趣的内容”;“一个人Facebook信息流中大约15%的内容,是由AI从你未关注的人、群组或账户中推荐的”;“在推出了一个新的大型AI推荐模型后,仅在Facebook上,我们在短视频播放器中的观看时间就增加了15%”。01|“首先是我们的发现引擎工作使我们能够推荐Reels以外的所有类型的内容,包括照片、文本、链接、社区、短篇和长篇视频等”;02|“第二是我们可以将这些内容与来自你的家人和朋友的帖子混合在一起,这些是AI单独无法生成的”;03|“第三,随着更多的社交互动转移到信息传递上,我们正在开发一个发现和信息传递之间的飞轮,这将使这些应用更强大”。2022年,基于内容理解的年,基于内容理解的AI推荐引擎成熟,成为驱动推荐引擎成熟,成为驱动Meta产品参与度的重要动力产品参与度的重要动力智能小巨人科技原创报告,请务必阅读文末版权声明在生成式在生成式AI方面,方面,2022年,年,Meta内部有内部有2个团队开发大模型,但算力资源成为掣肘,阻碍了大规模创新的步伐个团队开发大模型,但算力资源成为掣肘,阻碍了大规模创新的步伐01020304050607080901002020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q42022Q12022Q22022Q32022Q42023Q12023Q22023Q32023Q42024Q12024Q2Meta各季度资本支出(亿美元)Meta各季度资本支出(亿美元)2022年5月,Meta AI北美团队发布并开源了大模型OPT-175B,之后又开发第二个模型,旨在与谷歌的PaLM竞争同时,Meta AI巴黎团队开始着手开发LIama北美和巴黎两个实验室的团队,开启了获取算力资源之争2022年中,年中,Meta内部检讨对内部检讨对AI投入不足,加大了资本开支投入不足,加大了资本开支2022年年Meta内部备忘录:内部备忘录:“对对AI友好型硬件和软件系统的采用速度缓慢友好型硬件和软件系统的采用速度缓慢”智能小巨人科技原创报告,请务必阅读文末版权声明2月月Feb3月月Mar2023年年2月,在月,在ChatGPT风靡全球之后,风靡全球之后,Meta宣布组建全新的顶级产品组专注于生成式宣布组建全新的顶级产品组专注于生成式AI,在,在LLM和多模态和多模态AI领域快速发力领域快速发力7月月July8月月Aug9月月Sep12月月Dec2023年2月,扎克伯格宣布已经训练并将向研究人员发布Llama大型语言模型,同时,“Meta创建了一个新的顶级产品组,专注于生成式 AI”。3月,Llama作为AI社区中任何人都可以请求访问的开源包发布,很快就发生了模型泄露。Llama的可下载种子在各个AI社区中广泛传播。7 月,M e t a 推 出Llama 2并开源,免费用于研究和商业用途,同时将微软作为首选合作伙伴,在Azure AI模型目录中提供,此外也可通过亚马逊、Hugging Face获得。8月,Meta连续推出:用于音频和音乐的生成式AI工具AudioCraft、用于语音和文本翻译的多 模 态 A I 模 型SeamlessM4T、用于 编 码 的 A I 工 具Code Llama。9月,推出Meta AI 测试版,这是一款高级对话助手,可以提供实时信息,并在几秒内从文本提示中生成逼真的图像,与朋友分享。此外,Meta还在应用程序中推出了28 个AI名人角色。12月,Meta宣布新版雷朋智能眼镜中包含Meta AI,并推出抢先体验计划,邀请客户参与多模态AI功能的新测试。生成式AI方面推出Purple Llama,提供安全工具及评估。2023年年智能小巨人科技原创报告,请务必阅读文末版权声明2024年,年,Meta通过发布通过发布Llama3、推出、推出Meta AI等战略级产品与等战略级产品与OpenAI正面竞争,且志在明年让正面竞争,且志在明年让LIama4成为最先进的模型成为最先进的模型4月月Apr6月月Jun7月月JulyLlama 3发布:发布:发布开源大模型Llama 3的8B和70B参数两个版本,是预训练和指令微调模型8B和70B参数尺度上存在的最佳模型。Meta AI正式推出:正式推出:Meta AI在多应用家族中可用,英文版在十几个国家上线。Meta AI使用Llama3构建,是全球领先的AI助手之一。FAIR发布多个发布多个AI研究模型研究模型Chameleon混合模态模型:混合模态模型:可以将文本和图像的组合作为输入,也可以输出文本和图像的组合。AI音乐生成模型音乐生成模型JASCO:能够接受各种输入,改善输出的控制。发布音频水印技术发布音频水印技术AudioSeal:可以在较长的音频片段中精确定位AI生成的片段。Llama 3.1发布:发布:发布全球最大、最好的开源AI模型Llama3.1,最大的版本有4050亿个参数。Meta AI推出七种新语言版本推出七种新语言版本,并扩展到22个国家/地区。在美国推出在美国推出AI Studio:AI Studio使用Llama 3.1构建,让任何人都可以创建和发现AI角色。Segment Anything Model 2:可以分割图像或视频中的任何对象,并在视频所有帧中实时跟踪。2024年年NO.4独特的战略假设,与众不同的商业模式独特的战略假设,与众不同的商业模式技术战略启示录:技术战略启示录:“长期主义长期主义 技术先行技术先行”、正确选择技术战略路线图、开源布局的战略意义、正确选择技术战略路线图、开源布局的战略意义大模型生态竞合:创新扩散加速、模型部署与应用市场分层、复合式商业模式普及大模型生态竞合:创新扩散加速、模型部署与应用市场分层、复合式商业模式普及准备好了吗?制定您的准备好了吗?制定您的AI技术战略路线图技术战略路线图learn moreMeta的的AI战略启示录战略启示录智能小巨人科技原创报告,请务必阅读文末版权声明独特的战略假设AI是是Meta的技术基础不是的技术基础不是Meta商业模式的核心价值创造来自产品商业模式的核心价值创造来自产品技术战略启示录“长期主义 技术先行”正确选择技术战略路线图开源布局的战略意义大模型生态竞合创新扩散加速模型部署与应用市场分层复合式商业模式普及010203以产品为中心以产品为中心打造技术供应链Llama改变世界Meta的的AI战略启示录:独特的战略假设,与众不同的商业模式战略启示录:独特的战略假设,与众不同的商业模式智能小巨人科技原创报告,请务必阅读文末版权声明Meta的的AI技术战略启示录:技术战略启示录:“长期主义长期主义 技术先行技术先行”对于战略性技术的布局,对于战略性技术的布局,“长期主义、技术先行长期主义、技术先行“视角沉淀的研究成果、技术平台、人才优势奠定行业领跑者基础。视角沉淀的研究成果、技术平台、人才优势奠定行业领跑者基础。启示一启示一尽管FAIR实验室的“学术型氛围”导致的研究主题分散、资源配置低效是Meta在生成式AI浪潮中一度落后的主要原因,但2023年2月Meta宣布组建全新的生成式AI产品团队后,能够快速发力并在半年后成为行业领跑者,仍应归功于十年AI布局积累的技术视野和人才优势;大模型训练迄今为止仍然被业界认为是“艺术”而不仅仅是科学,高水平高密度的人才团队是领跑行业的必要条件。在大模型技术迭代曲线陡峭的阶段,模型的进步带来新能力、新市场的解锁,技术催生进步引领进步正在成为常态,因此“技术先行”视角十分必要。智能小巨人科技原创报告,请务必阅读文末版权声明Meta的的AI技术战略启示录:正确选择技术战略路线图技术战略启示录:正确选择技术战略路线图技术战略路线图的正确选择,长期规划与短期迭代缺一不可。技术战略路线图的正确选择,长期规划与短期迭代缺一不可。启示二启示二2016年Facebook基于“让世界更开放和连接”的愿景划定“十年路线图”的三大核心领域:连接、人工智能、虚拟现实和增强现实;从一开始,Facebook就采取基于长期规划选择重点领域投入资源,避免了“广撒网”的低效率和高成本。2020-2022年,Meta一度误判了LLMs的市场前景,导致对生成式AI的资源投入不足;但在2022年中至2023年2月,Meta的内部检讨与面对ChatGPT崛起后的调整应对,使技术路线的选择快速转向生成式AI。智能小巨人科技原创报告,请务必阅读文末版权声明Meta的的AI技术战略启示录:开源布局的战略意义技术战略启示录:开源布局的战略意义布局开源生态的技术供应链战略,既实现了战略性降本,又是打破市场垄断的有效策略。布局开源生态的技术供应链战略,既实现了战略性降本,又是打破市场垄断的有效策略。启示三启示三长期以来,硅谷科技龙头都十分重视“掌控生态系统,整合开源技术成果”的意义。2023年5月,谷歌的内部文件我们没有护城河,OpenAI也没有分析到:“这一切背后最大的赢家反而是Meta自己。泄露的模型就是他们搞出来的,所以他们其实是获得了全世界的免费劳动力。由于大部分开源创新都发生在他们的架构之上,所以Meta当然可以直接把成果整合到自家产品当中。这种对生态系统的掌控力,再怎么强调都不为过。谷歌本身就已经在开源产品(例如Chrome和Android)中成功践行了这一原则。通过掌控创新发生的平台,谷歌巩固了自己作为思想主导和方向制定者的地位,获得了超越自身极限塑造宏大趋势的能力。”智能小巨人科技原创报告,请务必阅读文末版权声明开源模型适用于需要高度定制化和成本敏感的场景,而闭源模型则适用于对稳定性和服务质量有更高要求的场景。开源模型可能成为行业标准的基础,Llama模型正在成为未来大模型的参考标准之一。以Llama为代表的开源模型,迭代和改进速度加速,更多的开发者和企业尝试大模型应用与开发。技术创新扩散加速技术创新扩散加速开源模型成为行业标准的基础开源模型成为行业标准的基础大模型部署与应用市场分层大模型部署与应用市场分层科技巨头通过开源策略构建开放的生态系统,吸引更多的参与者,同时通过闭源策略提供更高级的服务。复合式的商业模式更普及复合式的商业模式更普及大模型生态竞合研判:创新扩散加速、模型部署与应用市场分层、复合式商业模式普及大模型生态竞合研判:创新扩散加速、模型部署与应用市场分层、复合式商业模式普及智能小巨人科技原创报告,请务必阅读文末版权声明当前AI技术发展概况行业应用案例分析市场需求预测竞争对手分析技术趋势预测市场与技术趋势市场与技术趋势企业资源与能力评估现有AI技术应用审查业务流程与AI集成度分析风险与机遇识别企业现状评估企业现状评估 短期目标(1-3年)中期目标(3-5年)长期愿景与目标战略目标设定战略目标设定 核心技术选择 核心技术发展路径 技术供应链生态 技术供应链构建 创新技术跟踪与采纳技术路线图技术路线图准备好了吗?制定您的准备好了吗?制定您的AI技术战略路线图技术战略路线图业务模式创新业务模式创新 AI驱动的产品服务开发 客户体验优化 运营效率提升 收入模式转型组织结构与文化组织结构与文化 AI战略与企业文化融合 支持AI战略的组织结构调整 人才培养与团队建设行动计划与里程碑行动计划与里程碑 短期行动计划 中期行动计划 关键里程碑设定绩效评估与调整机制绩效评估与调整机制KPIs与性能指标定期审查与反馈循环战略调整机制learn moreAI战略咨询服务战略咨询服务四大主营业务:四大主营业务:AI战略咨询、资本品牌、战略咨询、资本品牌、AI培训、培训、AI应用应用AI战略咨询四类服务:战略咨询四类服务:AI行业洞察、行业洞察、AI战略研究、战略研究、AI战略规划、战略规划、AI业务孵化业务孵化全球最佳实践智库,历经一年深度打磨全球最佳实践智库,历经一年深度打磨我们是战略研究、市场洞察的专家我们是战略研究、市场洞察的专家智能小巨人科技智能小巨人科技创始人:王铮创始人:王铮职业履历:职业履历:2011-2018:国金证券分析师、中信证券高级分析师、光大证券首席分析师2018-2023:头部互联网大厂资深战略专家是诞生于是诞生于“AI技术革命技术革命”的精品咨询公司的精品咨询公司职业荣誉:职业荣誉:2018:Wind年度金牌分析师传媒互联网行业第1名2017:“天眼”年度最佳证券分析师选股奖传媒第3名2016:“天眼”年度最佳证券分析师选股奖传媒第3名2015:东方财富十佳分析师全市场第3名2013:东方财富十佳分析师全市场第4名2013:汤森路透StarMine全球卖方分析师评选“中国大陆及香港地区”可选消费行业“最佳选股奖”第2名2011:中国证券业金牛分析师奖TMT行业第4名智能小巨人科技是诞生于“AI技术革命”的精品咨询公司,创始团队由多位10年以上从业经验的头部互联网大厂战略Leader、市场研究负责人、产品技术负责人、大型证券研究所TMT团队负责人、PE/VC投资人、财经公关专业人士组成。智能小巨人科技AI战略咨询服务战略专家战略专家产品技术专家产品技术专家行业研究专家行业研究专家市场调研专家市场调研专家投研专家投研专家财经公关专家财经公关专家包含AI行业洞察、AI战略研究、AI战略规划、AI业务孵化等服务。AI战略咨询战略咨询包含资本品牌策略与传播策划、IPO/并购/事件传播、商业BP/内容营销定制、全球投资峰会等服务。资本品牌服务资本品牌服务与人工智能领域的领军企业、一线专家合作,面向企业需求的定制人工智能培训服务。人工智能培训人工智能培训针对企业的战略洞察、用户研究、专项调研、投资并购、融资事件、内容营销等场景的AI业务创新、AI应用落地服务。AI应用落地应用落地的四大主营业务的四大主营业务智能小巨人科技AI战略咨询服务01行 业 定 制 版 月 度 A I 战 略全 景 洞 察 报 告,跟 踪 行业、技 术、产 品、商 业化、竞争、合作信息AI行业洞察行业洞察03根据需求设计或配合企业战略规划工作流程,定制市场洞察、战略分析、技术规划、战略解码、路线图制定、执行计划跟踪机制等专项或打包服务AI战略规划战略规划02根 据 需 求 定 制 A I 战 略 专项 研 究,如 技 术 路 线、最佳实践、产品战略等AI战略研究战略研究04定 制 化 的 端 到 端 A I 业 务孵 化,包 括 方 向 探 索、专家智库、产业链研究、最佳实践解析、市场/用户调研、产品/技术战略规划、MVP孵化与陪跑、合 作 落 地 与 增 长 运 营 等专项或打包服务AI业务孵化业务孵化的核心业务:的核心业务:AI战略咨询服务战略咨询服务智能小巨人科技AI战略咨询服务AI技术革命使得上一轮周期末的技术革命使得上一轮周期末的“技术辅助业务技术辅助业务”思维须转向思维须转向”技术先行技术先行“,业务战略中必须增加技术,业务战略中必须增加技术Vision:无论预判技术瓶颈,管理技术供应链,还是应对技术竞争的挑战都更大。:无论预判技术瓶颈,管理技术供应链,还是应对技术竞争的挑战都更大。业务战略中加入技术业务战略中加入技术VisionAI领域的最佳实践目前主要在美国,业务洞察对全球视野要求较高业务洞察对全球视野要求较高。当前技术曲线仍然陡峭,且各行各业在AI相关领域的竞争非常激烈,产品、服务、商业化快速演进,必须动态跟踪!产品、服务、商业化快速演进,必须动态跟踪!必须具备全球视野必须具备全球视野&动态视角动态视角尽管大模型技术快速进步,但是当前性能和业务开发、应用落地相结合仍然存在众多缺陷。AI业务孵化和应用落地仍然处于探索期,需要大模型能力、场景、行业业务孵化和应用落地仍然处于探索期,需要大模型能力、场景、行业knowhow多维验证多维验证。业务孵化业务孵化&应用落地探索期应用落地探索期在全球范围内,AI核心环节人才、产业资源均处于高度稀缺状态;对于多数公司而言,组织能力与产业资源都难以满足业务孵化组织能力与产业资源都难以满足业务孵化&应用落地的需求;组织层面亟需视角突破应用落地的需求;组织层面亟需视角突破&认知启发认知启发。组织能力组织能力&产业资源全新要求产业资源全新要求洞察:洞察:AI业务战略的四大痛点业务战略的四大痛点智能小巨人科技AI战略咨询服务“行业行业 技术技术 商业商业”三位一体全球最佳实践智库一线专家合作网络三位一体全球最佳实践智库一线专家合作网络的的AI战略咨询解决方案战略咨询解决方案整合了AI技术战略库、AI最佳实践案例库、全景式一手信息源,能够输出AI战略全景洞察报告、AI产业链最佳实践深度研究、对标最佳实践的关键成功因素的解决方案。通过自建专家库、赋能AI初创生态、与高校、智库、媒体合作模式搭建广泛且深入合作的一线AI专家合作网络。定制化定制化&共创式共创式&陪跑式交付陪跑式交付中短期内的AI驱动产品/场景/流程开发需要在模型核心feature之上增加行业认知&产品/场景/流程思维。中长期的AI技术与商业战略布局在业务战略中引入技术Vision,并且规划、积累核心壁垒,打造业务结构护城河。专家级项目负责人全程主控,针对客户需求深度个性化定制,契合客户战略体系框架的共创式&陪跑式交付体系。智能小巨人科技AI战略咨询服务全球最佳实践智库全球最佳实践智库已开发AI全产业链精选技术论文库,沉淀、拆解AI相关核心技术论文超过500篇,并结合“技术 商业”战略视角形成路线图,输出技术战略洞察成果。AI技术战略库技术战略库已开发AI龙头公司全产业链深度研究案例,包括OpenAI、微软、谷歌、Meta、苹果、亚马逊、英伟达、AMD、英特尔、博通、Marvell、Snowflake、Databricks、Salesforce等科技领域最佳实践案例。AI最佳实践案例库最佳实践案例库全球最佳实践智库常年跟踪的精选科技产业信息源超过2000个,全面跟踪全球范围内AI领域最新一手信息。每个月组织10次以上产业调研,AI领域前沿实践研究第一时间动态更新!全景式一手信息体系全景式一手信息体系智能小巨人科技AI战略咨询服务AI战略咨询:全球最佳实践智库战略咨询:全球最佳实践智库当前大模型的关键限制:上下文长度、幻觉问题;首先要在产品/场景/流程中选择特定的、最适用于大模型的能力。大模型核心大模型核心feature行业认知产品行业认知产品/场景场景/流程思维流程思维技术曲线仍然陡峭、大模型能力尚不完善,AI-Native产品/流程的开发需要在模型核心feature之上增加行业认知&产品/场景/流程思维!AI驱动产品驱动产品/场景场景/流程开发指南流程开发指南智能小巨人科技AI战略咨询服务AI战略咨询:战略咨询:“行业行业 技术技术 商业商业”三位一体三位一体融入行业认知与领域专有知识仍然是AI应用落地的关键成功因素。基于具体化的产品/场景/流程思维,方能使AI驱动的开发成果获得良好的用户体验。技术先行技术瓶颈技术供应链技术竞争技术先行技术瓶颈技术供应链技术竞争技术先行视角技术供应链管理技术瓶颈识别应对技术竞争技术先行视角技术供应链管理技术瓶颈识别应对技术竞争生成式AI开启了全新的技术周期,使很多”不可能“变为”可能“,因此在成熟技术周期中的”技术辅助业务“视角须转变为”技术先行“视角。AI技术革命带来的技术战略新挑战技术革命带来的技术战略新挑战Generative AI智能小巨人科技AI战略咨询服务AI战略咨询:业务战略增加技术战略咨询:业务战略增加技术Vision大模型的数据瓶颈在1-2年会出现,能源的瓶颈不容忽视,除此之外与具体业务结合的技术瓶颈也必须提前识别与布局。技术供应链的管理需要投入更多前瞻性研究与规划,综合自有技术、技术采购、技术联盟等多元模式,实现有效的资源配置,保障技术供应链体系。在生成式AI技术周期成熟之前,技术竞争力在企业竞争力中的权重较高,未来若干年,大型企业都必须有效应对更加激烈的技术竞争方能基业长青。自有专家库初创公司合作库高校、智库、媒体外部合作专家自有专家库初创公司合作库高校、智库、媒体外部合作专家专家网络专家网络专家级项目负责人全程主控共创式交付大型项目陪跑式交付专家级项目负责人全程主控共创式交付大型项目陪跑式交付交付保障交付保障AI战略咨询:专家网络与交付保障战略咨询:专家网络与交付保障智能小巨人科技AI战略咨询服务我们是战略研究、市场洞察的专家我们是战略研究、市场洞察的专家智能小巨人科技核心团队拥有15年战略研究、市场洞察丰富经验,已服务过互联网大厂、中型上市公司、小型创业团队等多元类型企业,以“切实解决客户问题”为核心理念!核心优势核心优势曾服务大型、中型、小型各类企业以切实解决客户问题为核心理念曾服务大型、中型、小型各类企业以切实解决客户问题为核心理念智能小巨人科技AI战略咨询服务智能小巨人科技原创报告,请务必阅读文末版权声明参考资料:参考资料:1.Meta官网2.Facebook招股书3.Meta历年财报4.Meta历年业绩说明会5.51CTO:Facebook数据中心实践分析,OCP主要工作成果介绍,2015-03-126.Meta:教机器看和理解:人工智能研究的进展,2015-12-037.Meta:连接世界的技术,2016-04-128.Meta:介绍FBLearner Flow:Facebook的AI骨干网,2016-05-099.36氪:“长远研究”和“短期应用”两大实验室双剑合璧,能否支撑起Facebook称霸人工智能的雄心?,2016-06-0910.Meta:利用AI加速创新,打造新体验,2016-11-0811.InfoQ:Facebook 人工智能领域利器:FBLearner Flow 平台,2017-02-1612.Backchannel:揭秘Facebook的AI机器:AI已关乎存亡,2017-03-0113.PyTorch:PyTorch,一年了.,2018-01-1914.Meta:Facebook通过新的合作伙伴和PyTorch 1.0的生产能力加速AI开发,2018-10-0215.AI科技评论:PyTorch 1.0预览版发布:90%的功能能经受住业界考验,2018-10-0316.Meta:FAIR成立五周年:我们取得了什么成就以及我们要去哪里,2018-12-0517.机器之心:对话Facebook AI负责人Jerome Pesenti:AI达到人类智慧之前,要先破解成本极限,2019-12-1518.Meta:开源年度回顾,2020-01-1319.The Verge:OpenAI的最新突破惊人地强大,但仍在与它的缺陷作斗争,2020-07-3020.IBM:IBM Z Linux:开源创新20年,混合云时代更关键,2020-11-1221.Facebook严控内部留言板,防止内部机密信息被泄露,2021-10-1422.The Verge:马克扎克伯格(Mark Zuckerberg)谈Facebook为何要更名为Meta,2021-10-2923.新浪科技:Meta继续重组架构:人工智能团队合并至AR/VR部门,2021-12-1024.AI前线:Meta 发布2021年开源回顾:专注Rust语言,一年启动231个新项目,2022-03-1325.CNBC:马克扎克伯格(Mark Zuckerberg)在人工智能竞赛升温时宣布 Meta 的新大型语言模型,2023-02-24智能小巨人科技原创报告,请务必阅读文末版权声明参考资料:参考资料:26.CNBC:Meta 争先恐后地赶上AI的内幕,2023-04-2527.Meta:Meta和Microsoft推出下一代Llama,2023-07-1828.Meta:隆重推出 AudioCraft:用于音频和音乐的生成式AI工具,2023-08-0229.中国企业家:图灵奖得主杨立昆:生成式AI有点过时了,2023-08-2130.Meta:隆重推出SeamlessM4T,一种用于语音和文本翻译的多模态AI模型,2023-08-2231.AI未来指北:起底Meta AI团队:不到半年,他们带着小扎重回科技主场,2023-08-2432.Meta:介绍Code Llama,一种用于编码的AI工具,2023-08-2433.Meta:在我们的应用和设备系列中引入新的AI体验,2023-09-2734.Meta:隆重推出新款雷朋|Meta智能眼镜,2023-09-2735.Meta:通过开放研究推进人工智能发展的十年,2023-11-3036.Meta:我们的AI体验中的新增功能,2023-12-0637.Meta:推出Purple Llama以实现安全和负责任的AI开发,2023-12-0738.Meta:生活在未来,2023-12-0839.新智元:专访Meta CTO:AI已是XR杀手应用,LLM开源社区竞争没有输家,2023-12-2540.机器学习与推荐算法:如何评价Meta最新推荐论文:生成式推荐打败深度分层架构推荐?,2024-03-1641.Meta:认识你的新助手:Meta AI,用 Llama 3构建,2024-04-1842.Dwarkesh 播客:马克扎克伯格专访,2024-04-1843.王铮Silvia:开源模型会越来越落后?小扎表示不同意!Llama 3王者归来,开源路线通往AGI再下一城?!,2024-04-1944.新浪XR:高通与Meta合作,以加速Llama 3在AR/VR等终端落地,2024-04-2245.Actions Speak Louder than Words:Trillion-Parameter Sequential Transducers for Generative Recommendations,2024-05-0646.Meta:公司如何使用Meta Llama,2024-05-0747.Paperweekly:ICML 2024|面向第三代推荐系统:Meta提出首个生成式推荐系统模型,2024-05-1348.Wukong:Towards a Scaling Law for Large-Scale Recommendation,2024-06-0449.Meta:发布新的人工智能研究模型,加速大规模创新,2024-06-1850.AINLP:Meta关于深度学习推荐系统的Scaling Law的研究,2024-07-09智能小巨人科技原创报告,请务必阅读文末版权声明参考资料:参考资料:51.鞭牛士:Meta考虑入股雷朋眼镜制造商EssilorLuxottica,2024-07-1852.王铮Silvia:扎克伯格专访:LIama-4不再是回合制聊天机器人,而是真正的“创作助理”!,2024-07-2253.CNBC:Meta 在 Nvidia 和云合作伙伴的帮助下推出最新的 Llama AI 模型,2024-07-2354.Meta:Meta AI现在是多语言的,更具创造力和智能,2024-07-2355.Interconnects:Llama 3.1 405B,Meta的AI战略,以及新的、开放的前沿模型生态系统,2024-07-2356.王铮Silvia:扎克伯格:开源AI是未来之路,2024-07-2457.Meta:使用AI Studio创建您自己的自定义AI,2024-07-2958.Meta:我们的新AI模型可以分割任何东西甚至是视频,2024-07-2959.王铮Silvia:黄仁勋对话扎克伯格全文:我们会有5年AI产品创新时间,下一代计算中,开放生态仍将胜利!,2024-07-3060.王铮Silvia:Meta财报透视AI如何改变社交与营销,Meta AI将成为全球使用率最高的AI助手!,2024-08-0150.AINLP:Meta关于深度学习推荐系统的Scaling Law的研究,2024-07-09版权声明:版权声明:本报告中的所有材料版权均属智能小巨人(北京)科技有限公司。未经智能小巨人(北京)科技有限公司事先书面授权,不得以任何方式修改、发送或者复制本报告及其所包含的材料、内容。所有本报告中使用的服务标识及标记均为智能小巨人(北京)科技有限公司服务标识及标记。本报告中的信息均来源于我们认为可靠的已公开资料,但智能小巨人(北京)科技有限公司对这些信息的准确性及完整性不作任何保证。本报告中的信息、意见等均仅供阅读者参考,不构成证券买卖的出价或征价邀请或要约。阅读者应当对本报告中的信息和意见进行独立评估,并应同时考量各自的阅读目的、财务状况和特定需求,必要时就法律、商业、财务、税收等方面咨询专家的意见。对依据或者使用本报告所造成的一切后果,智能小巨人(北京)科技有限公司均不承担任何法律责任。AI商业观察Vol.05感谢大家观看智能小巨人科技出品智能小巨人科技出品 2024/08/19智能小巨人科技原创报告
与可持续发展展望AIAI and Sustainable Development Outlook编委会司 晓丨腾讯副总裁 腾讯研究院院长杨 健丨腾讯副总裁 腾讯研究院总顾问翟永平丨腾讯SSV碳中和实验室高级顾问张 骁丨腾讯SSV数据与算法中心负责人刘玉龙丨腾讯青腾负责人任 颋丨北京大学汇丰商学院副院长郝 亮丨南方科技大学教授黄 平丨香港中文大学(深圳)国际事务研究院研究副教授 高级公共管理研修项目中心执行主任赵俊华丨香港中文大学(深圳)李 孜丨腾讯研究院吴海峰丨深圳高等金融研究院刘国龙丨南洋理工大学顾问主编策划王 强 王 鹏 柳文轩 王馨蕾 杨 超廖焕新 平依鹭编写委员张书文 丁子岳 孟祥瑞 朱一凡 叶于诚王家驹 谢丰泽 张 鹏 刘欣语 研究支持腾讯研究院 香港中文大学(深圳)腾讯SSV数据与算法中心 腾讯青腾联合出品前言FOREWORDAI与可持续发展:人机共生的研究与分析框架联合国2030年可持续发展议程强调“人类、地球、繁荣、和平与伙伴”,为全球提供了从传统发展模式向可持续发展模式转变的范式。2024年9月联合国未来峰会将进一步讨论人工智能、数字经济与可持续发展的关系。针对这样的背景,AI与全球可持续发展展望报告,将分析AI及大模型技术革新对对全球可持续发展的挑战与机遇。在21世纪,气候变化、AI技术进步与地缘政治的交融,正在深刻地重塑世界新格局,这将给我们带来什么挑战与机遇?如何构建一个跨学科,跨界的综合框架来支持分析与战略规划?AI与可持续发展展望旨在分析和探索“AI与可持续发展框架”关键层面,为新世纪格局的科技、社会、经济与政治叙事提供框架。从科技企业AI技术与产业领导的未来人机交互界面(海平面),从而提供产品抓手来影响世界的关键层面,衍生到“海平面”之下主导AI及机器世界的基础设施与基础协议层面,以及海平面之上影响人思考与行为模式的各个层面,共计8个层面从底层到顶层简要介绍:一.AI与可持续发展研究与分析框架李孜腾讯研究院资深专家图1 AI与可持续发展:人机共生的研究与分析框架AI与气候变化及全球碳中和层面前言FOREWORD这个层面强调了东西方之间新的核心共识,强调了碳中和的愿景,并强调了技术和价值观之间的关键交汇点。这个概念强调将环境和气候风险整合到新数字科技经济体系中,以促进可持续发展,减少气候变化的影响,并确保环境、经济和社会的协调发展。AI及大模型支持碳交易、碳捕获和碳储存等新模式是实现这一目标的关键工具。“碳中和”能否通过社会、经济和政治结构成为一项关键原则?AI与信息和通信技术基础设施层面信息通信技术构成了现代地理景观的基石。这个层面将技术堆栈分为技术基础设施、网络层、应用层和数据流。这些元素在信息传播、创新与社会变革中发挥着关键作用,但也在道德和隐私方面提出了挑战。信息通信技术如何涵盖技术设计和价值系统设计之间的跨学科研究,特别是在地缘政治中的新战略定位?AI技术革新气候变化人类地缘政治伦理1.意识形态2.民族3.国家5.隐私&分配7.1CT8.碳化&能源4.人机交互界面前言FOREWORDAI与世界数字ID系统和协议层面在这个层面上,重点是“世界ID和基础协议”的概念,通过标识、识别和数据管理,以及可编程的金融技术,特别是与碳中和逻辑集成的可编程金融系统,将强调人工智能时代的新工作模式与分配制度。该框架强调了隐私保护的必要性,并可能通过人工智能产业收益实验全民基本收入(UBI)的可能性?人机共生世界的基本问题是,我们如何在人类和人工智能之间进行区分,并建立一个全球数字身份系统?AI与人机界面层面,及“海平面”该层面侧重于与“人工智能与人的需求”的技术设计与产品的相关的问题,是当下绝大多数数字科技企业的发展方向。因此,需要一种平衡的方法来充分利用人工智能的潜力来促进社会的整体利益,同时解决透明度、公平性、教育和监管等问题。这个场面需要深入探索关键领域,如技术设计、人工智能技术的应用、决策、道德、教育和监管。作为一个强大的工具,人工智能如何在实现东西方之间新的全球共识方面发挥关键作用?AI与数据管理和资源分配层面定义和使用数据本身结构将在资源分配中做出决定作用?数据的定义、使用和共享或将决定数据产生的价值如何分配给不同的利益相关者,包括个人、企业和社会组织等。因此,数据管理不仅需要考虑个人隐私权,还需要考虑资源和公共管理,以确保公平性和可持续性。数据创造的商业和社会价值决定了其作为未来资源分配的关键因素的重要性。无论是在物质层面,如土地和自然资源,还是在虚拟层面,包括数据,它们都被认为是最重要的生产资料,需要高度重视数据和资源的重要性。技术协议设计如何深刻影响数据的定义与资源分配?前言FOREWORDAI与国家治理层面在过去与现在,由于非政府组织、跨国公司等非国家实体能够推动超越国家范围的变革和治理。在这一背景下,全球治理由上述非国家实体共同参与,作为国家机构的补充。同时AI及数字技术和网络,让个人和一些组织能够参与到构建、参与并支持其建立的虚拟机构或“云国家”中。这些虚拟机构不依赖于地理位置,而是基于在线通信和数字协议。个人和机构根据自己的价值观选择加入这些虚拟国家,并通过区块链等技术实现自治和治理。这种观点挑战了传统国家主权的概念,将治理下放至个人和社区层面。这些现象反映了AI与数字技术如何重塑了内部结构和治理的复杂性。一方面,数字技术促进了全球范围内的合作与治理,打破了传统国家边界;另一方面,它也提供了个人和社区自我组织和治理的新途径,挑战了国家的传统角色。AI及数字技术的兴起对传统边界和国家治理可能带来了哪些挑战?AI与民族认同纵观历史,民族身份和文明之间的竞争与合作的相互作用塑造了不同国家和地区的发展轨迹。中国历史上“华夷之辨”和西方罗马帝国文明的向心力等例子提供了这方面的历史经验。而当下社会发展的多样性和复杂性,需要我们更深入地思考AI对未来从文明体系到人类族群的演进的影响。我们应该如何看待民族在地缘政治中的作用,民族在地缘政治景观中发展新文明中的重要性?前言FOREWORDAI与价值观和道德伦理层面随着社会在应对气候变化和人工智能技术创新的同时,政治和经济系统正在经历根本性的转变。这包括政府决策对商业行为的影响、国际关系的演变以及全球新规范的建立。社会要求政府和企业采取更加负责任和可持续的行为,适应法律和法规的改革。这部分可以通过分析的四个主要因素即投资、计算能力的提高、算法效率的提升和如强化学习等技术带来的收益,由于对大模型研发的一个重要区域是美国,对美国的AI与大模型发展规模和效应做出合理判断,也是对中国有借鉴意义:人工智能时代将形成何种价值观和全球道德伦理体系?此外,国际社会正在努力构建一个全球性的未来议程框架,以解决气候变化、数字权利等跨领域问题。这种转变涉及到重新定义人类与AI及科技技术之间的道德关系,对治理结构和全球规范产生深远影响。它不仅要求我们重新思考技术发展与社会伦理之间的平衡,还涉及到如何在全球范围内协调行动,确保技术进步能够促进共同福祉,而非加剧不平等或环境破坏。这一过程需要跨学科的合作,包括法律、伦理学、政策制定、科技以及社会学跨界共同参与,以确保全球道德伦理体系的构建既符合人类共同利益,又能适应快速变化的技术环境。总之,在“AI与可持续发展展望”框架试图结构性的理解和分析气候变化,大模型技术革新与地缘战略中的复杂问题。在分析了“AI与可持续发展展望”的中长期框架后,未来几年的短期内AI及大模型技术突破是否可以支持AI与技术产业发展,社会与经济变革呢?二.AI及大模型技术革新前言FOREWORD1.投资 2024年2月10号,OpenAI首席执行官Sam Altman 提出计划筹资7万亿美元兴建包括GPU堆栈在内的AI方面的投资。事实上,大型科技公司一直AI研发上大幅增加资本支出。微软和谷歌的资本支出可能会超过500亿美元,AWS和Meta今年的资本支出超过400亿美元。由于人工智能的蓬勃发展,以OpenAI为代表的美国AI研发与应用的公司带动的相关资本支出总额将同比增长500至1000亿美元。同时,通过削减其他资本支出,这些企业将更多资金转移到人工智能上。此外,其他科技企业也在大力投入人工智能,例如特斯拉今年在人工智能上将花费100亿美元。更重要的是美国政府也将大力投资人工智能。美国今年在人工智能总投资预计可能达到1千亿美元。未来几年年,美国平均每年的人工智能总投资预计可能达到 1 万亿美元1,这个数字听起来令人难以置信。从 1996 年到 2001 年,美国在电信行业2在建设互联网基础设施上投资了近 1 万亿美元(按当时的美元购买力折算到今天)。可见,在重大技术革新时期,特别是基础设施方面的巨大投资,美国存在先例与可行性。但是,如果美国的人工智能投资达到每年 1 万亿美元,将占 美国2024年28.63万亿美元GDP 的约 3.5%,这也是巨大的。但是美国千亿级的投资已经开始,如Open AI、AWS、XAI、Google与Meta等公司在规划的GPA集群投资计划加在一起今年总和接近千亿美元。1SITUATIONAL AWARENESS的报告:https:/situational-awareness.ai/https:/sgp.fas.org/crs/misc/RL34645.pdf 2https:/ Epoch AI的公开估计来追踪从 2019 年到 2023 年的计算扩展,从 GPT-2 到 GPT-3 的扩展非常迅速,计算资源的使用也急剧增加,从较小的实验规模扩展到使用整个数据中心来训练大型语言模型。随着从 GPT-3 到 GPT-4 的扩展,需要为下一个模型构建全新的、更大规模的集群。然而,这种快速增长的趋势仍在继续。总体而言,Epoch AI 估计表明,GPT-4 的训练使用的计算量比 GPT-2 多约 3000 到 10000 倍。3.算法效率提高与硬件技术改进从在过去四年的公开数据分析,可以推断:从API成本分析,在明确区分训练成本或效率,和使用成本或效率(包括输入和输出),一般来说训练成本比使用成本大得多。从计算成本变化=算法效率变化*单位计算成本变化,可以推断出从 GPT-3 到 GPT-4 的单位计算成本下降或者效率提升是可能来总体来看,这只是长期趋势的延续。由于投资的广泛增加以及专门用于 AI 工作负载的 GPU 和 TPU 等芯片的开发,未来几年里,通过价值数百亿美元的GPU堆栈集群,将实现现在计算量的100倍,似乎非常有可能实现。通过建设超过 1000 亿美元的GPU集群,实现现在计算量的1000 倍的也显得可行。OOM(数量级,order of magnitude):a 个 OOM 指的是 10a图2 Epoch AI 估计表前言FOREWORD4.其他技术与方法(Unhobbling)通过人类反馈进行强化学习(RLHF)使模型变得真正有用和有商业价值。比如,RLHF让小型模型在用户偏好上等同于一个非RLHF的百倍大模型。思维链(Chain of Thought,CoT):在解决数学和推理问题时,CoT相当于超过10倍的计算效率提升。Scaffolding:类似CoT的增强版,不同模型分工合作解决问题。Tools:目前,ChatGPT可以使用浏览器、运行代码等,类似人类使用计算器或电脑。上下文长度(Context length):模型的上下文长度从GPT-3的2k到GPT-4的32k,再到Gemini 1.5 Pro的100万以上。更长的上下文可以有效提升计算效率。Posttraining improvements:当前的GPT-4通过后训练改进显著提升了能力,可以在推理评估中的表现大幅提高。Epoch AI 对一些技术(如 Scaffolding 和工具使用)进行了调查3,发现这些技术通常可以在许多基准测试中带来 5-30 倍的有效计算增益。METR(一个评估模型的组织)同样发现,通过优化相同的 GPT-4 基础模型,他们的代理任务性能得到了显著提升:从仅使用基础模型时提升了5%,到使用发布时的后训练 GPT-4 时提升了20%,再到今天通过更好的后训练、工具和代理脚手架,提升达到的近 40%。自于硬件设计的改进。多种大模型正在通过算法改进,计算成本下降与硬件设计已数十倍降低计算成本,而且这个趋势还在继续强化。甚至可能看到更多基础性、类似 Transformer 的突破,获得更大的收益。未来3年到4年,相对于 GPT-4,预期算法效率将提高 到当前算法效率的10到1000倍。3 https:/epochai.org/blog/ai-capabilities-can-be-significantly-improved-without-expensive-retraining前言FOREWORD5.美国能源是否支持AI及大模型和带来的工业发展前言FOREWORD在AI时代,如何定义可持续发展的内涵与外延?人工智能(AI)正以惊人的速度革新多个领域,其应用不仅重塑传统行业,还为全球性挑战提供解决方案。1.在能源领域,AI优化生产、管理和消费,提升效率与可靠性,减少浪费,提高可再生能源利用率。2.在应对气候变化方面,AI通过精准预测与分析,助力科学应对策略的制定,监测温室气体排放,评估政策效果,优化减排措施,并提供自然灾害预警。3.工业领域,AI推动工业4.0进程,实现生产智能化、自动化,提高效率,降低成本,优化供应链,精准生产计划,减少资源浪费。4.航天领域,AI技术在任务规划、飞行器控制、故障诊断与维护中提升精确性与安全性,加速科学发现和技术进步。AI的应用展现了其在解决全球性挑战、推动科技进步与提高生活质量方面的巨大潜力。AI与可持续发展”,试图为分析人工智能(AI)及其大模型技术在推动全球可持续发展中的挑战与机遇提出分析与决策框架。通过八个层面构建了一个较全面的人机共生的分析框架,包括AI与气候变化、信息通信技术基础设施、全球数字身份系统、数据AI及大模型技术突破与发展,AI及大模型技术对气候变化与碳中和的机遇与挑战,AI及大模型技术能否支持包括具身智能技术突破的工业全面变革,和AI及大模型技术对航天探索的影响。三.AI与可持续发展展望:AI及大模型技术对能源领域、气候变化领域、工业领域、航天领域的挑战与机遇四、小结前言FOREWORD管理、人机交互界面、国家治理、民族认同以及价值观和道德伦理。特别是AI在实现碳中和、优化资源分配、支持人机互动技术设计和产品发展、以及在全球治理中的重要性的分析,对AI与可持续发展议题做出中长期关键层面分析。对于短期及未来几年的AI与大模型技术是否可以突破的分析与判断中,强调了AI技术发展需要巨额投资,今年美国对AI的投资可能达1千亿美元。计算能力的显著提升和算法效率的大幅进步也将推动AI技术的快速发展。AI与可持续发展展望报告,作为“AI与可持续发展”的系列报告的第一份报告,探讨了AI在能源、气候变化、工业和航天等热点领域的应用,展示了AI在提升效率,支持科学决策和推动技术进步方面的巨大潜力。“AI与可持续发展”的议题的持续深入,需要跨学科合作,来适应快速变化的技术发展与环境变化。序言1PREFACE 1智能与绿色:迈向可持续发展的人工智能新时代陶大程澳大利亚科学院院士在人类文明史的浩瀚进程中,科技的每一次跃迁都如同星辰闪耀,照亮了我们通往未来的道路。今天,我们正身处于一场前所未有的技术革命之中,在过去的十年中,人工智能(AI)技术经历了飞速的发展,推动着我们所处的数字世界不断向前迈进。AI不再仅仅是学术讨论中的概念或实验室中的技术原型,而是已经深深嵌入到我们日常生活和商业运作的方方面面。人工智能的历史可以追溯到20世纪50年代,那时,计算机科学家们开始尝试开发能够模拟人类智能的算法和程序。从最早的符号主义AI到20世纪80年代的专家系统,再到21世纪初的机器学习,AI的发展经历了数次变革。然而,随着数据量和计算资源的不断增加,AI模型也逐渐从原本的“小而精”向“大而广”演进,以OpenAI的GPT(Generative Pretrained Transformer)系列为例,GPT-3,拥有1750亿个参数,能够生成极为逼真的文本,涵盖从技术文档到诗歌创作的各类内容。它不仅在NLP领域表现出色,还在跨领域应用中展现出非凡的潜力,例如代码生成、情感分析、甚至复杂问题的推理。在过去几年中,AI大模型领域不断涌现出新的研究成果和技术突破,GPT的发展可以视作AI大模型技术的缩影。GPT-1诞生于2018年,尽管其参数量仅为1.1亿,但已经展现出了通过自监督学习(Self-supervised Learning)训练的强大能力。GPT-2在2019年发布,参数量增长至15亿,极大地扩展了模型生成文本的流畅度和一致性。真正令业界为之震撼的是GPT-3,它不仅在规模上实现了跨越式增长,其在多任务处理上的表现也让人们开始重新审视大模型的应用前景。如今,随着GPT-4的发布,AI大模型的能力得到了进一步的提升。GPT-4不仅在自然语言处理上超越了前代,其在多模态处理、情感理解、推理能力等方面也取得了显著进步。在AI大模型的飞速发展中,GPT的训练耗费引发了广泛关注和讨论。每次GPT模型的训练都需要庞大的计算资源,背后则是成千上万的高性能服务器昼夜不停地运转。这不仅带来了巨大的能源消耗,还产生了相应的碳排放。这种资源消耗引发了许多人对AI技术在可持续发展背景下的适应性的质疑。举例来说,为了训练一个像GPT-3这样的大模型,不得不建立一个庞大的数据中心,在机房中,成千上万的服务器正散发着巨大的热量,冷却系统不断工作,以防止设备过热。这带来了一个挥之不去的问题:为了追求更强大的AI能力,是否正在以环境为代价?这些AI模型是否真的符合我们可持续发展的理念?在背后隐藏着人们对AI技术的深层次担忧。在现代社会,随着全球人口的增长和资源的不断消耗,环境保护和可持续发展已成为人类面临的最严峻挑战之一。面对气候变化、能源短缺、环境污染等一系列问题,传统的发展模式已难以为继。在这场AI技术与可持续发展的博弈中,如何找到平衡点,将成为未来发展的关键。一方面,研究人员开始探索更为环保的训练方法,如利用可再生能源供电、优化算法以减少计算需求,以及开发更加高效的硬件,以降低能耗。另一方面,在当前发展模式下,寻找新的技术手段以推动全球经济和环境的可持续发展,已成为各国政府、企业和学术界的共同目标。在这一背景下,人工智能作为新兴技术的代表,以其强大的数据处理能力和创新的解决方案,正逐步成为推动可持续发展的关键引擎,和其广阔的可持续发展应用前景相比,其本身训练和推理的消耗相对微不足道。序言1PREFACE 1序言1PREFACE 1AI的广泛应用在各个领域展现出巨大的潜力,尤其是在能源管理、环境保护、农业生产和城市规划等领域。通过智能化的决策支持系统,AI能够有效优化资源配置,降低能源消耗,减少碳排放,从而实现环境与经济的协调发展。例如,在能源领域,AI可以通过智能电网技术,实时监测和调整能源的供需平衡,提高能源利用效率,减少浪费和污染。此外,AI在环境监测和污染治理中的应用,也为环保工作注入了新的活力。通过卫星遥感数据和智能算法,AI能够精准预测气候变化趋势,并提出相应的应对措施,帮助政府和企业制定更为科学合理的环保政策。然而,AI在促进可持续发展方面的潜力远不止于此。随着技术的不断进步,AI将更加深入地融入人类社会的各个层面,助力全球实现更高水平的可持续发展。未来,AI有望在资源管理、生态保护、绿色金融等方面发挥更大的作用,为构建一个更健康、更美好、更可持续的地球提供强有力的技术支撑。我们期待通过报告的分享,引发更多的思考与讨论,共同探索AI与可持续发展相结合的无限可能。在这场关乎全人类命运的伟大征程中,AI不仅是一个工具,更是一种理念,一种推动社会进步与环境保护并重的新思维模式。未来的可持续发展道路,必然是在科技与生态的平衡中寻找最优解。我们坚信,AI将为全球可持续发展目标的实现带来前所未有的机遇,推动我们迈向一个更加繁荣、健康与可持续的未来。展望未来,AI大模型的发展将继续遵循规模化、精细化和多样化的路径。一方面,随着计算资源的进一步提升,模型规模还将持续扩大,性能也将更加出色。另一方面,AI模型的训练将更加注重效率和能源消耗,绿色AI的概念逐渐得到推广。在即将到来的AI时代,我们面对的不仅是技术的飞跃,更是对人类智慧和想象力的全新挑战。正如每一次科技革命一样,这场变革将深刻影响我们的生活方式、工作方式和思维方式。让我们以开放的心态迎接这一挑战,探索技术带来的无限可能,共同书写属于我们的智能时代新篇章。序言2PREFACE 2董朝阳香港城市大学电机系主任,教授领域,AI技术可以通过分析气象数据,预测太阳能发电量,并根据预测结果优化光伏发电设备的运行。在风能发电中,AI能够实时调整风机状态,最大化利用风能资源。这些技术提高了新能源的利用效率,加速了传统能源向可再生能源的转型。同时,AI在能源规划和政策制定中提供了科学依据,帮助政府和企业制定更合理的能源政策,推动碳中和目标的实现。然而,AI的潜力远不止于能源领域。在全球应对气候变化的过程中,AI已成为关键工具。气候预测模型正变得更加复杂和精准,依靠AI对海量气象数据的分析,科学家们能够更好地理解气候变化的规律,并制定更有效的应对策略。AI不仅能预测极端天气事件,还能模拟不同政策对全球气候的长期影响,从而帮助决策者做出明智的选择。同时,AI在气候变化研究中的应用也推动了新能源技术的创新,进一步减少了全球碳排放。在工业制造领域,AI也正在重新定义生产力。通过多模态大模型的应用,AI不仅能够优化生产流程,还可以在研发、设计、供应链管理等多个环节中发挥作用。AI在工业领域的应用已经极大地提升了生产效率和产品质量,同时减少了资源的浪费。未科技赋能,迈向可持续发展的新征程序言2PREFACE 2来,随着AI技术的不断进步,工业智能化将迈向新的高度,传统的制造流程将被更加灵活、高效、智能的生产方式所取代。这种变革不仅有助于提升企业的竞争力,也对实现全球的可持续发展目标起到了积极的推动作用。航天领域同样受益于AI技术的快速发展。通过大模型的应用,AI在航天任务的规划、执行和数据分析中扮演着越来越重要的角色。从优化火箭发射的轨迹,到精确预测太空天气,AI正在帮助航天工程师们以更高的效率和更低的风险完成复杂的任务。更重要的是,AI技术还在推进太空探索的步伐,通过对大量太空数据的分析和处理,AI有望揭示宇宙中更多未解之谜,为人类的未来探索铺平道路。本报告深入探讨了AI如何在多个维度上推动可持续发展。AI通过提升资源利用效率,有助于减少环境负担;在环境监测与保护中,AI发挥着不可替代的作用。通过对生态环境数据的实时监测和分析,AI技术能够帮助我们更好地理解环境变化的趋势,从而采取更加精准和有效的保护措施。AI在社会领域的应用,如智能化的教育系统和个性化的医疗服务,正在不断提升社会福利和人类福祉。这种技术进步不仅是为了提高生活质量,更是为了实现社会的公平与正义,使得每一个人都能够从中受益。当然,AI在可持续发展中的应用并非没有挑战。随着技术的快速发展,数据隐私和安全问题日益突出。此外,AI技术在应用过程中的不确定性和风险,也需要在开发和使用中保持高度警觉。然而,正如每一次技术革命一样,挑战的背后往往隐藏着巨大的机遇。展望未来,AI在可持续发展中的潜力无疑是巨大的。随着技术的进一步成熟,AI不仅将继续在能源、工业、航天等领域发挥关键作用,还将扩展到更加广泛的社会经济领域,推动全人类迈向一个更加智能、高效、环保的未来。AI的发展将进一步加速全球社会的数字化转型,带来新的经济增长点和就业机会,同时也将促使各国在可持续发展领域展开更加深入的合作与竞争。在这个瞬息万变的时代,AI作为技术革命的驱动力,不仅是解决当前挑战的有力工具,更是我们探索未来、实现梦想的重要伙伴。它将重新定义人类与自然的关系,促进生态文明的建设。期待在AI的助力下,我们能够共同迎接一个更加美好、更加可持续的未来,一个人与自然和谐共处的新时代。序言2PREFACE 2序言3PREFACE 3拥抱AI时代:释放创造力,让思考更深远翟永平腾讯碳中和高级顾问记得从上个世纪八十年代开始,因为广播、影视、纸媒、书籍等媒介趋于多元化,令人应接不暇,那时就常听到这是个“信息爆炸”的时代。此后随着互联网技术和应用的不断快速发展和迭代,毫不夸张的说,我们已经处于“信息大爆炸”的时代。“信息爆炸”乃至“信息大爆炸”本身不是坏事,怕就怕知识碎片化,使得系统性学习变得更加困难;更怕真伪难辨,被片面信息误导。过去很长时间以来,我都保持一个每天阅读两小时专业文献的习惯,并且做笔记、找脉络、看趋势,通过分析思考作出自己的判断。现在,人工智能(AI)来了:我今天的阅读清单上增加了这份由腾讯研究院与香港中文大学精心编写的报告AI与可持续发展展望。这份报告结构清晰、内容详实,不仅仅局限于单一领域,而是探讨AI技术能源、气候变化、工业和航天等多个关键领域的应用。报告介绍了基于AI的自动化、预测性维护和智能决策支持系统,这些系统能够提高生产效率、降低运营成本,为决策者提供科学依据,体现了AI在提升工业运营效率和可持续性方面的实用价值。报告通过多个具体案例,比如AI在智能电网、预测性维护、故障诊断等方面的应用,展示了AI技术的实际效果和价值。报告还涉及了航天领域,探讨了AI在自主飞行、卫星数据分析和空间探索等方面的应用。我曾长期在亚洲开发银行工作,特别关注AI在气候金融和可持续发展方面的应用。读到报告关于AI赋能气候金融的部分,感到眼前一亮。报告详细阐述了AI在气候金融方面的应用,包括数据分析和风险评估、个性化金融产品设计、资本流动和融资渠道的开拓、审批流程的简化等方面。AI技术通过高效处理和分析碳排放数据,评估环境风险,确保资金流向环保项目,对于金融行业在应对气候变化方面的决策和投资具有指导意义。报告也直面AI扩大应用可能面对的挑战,特别是AI自身能耗快速增加的问题。对此,报告提出了多种应对策略,包括软硬件协同创新,结合应用场景需求进行全栈设计和优化提高计算效率。同时,大力推动使用可再生能源,优化数据中心的能源供应结构,推动AI的可持续发展。读罢AI与可持续发展展望这份报告,真切感受到AI技术给我们的社会方方面面带来的巨大变化,也包括我们的工作和生活方式的改变。进入AI时代就要拥抱AI,借助AI工具来学习,现在自己每天阅读的那些专业资源的不需要两个小时了。但是,我认为再强大的AI也不会代替我们的思考和创造。换句话说,AI让人类有更多的时间来深度思考,可以释放更多的创造力推动社会的可持续发展。序言3PREFACE 3目录CONTENTS1p12p4背景介绍 BACKGROUNDNFORMATION能源 ENERGY3p14气候变化 CLIMATE CHANGE4p265p40工业 INDUSTRIAL航天 SPACEFLIGHT6p61总结与展望 SUMMARY AND PROSPECT2.1 丨引言2.2 丨AI在能源行业的应用现状2.3 丨AI推动能源转型2.4 丨AI增强能源安全2.5 丨总结与展望2.6 丨参考文献4.1 丨引言4.2 丨AGI技术及大语言模型的能耗分析4.3 丨工业领域具身智能的能耗分析4.4 丨能源系统对工业领域AI替代人工的 支撑能力分析4.5 丨AGI对劳动力市场的影响4.6 丨讨论与展望5.1 丨引言5.2 丨星际生活5.3 丨星际贸易5.4 丨航天领域的AI应用5.5 丨总结与展望5.6 丨参考文献3.1 丨引言3.2 丨人工智能协助区域级碳监测3.3 丨人工智能协助行业碳监测3.4 丨人工智能协助企业级碳计量3.5 丨多模态大模型集成分析环境表现3.6 丨气候金融3.7 丨总结与展望3.8 丨参考文献背景介绍01背景介绍BACKGROUND NFORMATION报告结构1.背景介绍6.总结与展望2.能源2.1 引言2.2 AI在能源行业的应用现状2.3 AI推动能源转型2.4 AI增强能源安全2.5 总结与展望3.气候变化3.1 引言3.2 人工智能协助区域碳监测3.3 人工智能协助行业碳监测3.4 人工智能协助企业级碳计量3.5 多模态大模型集成分析环境表现3.6 气候金融3.7 总结与展望4.1 引言4.2 AGI技术及大语言模型的能耗分析4.3 工业领域具身智能的能耗分析4.4 能源系统对工业领域AI替代人工的支撑能力分析4.5 AGI对劳动力市场的影响4.6 讨论与展望5.1 引言5.2 星际生活5.3 星际贸易5.4 航天领域的AI应用5.5 总结与展望AI图 1.1 报告总结构4.工业5.航天02背景介绍BACKGROUND NFORMATION在能源领域,AI通过优化能源生产、管理和消费,提升了系统的效率和可靠性。智能电网、预测性维护和能源储存优化等AI应用,有效降低了能源浪费,提高了可再生能源的利用率。此外,AI在能源交易市场中的应用,通过实时数据分析和预测市场趋势,帮助实现了更为灵活和高效的能源分配。人工智能(AI)技术正在以惊人的速度革新多个领域,其应用不仅改变了传统行业的运作方式,还为应对全球性挑战提供了新的解决方案。能源气候变化是当今全球面临的重大挑战之一,AI在这一领域的应用也展现出巨大潜力。通过分析气候数据,AI可以更准确地预测气候变化趋势,帮助制定更加科学的应对策略。此外,AI技术在监测温室气体排放、评估气候政策效果、优化减排措施等方面发挥着重要作用。AI驱动的智能系统还可以实时监控自然灾害,提供早期预警,从而减少灾害带来的损失。气候变化在工业领域,AI的应用推动了工业4.0的进程,实现了生产过程的智能化、自动化和优化。通过机器学习和数据分析,AI可以提高生产效率,降低运营成本,优化供应链管理。智能制造、机器人技术、质量控制和设备维护等领域的AI应用,使得生产线更加灵活高效,产品质量得到提升。此外,AI还可以通过分析市场需求和生产数据,帮助企业制定更为精准的生产计划,减少资源浪费。工业航天领域作为高技术和高风险行业,AI的引入同样带来了深刻变革。AI技术在航天任务规划、飞行器控制、故障诊断和维护等方面的应用,提高了任务执行的精确性和安全性。例如,AI可以通过分析大量飞行数据,预测潜在故障,提前进行维护,从而延长飞行器的寿命。自动驾驶技术、无人探测器和空间站管理等AI应用,使得航天探索更加高效和安全。此外,AI在处理和分析从航天器传回的大量科学数据方面也发挥了关键作用,加速了科学发现和技术进步。航天03背景介绍BACKGROUND NFORMATION能源04能源ENERGY图 2.1 AI助力能源发展结构图AI助力能源发展2.1 引言能源转型能源安全2.2 AI在能源行业的应用现状AI2.3 AI推动能源转型2.3.1辅助材料发现2.3.2 推动能源市场化2.4 AI增强能源安全2.5 总结与展望2.4.1提供实时信息感知与预测2.4.2辅助复杂系统控制与运行2.2.1能源生产2.2.2 能源输送2.2.3 能源消费2.1 引言随着全球对可持续发展和减少环境影响的关注日益增加,能源行业正处于一个关键的转型期。近年来,能源供应紧张和价格飙升引发了新一轮的能源危机,特别是在电力、煤炭和天然气领域。为应对这些挑战,各国政府和国际组织正在加速推动能源的绿色低碳转型,旨在减少对化石燃料的依赖,同时提高能源系统的可持续性和安全性。为深入推进能源革命,加快规划建设新型能源体系,中国已建成了全球规模最大的清洁发电体系,其中非化石能源的发电装机容量已超过50%。同时,中国政府强调,需要全面推动能源消费革命、供给革命、技术革命和体制革命,以建立一个清洁低碳、安全高效的能源系统。这不仅关系到碳达峰和碳中和目标的实现,也是推动经济社会全面绿色转型的关键措施。能源转型过程中,需要重点强调能源安全,在保障能源安全的前提下有序推进能源绿色低碳转型,加强转型中的风险识别和管控。在加快形成清洁低碳能源可靠供应能力基础上,逐步对化石能源进行安全可靠替代。这意味着新型能源系统不仅要能够应对供应中断、价格大幅波动的情况,还应当能够应对极端天气、重大事故、网络攻击等风险事件的冲击。考虑能源安全进行能源转型,加快构建清洁低碳、安全高效的能源体系,促进能源高质量发展和经济社会发展全面绿色转型,为科学有序推动如期实现碳达峰、碳中和目标和建设现代化经济体系提供保障。在完善能源绿色低碳转型过程中,AI技术因其对海量复杂多维数据的高效处理能力、优异的自适应与学习能力而被广泛应用于从生产到消费的整个能源链,推动了能源系统的高效、安全转型。特别地,近几年AI的高速发展让我们看到了AGI的实现可能性。AGI所具备的认知多功能性、自主学习能力以及推理解决问题的能力,将进一步助推能源转型进程,增强能源安全,为形成绿色、低碳、高效的能源体系提供强劲助力。05能源ENERGY2.2 AI在能源行业的应用现状2.2.1 AI在能源生产方面的应用为阐明AI在推动能源转型和增强能源安全方面的潜在作用和影响,本章节内容按照以下结构展开叙述:2.2章节阐述当前AI技术在能源行业的应用现状,接着,在2.3章节与2.4章节中,我们对未来AI在助力能源转型、增强能源安全方面的可能性进行展望,最后在2.5节中总结本章内容。AI技术是计算机科学的一个分支,旨在创建可以模拟人类智能行为的软件。通过算法和大量数据训练,AI可以学习到现实中某些特定场景的复杂模式和规律。同时,AI可以快速处理和分析庞大的数据集,高效准确地完成某些特定的复杂和重复的任务。AI所具备的这些特点使其可以有效解决能源领域的潜在挑战,提高能源的使用效率。目前,AI已经被广泛应用于能源的生产、输送以及消费各环节。同时,AI的迅猛发展也将为能源行业的进步再添助力。本节将介绍当下AI在能源领域的应用情况,为展望AI在能源领域的未来应用进行铺垫。在当今能源生产领域,AI的运用正在逐渐提高能源产量和效率。AI通过智能分析和预测,对降低能源生产成本、优化开采分配以及提高生产效率起到了不可忽视的作用。尤其是在风能与太阳能的利用上,以及在油气储量的计算与开采中,AI的应用正推动着能源行业的现代化和智能化发展1。在对新能源的利用上,以风电机组与光伏为例,AI的运用主要体现在三个方面。通过使用多种神经网络架构,目前行业内已经能够实现对风力和光伏发电量相对精确的预测。相对准确的预测数据极大地提高了发电企业的在前期选址策略的科学性,以确保前期投资的最优化2。AI提供的预测数据将直接影响发电机组运营策略的制定,对于寻找最优的机组组合与降低运营成本的策略十分重要,可以显著提升风电场的运行效率和能源产出4。此外,AI可以辅助风力发电系统的控制器调整,对风力发电系统进行健康监测,通过神经映射来识别故障模式,通过智能控制与辅助决策,保障风电机组的最优生产5。远景能源设计的一款基于AIoT技术风机的可以通过自我学习、自我进化、适应不同环境的能力。这款风机在机器学习的语境下,随着数据厚度的加深,使得风场的发电量反而有了上升的可能6。AI在传统的能源领域,例如油气开采的应用上正日益成熟。首先,在油气储量计算方面,AI技术通过分析大量的地质和生产数据,不仅提高了储量评估的准确性,还能分析地震数据和其他地质信息,以识别潜在的油气藏。种类繁多的机器学习模型,譬如支持向量机(Support Vector Machines)和人工神经网络(Artificial Neural Network),在提高油气产量预测的精确度方面的极大潜力7。合适的模型与数据集可以优化油气田的开发策略,有潜力将石油产量从6%提高到8%8。其次,AI技术的结合催生了智能油田的概念,通过数字化仪表和基于网络与模型的知识交换来优化油田的开采生产过程9。在生产过程中通过AI实现自动化与辅助决策,这不仅提高了作业效率,06能源ENERGY还能降低成本。此外,AI在提高油气开采稳健性上大有可为。通过预测性维护和状态监测,能源开发公司能够预防设备故障,减少意外停机时间,从而降低成本并提高生产力。据外网报道,Aker BP 与 Spark Cognition 的合作案例展示了AI在预测性维护中的应用,通过机器学习技术提前预警潜在故障,显著提高了能源生产效率10。AI在预测和防止油气管道故障方面发挥着关键作用1。AI可以利用大数据分析技术来识别管道系统中的潜在故障迹象。通过监测和分析传感器数据、运行日志、温度、压力和流量等参数,AI可以建立预测模型,识别管道系统中的异常模式,并预测可能的故障。通过历史数据来识别管道系统中的潜在风险和故障模式。还可以通过安装摄像头和使用计算机视觉技术,监测管道系统的外部和内部情况。这种技术可以帮助检测管道表面的腐蚀、裂缝或其他损坏,并及时采取措施修复。AI可以利用GIS数据和地形信息,结合管道所需的最优路径,进行路径规划11。通过分析地形、土壤类型、地质特征等因素,AI可以确定最佳的管道敷设路径,以减少对环境和生态系统的影响,并利用实时传感器数据、天气信息、交通情况等数据,动态调整管道路径。这种实时数据分析可以帮助管道运营商更好地应对突发事件和环境变化,确保管道系统的安全和稳定运行。AI可以利用机器学习算法和数据分析技术,对管道系统中的潜在风险进行预测和管理。通过识别风险因素,并采取预防措施,可以降低管道系统遭受外部威胁的风险,通过整合多源数据,包括传感器数据、气象数据、地质数据等,进行综合分析和预测12。通过综合考虑多种因素,可以更准确地评估管道系统的运行状态和风险,提高油气管道网络的韧性。AI在能源输送中展现出强大的潜力。例如大地量子依托自主研发的“地球时空数据云平台”,基于“遥感 AI”技术,提供全覆盖、准实时、高精度的常态化安全运行监测和预警服务,为油气管道安全运行提供智能化、标准化的稳定服务。华为推出了单端检测距离达50km的 DAS 设 备 Huawei OptiXsenseEF3000,可以被广泛应用到油气管道、周界防护等多种基于光纤的分布式振动监测场景。在电力领域,AI已成为智能电网的核心组成部分14,其对于预测消费者消费模式并相应管理能源分配具有不可或缺的作用。特别是,长短期记忆网络(LSTM)被广泛用于学习和预测能源需求,从而实现供应与需求之间的有效平衡,确保能源分配的高效性。根据瑞士公司ABB报道,该公司开发了一个AI支持的能源需求预测应用,该应用不仅帮助客户做出更精确的能源管理决策,还允许商业建筑经理通过利用时间使用率优惠避免高峰时段的电费15。在石油和天然气行业,AI的应用日益增多,特别2.2.2 AI在能源输送方面的应用2.2.3 AI在能源消费方面的应用07能源ENERGY是在用户行为分析和需求预测方面。AI可以通过分析历史和实时数据来预测未来的供应链需求16-17。AI技术如神经网络、回归分析和时间序列预测等,被用来优化库存水平并防止过剩或短缺的产生。根据路透社报道,壳牌公司便是一个典型例子,他们利用AI来预测未来的石油和天然气需求,从而优化库存管理并降低成本18。AI在煤炭行业的应用同样显示出其在预测和优化能源消耗方面的潜力。AI通过分析煤炭需求数据,可以预测市场趋势和价格变化,进而调整采矿作业和能源消耗,以适应市场需求19。例如,山东能源集团发布的新闻中提到,其与华为共同开发的盘古矿模型利用AI分析采矿过程中的各种数据,预测未来的需求趋势,并据此优化采矿作业,这不仅提高了资源利用效率,还降低了运营成本20。低碳能源转型中的一个重要主题是降低能源的生产成本,提高能源生产效率。一方面,新型材料的高效发现可以助推能源生产流程的优化,带来能源生产成本的大幅降低;另一方面,充分的市场竞争和活跃的能源交易系统,是促进能源生产系统降低成本,提高效率的关键方法。本节将具体讨论AI在降低能源成本、推动能源转型方面的应用前景。在能源转型的进程中,为了能够降低能源成本,发现并采用全新的能源材料至关重要。其可以在能源转型的多领域得到应用,包括电池储能材料、新式发电机材料和高效催化剂材料等。引入全新的能源材料有助于在各个方向上提高能源效率、降低制造和运营成本,并增强能源系统的灵活性。然而,传统的材料发现往往需要耗费大量时间和成本,同时存在成功率低和数据利用不足等问题,面临复杂性和不确定性的多重挑战。一方面,其从理论预测出发,到材料实际投产应用,整个过程往往耗时十数年,且实验合成和表征过程需要消耗大量人力和物力,成本高昂。此外,考虑到材料科学涉及众多变量和参数,理论模型往往难以全面描述实际情况,新材料发现通常是一个高度试错的过程,不仅成功率较低,同时也难以获得最优结果。随着AI的发展,这一难题有了切实可行的解决方案。在人工智能,特别是LLM的帮助下,材料发现得到了多方面的辅助。首先,LLM可以对文献和数据进行分析和挖掘,通过快速总结大量文献,从现有数据库中提取有效信息,帮助发现潜在的材料特性和应用。其次,利用生成模型,AI可以预测和生成具有特定性能的新材料结构。例如,通过设计分子结构实现特定的光学、电学或机械性质。AI还可以进行反向设计,根据给定的材料性能要求,帮助研究人员设计或优化材料的结构和成分。此外,基于已有数据和机器学习模型,AI可以预测新材料的性能,如强度、导电性和热稳定性等。这不仅可以优化实验设计,减少试验次数,还能大大缩短实验和计算模拟的时间和成本。总体而言,AI的应用极大地提高了材料发现的效率和成功率,为能源转型提供了强有力的支持。2.3 AI推动能源转型2.3.1 AI辅助材料发现08能源ENERGY在能源转型过程中,能源交易市场化是实现能源行业效率和成本优化的重要途径。通过竞争,能源市场可以更有效地分配资源,降低成本,同时确保利益合理分配和最大化社会福利。另外,从相对可控的化石能源向相对不可控的可再生能源的转型,需要我们建立更灵活且高效的市场环境,实现稳定的能源供应。然而,由于能源行业是社会生活中的核心行业之一,能源市场会受制于包括但不限于国际政治形势、气候变化等诸多不确定性因素的复杂影响,导致能源供需关系难以预测。另一方面,能源交易还受到市场主体的理性与非理性行为决策的影响,导致能源交易结果的不确定。因此,为建立一个灵活、可持续的能源市场体系,有必要对复杂社会环境下的能源市场进行准确建模与仿真,模拟不同场景下的能源市场交易过程,为市场体系的建设完善提供支撑。在能源交易市场中,LLM等新兴AI技术可以帮助提高对市场复杂外部性信息的处理能力,助力灵活高效的市场体系建设与完善。一方面,以LLM为核心的新兴AI技术能够处理和分析包括文字、图像和音频等多种格式的海量复杂多元数据,这使得市场参与者可以即时获取并理解市场的最新动态,如能源需求的变化、能源价格趋势和政策变动等,从而可以快速调整自己的策略,提高市场主体灵活性,帮助市场主体适应市场的变化,实现利益最优。另一方面,以LLM为核心的新兴AI技术还可以作为市场代理应用于市场仿真领域。通过对如能源、经济等特定的领域知识的学习,可以提高计算机代理对该领域知识的理解深度,结合LLM的泛化能力和逻辑思维,计算机代理将具备模拟真实市场主体行为的能力,真实反映市场主体对价格变化的敏感性,模拟不同偏好的市场主体在不同政策和经济环境下的市场反应,做出更真实的需求响应行为,实现现实能源市场的高精度仿真,帮助市场运营者更好地了解市场的可能动态,从而设计更有效的市场机制,制定相关政策。由于风、光等可再生能源具有强波动性、高不确定性的特点,增大了能源稳定持续供应的难度,使得在低碳能源转型过程中保障能源安全成为难点。克服可再生能源的不确定性带来的挑战,重点在于对能源供求情况的准确预测与对能源输送的灵活调节能力,建立灵活可靠的强韧性能源供应网络。本节将具体讨论AI技术在提高能源供应网络韧性、增强能源安全方面的应用前景。在能源领域,准确的预测可以促进供需平衡、优化资源分配、降低运营成本、提升能源管理和促进可再生能源利用。许多研究聚焦于能源领域的预测问题,其中负荷预测和新能源发电预测分别针对电力需求和可再生能源发电量,提供了关键的数据支持和决策依据,从而确保能源系统的高效、稳定2.4 AI增强能源安全2.3.2 AI推动能源市场化2.4.1 AI提供实时信息感知与预测09能源ENERGY和可持续运行。一方面,负荷预测作为传统的能源领域预测任务,可以帮助运营商制定合理的电力调度计划,确保电网稳定运行,并为需求响应计划提供支持,通过调整用户需求来平衡电网负荷。另一方面,随着风能、太阳能等可再生能源装机容量的提高,能源系统的复杂性和不确定性也在增加。新能源发电预测可以更好地整合可再生能源,确保电网的稳定运行,帮助电力调度中心制定合理的调度计划,提高新能源的利用率。近年来,大语言模型,如GPT-4和其他基于Transformer架构的模型,具备强大的自然语言处理和生成能力,受到了广泛的关注,尽管它们主要用于处理文本数据,LLM也能在能源预测领域发挥重要作用。同之前的深度学习相比,语言模型可以处理并融合不同类型的数据,包括以气象报告、新闻文章、技术文档和社交媒体内容在内的文本数据和卫星云图等在内的图片数据等,大语言模型可以处理并融合这些不同类型的数据,而这其中就可能包含对能源需求和供给有影响的重要信息。具体而言,大语言模型可以在下面几个方面较传统AI模型有所改进,例如在自然灾害方面,通过实时监控和解析有关地震、洪水和风暴等自然灾害的报道,LLM可以预测这些事件对能源基础设施的影响,并提供预警信息;LLM可以实时分析政府政策的变化,如环保法规的实施或能源补贴的调整,评估其潜在影响;此外,重大的社会事件(如大型体育赛事、政治活动或突发的公共卫生事件)也会显著影响能源需求,LLM可以实时跟踪这些事件的发展,分析其对能源需求的潜在影响;最后,通过整合和分析实时天气预报和用电记录等,LLM可以调整负荷预测,帮助电网公司优化电力调度。大语言模型在信息获取和处理方面的优势,能够显著提升能源预测的准确性和及时性。通过读取和理解网络信息,LLM可以实时跟踪和分析各种影响能源市场的因素,提供准确的预测和决策支持。这不仅有助于能源管理部门和企业应对复杂多变的市场环境,还能提高能源利用效率,推动能源行业的可持续发展。以AI为主的新型技术正在深刻改变能源系统,在能源的生产、运输、分配和供给环节通过预测性维护、优化、安全等多个角度推动数字化转型。这部分将以电力系统为例,具体阐述AI在其中的可能应用。电力系统运行中,调度员通常需要根据实时负荷偏差,通过操作票对发电机组、线路等设备进行人工调度修正。随着人工智能的不断进步,许多调度步骤可以结合以LLM为代表的新型AI技术来提高效率和准确性。在电力系统调度时,调度员通常以事故(或称扰动,小至如负荷偏差等高频率低影响扰动的发生,大至如发电机故障、线路短路等低频率高影响事故的发生)发生的时间为基准,将调度动作进一步划分为事前、事中、事后三个阶段的控制与响应。以下从事前、事中、事后三个阶段探讨AI的作用,分别对应风险预测、实时响应到事故后分析的全过程。2.4.2 AI辅助复杂系统控制与运行10能源ENERGY在事前阶段,即,电力系统处于稳定正常运行阶段时,AI的应用包括智能成票和业务场景生成等。在智能成票方面,AI可根据实时系统状态和预定的工作任务,自动编制出符合要求的操作票,解决目前依赖人力的流程步骤繁琐、核对量大等痛点。值得注意的是,LLM在写作辅助方面已表现出强大的上下文生成和泛化能力2122。经过特定任务微调后,LLM可以生成规范化的业务操作票,还可以利用检索增强生成(Retrieval-Augmented Generation,RAG)技术来提高生成结果的准确性。在业务场景生成方面,AI可以自动识别或预测当前电力系统的状态和需求,从而生成最适合当前条件的操作场景。通过分析现货市场等系统的数据,AI能够识别系统的运行状态或潜在问题,并提出预警和操作建议,包括计划停复电、断面控制以及事故处理方法等。在事中阶段,即,电力系统正在发生故障时,AI的应用主要包括电力系统故障诊断和系统恢复等。在故障诊断中,以设备故障诊断为例,传统方法主要依赖感应数据进行故障类型识别。然而,不同类型设备的监测数据和故障诊断方法差异较大,且数据量有限,加之环境、天气等外部因素难以全面采集,使得提出一个高效且广泛适用的算法极具挑战性。而LLM凭借其强大的泛化能力,有望解决这些难题。在小样本环境下,通过特定任务微调,可以利用LLM获取适用于不同设备的诊断模型。此外,LLM还能够基于诊断结果和系统状态自动生成故障诊断综合报告,从而减少后续决策的时间。在系统恢复方面,LLM可显著辅助输电和配电系统的恢复。例如,LLM可以根据调度员的需求,迅速生成配电系统恢复方案,并对输电网和配电网恢复方案进行安全综合评估。在维修过程中,LLM还可以通过语音和视频的方式,对现场维修人员进行操作指导和监督,确保操作的安全性和专业性。在事后阶段,即,电力系统从故障中恢复后,AI的应用主要包括系统恢复的状态辨识和调控策略等。在事后恢复阶段,快速而准确地辨识系统状态是确保电力系统平稳恢复的关键。传统的状态辨识方法依赖于人工分析和经验判断,既耗时又容易出错。而 AI,尤其是LLM,能够通过分析包括系统日志、调度电话录音、调度票等多模态信息,快速识别出系统的异常状态。例如,通过分析系统日志,AI可以检测到异常事件的发生和影响范围;通过对调度电话录音的分析,AI可以评估调度员的反应和处理情况,从而判断系统的当前状态。此外,LLM还可以从调度员的记录和反馈中提取关键信息,提供对系统状态的综合评估。而在调控策略方面,基于历史数据、已知调控策略和对调度员行为的分析和评估,AI可以识别操作中的不足之处,提出改进建议,从而优化调控流程和策略。复杂社会环境下的低碳能源转型会受到能源行业内部环境,以及能源相关行业,如交通、环境等外部环境的种种不确定性的干扰与影响。针对能源安全为前提下的能源转型所面临的挑战,本章节首先总结了AI在能源生产、输送和消费全链条的先进2.5 总结与展望11能源ENERGY应用,突出了AI在处理能源领域海量复杂数据时的优势。接着,结合近几年AI发展的新趋势,考虑泛化性更强、信息处理能力与逻辑推理能力更强的大型语言模型等新兴AI技术的巨大优势,报告进一步展望了AI在推动能源转型、增强能源安全方面的应用前景。具体地,报告展望了AI通过辅助材料发现、推动市场化进程推动能源转型进程,以及通过结合实时信息进行时间序列预测、辅助复杂系统运行等方法增强能源安全。通过本章内容,报告初步揭示了AI在能源领域的巨大潜能,展望AIGC以辅助清洁能源供应的方式为人类社会共建绿色地球做出贡献,建设美好未来。1 周孝信,陈树勇,鲁宗相,等.能源转型中我国新一代电力系统的 技 术 特 征 J .中 国 电 机 工 程 学 报,2 0 1 8,3 8(07):1893-1904 2205.DOI:10.13334/j.0258-8013.pc-see.180067.2 Sunil Kr.Jha,Jasmin Bilalovic,Anju Jha,Nilesh Patel,Han Zhang.Renewable energy:Present re-search and future scope of Artificial Intelligence.Re-newable and Sustainable Energy Reviews,2017,77,297-317.https:/doi.org/10.1016/j.rser.2017.04.0013 J.T.Dellosa and E.C.Palconit,Artificial Intelli-gence(AI)in Renewable Energy Systems:A Con-densed Review of its Applications and Techniques,2021 EEEIC/I&CPS Europe,Bari,Italy,2021,pp.1-6,doi:10.1109/EEEIC/ICPSEurope51590.2021.9584587.4 Chen Zhang,Tao Yang.Optimal maintenance plan-ning and resource allocation for wind farms based on non-dominated sorting genetic algorithm-II.Renew-able Energy,2021,164,1540-1549.doi:10.1016/j.-renene.2020.10.125.2.6 参考文献5 K.Bose,Artificial Intelligence Techniques in Smart Grid and Renewable Energy SystemsSome Example Applications,inProceedings of the IEEE,vol.105,no.11,pp.2262-2273,Nov.2017,doi:10.1109/-JPROC.2017.2756596.6 张子瑞.这家公司让风机变得更“聪明”.2019-07-09.厦门 大 学 能 源 学 院.h t t p s:/e n e r g y.x m u.e d u.c n/i n-fo/1013/1433.htm7 Anirbid Sircar,Kriti Yadav,et al.Application of ma-chine learning and artificial intelligence in oil and gas industry.Petroleum Research,2021,6,379-391.https:/doi.org/10.1016/j.petrores.2021.03.0028 Sachin Choubey,G.P.Karmakar.Artificial intelli-gence techniques and their application in oil and gas industry.Artificial Intelligence Review,2021,54,3665-3683.https:/doi.org/10.1007/s 10462-020-09 935-1 9 Hamzeh H(2016)Application of big data in petro-leum industry.Department of Electronics and Comput-er Engineering Istanbul Sehir University hamedhamze-hstd.sehir.edu.tr10 Aker BP Uses SparkCognition AI Solution to Accel-erate Productivity.Offshore Technology News,March 2 7,2 0 1 9.h t t p s:/w w w.o ffs h o r e-t e c h n o l o- 张继研,邴兆虹,等.人工智能在故障诊断中的应用研究J.辽宁大学学报2012,39(02):231-237.12 丛瑞,冯骋,沈晨,等.油气管道数字孪生技术应用J.油气田地面工程,2022,41(10):108-113.13 徐磊,侯磊,李雨,朱振宇,雷婷.机器学习在油气管道的应 用 研 究 进 展 及 展 望 J .油 气 储 运,2 0 2 1,4 0(2):138-145.14Aguiar-Prez Javier Manuel,Prez-Jurez Mara ngeles.An insight of deep learning based demand forecasting in smart gridsJ.Sensors,2023,23(3),1467.https:/doi.org/10.3390/s2303146712能源ENERGY15 ABB.(2019,November 6).ABB uses AI to revolu-tionize energy management.https:/ Seyedan Mahya,Mafakheri Fereshteh.Predictive big data analytics for supply chain demand forecast-ing:methods,applications,and research opportuni-tiesJ.Journal of Big Data,2020,7(53),Article 53.https:/ Colin Masson.Industrial AI:25 use cases for sus-tainable business outcomesJ.ARC Advisory Group,2023,technology trends.https:/ Reuters.(2023,May 17).Shell to use new AI tech-nology in deep sea oil exploration.https:/www.reu- MINING.COM.(2023,August 30).AIs potential role in the coal industry.https:/ 山东能源.山东能源和华为联合发布矿山领域商用人工智能大模型.2023-07-18http:/www.shandong- M Goodman,Erin Buehler,Patrick Clary,Andy Coenen,Aaron Donsbach,Tiffanie N Horne,Michal Lahav,Robert MacDonald,Rain Breaw Mi-chaels,Ajit Narayanan,et al.Lampost:Design and evaluation of an ai-assisted email writing prototype for adults with dyslexia.In Proceedings of the 24th In-ternational ACM SIGACCESS Conference on Computers and Accessibility,pages 118,2022.22Yue Zhang,Leyang Cui,Deng Cai,Xinting Huang,Tao Fang,and Wei Bi.Multi-task instruction tuning of llama for specific scenarios:A preliminary study on writing assistance.arXiv preprint arXiv:2305.13225,2023.13能源ENERGY气候变化14气候变化CLIMATE CHANGE图3.1 人工智能与气候变化议题3.1 引言人工智能技术正在迅速改变气象领域、气候变化研究和全球减排策略。过去,气象学家依赖于传统的统计模型和经验法则来预测天气,但这些方法受到数据量、数据精度和计算能力的限制。通过利用强大的数据处理能力和先进的算法,人工智能不仅提高了天气预报的准确性,还为气候变化研究提供了新的视角。人工智能通过深度学习等技术处理海量的气象数据,并发现隐藏在数据中的复杂模式。人工智能在气象领域的应用,不仅增强极端天气事件的预警能力,减少自然灾害带来的损失,还推动了气候模型的精细化和长期气候变化的研究。此外,通过分析气象数据和环境数据,人工智能可以帮助多行业制定更有效的资源管理和减排策略。人工智能技术不仅可以协助区域级、行业级、企业级碳监测,同时人工智能还可以赋能气候金融加速发展。随着大模型技术的应用,多模态大模型也可以集成分析多类环境表现,这一技术革命正在引领气象科学进入一个全新的时代,为全球应对气候变化提供了强有力的技术支持。为阐明人工智能在解决气候变化问题的影响和应用,本章节内容按照以下结构展开叙述:3.2、3.3、3.4章节分别阐述当前AI技术在区域级、行业级、企业级碳监测的应用现状,接着,在3.5章节中,我们对未来多模态大模型在环境表现评估的可能性进行展望。3.6章节中总结人工智能在气候金融领域的应用,介绍AI技术如何推进企业自主减少碳排放并实现绿色转型。AI助力气候变换议题3.2 人工智能协助区域级碳监测AI3.3人工智能协助行业碳监测3.6 气候金融区域碳计量定义和内容遥感卫星数据的应用3.4.1绿色金融结合企业碳计量3.4.2 基于人工智能的ESG评级多模态大模型概念大模型在气候变化研究的应用3.6.1气候金融的概念3.6.2 人工智能赋能,开阔气候金融新局面3.4 人工智能协助企业级碳计量3.5 多模态大模型集成分析环境表现3.3.1人工智能技术推动工业园区精准碳管理3.3.2人工智能技术推动电力行业精准碳管理3.3.3人工智能技术推动城市建筑碳管理3.3.4人工智能技术推动交通行业碳管理以数据处理为突破点,健全气候风险评估模式以资本流动为动力点,开拓气候投融资新渠道以简化流程为闪光点,加快气候融资审批效率气候建模环境评估辅助气候政策设计3.1 引言15气候变化CLIMATE CHANGE人工智能在实时监测和评估碳排放源方面展现出独特优势。通过结合多源、多模态数据和深度学习算法,人工智能能够从复杂的数据集中溯源关键的碳排放点。这些排放点包括工业设施、电力生产、钢铁厂排放、城市楼宇以及城市交通系统等。通过对这些数据的深度分析,人工智能技术可以精确定位和量化各个排放源的碳排放情况,从而为制定减排策略提供科学依据。人工智能技术技术在优化碳排放测量精度方面也显示出显著的优势。传统的碳计量方法主要依赖于碳捕捉和存储技术(CCS)的设计和操作,这些方法虽然有效,但其成本相对较高。而通过开发和应用先进的AI算法,可以以较低的成本实现更高精度的区域碳排放模拟和预测。人工智能技术算法能够综合考虑多种变量,进行复杂的计算和建模,提供比传统方法更精确的碳排放数据。这种高精度、低成本的碳排放监测和评估方法,不仅提高了环境管理的效率,还为减少温室气体排放提供了强有力的技术支持。通过利用人工智能技术,政府和企业可以更好地监控和管理碳排放,实现环保和可持续发展的目标。人工智能技术驱动的碳排放监测系统还能够实时更新和反馈,为应对突发的环境事件和制定长期的减排策略提供及时和有效的信息支持。碳卫星是一种专门用于监测和测量大气中二氧化碳(CO)及其他温室气体浓度的卫星。这些卫星利用先进的传感器和光谱仪,通过遥感技术从太空中捕捉地球表面和大气层的反射和散射光谱数据,从而精确计算出不同区域的温室气体浓度。碳卫星在应对气候变化、环境监测和科学研究中发挥着重要作用。碳卫星能够提供全球范围内高精度的二氧化碳浓度数据,帮助科学家和政策制定者了解不同地区的碳排放情况。例如,美国国家航空航天局(NASA)的轨道碳观测卫星(OCO-2)1 能够提供详细的二氧化碳浓度分布图,这些数据被广泛用于全球碳循环的研究。碳卫星可以协助气候变化研究,通过长期监测大气中的二氧化碳浓度,碳卫星可以用于究气候变化的趋势和影响。例如,欧洲空间局(ESA)的哨兵-5P卫星携带的TROPOMI光谱仪,能够监测包括二氧化碳在内的多种大气成分。科学家利用这些数据,对全球二氧化碳浓度的长期变化进行了深入研究,从而揭示了气候变化的趋势和影响。通过这些长期数据,研究人员能够更准确地模拟和预测未来的气候变化,并评估气候变化对环境、生态系统和人类社会的潜在影响。同时,通过分析碳卫星数据,研究人员能够识别出主要的碳排放源,如工业区和城市,用于评估不同地区的碳排放量。例如,基于深度学习技术,文章 2 建立模型处理OCO-2等碳卫星数据,对碳排放进行溯源。该模型基于风速、碳卫星数据和电厂用电数据,能够自动识别和溯源不同的排放源,极大提高了数据分析的效率和精度。通过此类算法,AI能够处理和分析大量复杂的遥感数据,提取出有价值的信息。碳卫星高精度数据,使得科学家能够更准确地理解碳排放的动态变化和空间分布,识别大气中二氧化碳浓度的微小变化,并将这些变化与具体的地理区域3.2 人工智能协助区域级 碳监测基于人工智能技术分析遥感卫星数据16气候变化CLIMATE CHANGE和时间段关联起来。通过与人工智能技术的结合,碳卫星还能够实现实时监测和预警功能。AI系统可以实时分析最新的卫星数据,识别出异常的二氧化碳浓度变化,并及时发出预警。例如,在2019年亚马逊森林火灾期间,碳卫星与AI技术的结合使得科学家能够迅速检测到火灾导致的二氧化碳排放增加,从而为政府和救援机构提供了重要的决策支持。这对于应对突发的环境事件,如森林火灾或工业事故,具有重要意义。碳卫星提供的数据不仅用于科学研究,还可以应用于环境监测和政策制定。通过对大气中的二氧化碳和其他污染物数据的分析,政府能够更准确地评估各地的空气质量状况,并制定相应的环保政策。人工智能技术可以帮助政府和环保机构更有效地监控空气质量,评估减排措施的效果,制定和调整环境政策。例如,通过监测工业区和城市的二氧化碳排放,政府可以优化城市规划和产业布局,推动绿色发展。在环境监测和管理中,可以综合使用卫星数据、无人机数据和企业用电量数据。人工智能算法通过整合和分析这些多源数据,能够有效识别工业设施的超标排放和异常排放事件,展现出强大的应用潜力。人工智能算法能够整合碳卫星的区域排放数据、无人机获取的高分辨率环境数据以及企业的用电量数据。这种多源数据的综合分析,能够提供对工业设施排放情况的全面了解。例如,碳卫星提供了大范围、高精度的二氧化碳和其他温室气体的浓度数据,而无人机则可以在低空拍摄,捕捉工业园区和特定排放源的精细图像和视频数据。企业用电量数据则反映了生产活动的强度和模式,结合这些数据,人工智能算法可以更精确地识别排放源和排放量。人工智能技术可以对工业烟囱的排放物质和浓度进行持续监测。通过深度学习和机器学习算法,人工智能技术能够实时分析排放数据,识别出不符合环保标准的排放行为。例如,当烟囱排放的污染物浓度超过设定的阈值时,人工智能技术会立即生成警报,并提供详细的排放报告。这些报告包括排放物质的种类、浓度、持续时间等关键信息,帮助工业园区了解问题的严重性和具体情况。此外,人工智能技术通过整合分析多源数据,提供更丰富实时的环境数据指导和支持,可以帮助工业园区企业迅速采取修正措施。例如,人工智能技术可以实时分析哪些具体的生产环节或设备可能导致超标排放,工业园区根据这些信息及时调整生产工艺或维护设备,避免进一步的环境污染。这种实时、精准的监测和反馈机制,使工业园区能够更主动地进行环境管理,提高了环保合规性。通过人工智能的辅助,环保监管变得更加高效和智能。为了实现双碳发展目标,支撑新型电力系统发展,人工智能技术在实现智能电网中发挥着关键作用,通过数据分析、深度学习、优化算法和实时监3.3 人工智能协助行业碳监测3.3.1 人工智能技术推动 工业园区精准碳管理3.3.2 人工智能技术推动 电力行业精准碳管理17气候变化CLIMATE CHANGE控等多种技术手段,使得电力生产、传输、分配和消费更加智能化和高效化,提升电网的效率、可靠性和可持续性。此外,人工智能技术在电网碳排放因子实时计量中发挥了至关重要的作用。通过综合应用传感器技术、数据分析、机器学习和深度学习算法,人工智能技术能够实现对电网排放因子的高精度实时监测和计量,为优化电力生产和减少碳排放提供了科学支持。人工智能技术可以全面且实时地监测和收集发电设备的运行状态、燃料使用情况、排放数据、电网负载和天气条件等多种信息,通过设计算法提取出有用的信息和特征,分析各类发电机组(如燃煤、天然气、风能、太阳能等)的排放数据,并结合电网负载和天气情况,计算出不同条件、不同时段、不同节点对应的电力排放因子。通过机器学习和深度学习算法,人工智能技术还可以对历史数据进行深度学习,从而预测不同时间段和负载条件下的电网排放因子。这种预测能力使电网运营商能够提前调整电力生产和分配策略,优化发电资源的使用。例如,在预测到高负载时期,人工智能技术可以建议优先使用低排放的可再生能源,减少高碳排放的化石燃料发电量。人工智能技术技术的应用不仅限于排放监测,还包括优化电力生产和资源利用。对于电力生产,人工智能技术能够分析发电过程中的碳排放效率,并优化发电设施和用电设备的运行。通过对历史排放数据和运行参数的深入学习,AI模型可以预测特定负载和天气条件下的最佳运行策略,从而最小化碳排放。通过对各种数据的实时分析,人工智能技术可以动态调整电力生产策略,确保能源利用效率的最大化。例如,AI可以在电力需求高峰期建议增加可再生能人工智能在协助建筑楼宇实现节能方面,发挥着重要作用。首先,基于人工智能技术的数据集成系统可以通过传感器和智能电表收集建筑实时能源使用数据,并对此类数据进行实时分析,识别能源使用模式和趋势。基于分析结果,人工智能技术可以优化楼宇的能源使用,例如调整供暖、通风和空调系统的运行,以减少不必要的能源消耗和碳排放。人工智能技术还可以设计并支撑楼宇对可再生能源的智能使用,比如预测设备维护需求和能耗需求,智能优化用电设备的使用时间,并通过智能控制系统提供实时反馈和建议,帮助用户优化能源使用。通过集成人工智能技术的建筑管理系统,实现了全面的楼宇能源管理,在满足楼宇住户舒适度和功能需求的同时,最大限度地降低碳排放。此外,人工智能能够赋能建筑楼宇降低碳排放,动态响应电网的碳排放水平。间接排放是建筑楼宇的主要碳排放来源,此类排放主要是由建筑楼宇用电、用热产生。要想实现建筑楼宇的碳排放量优化,则需要精细化管理楼宇用电水平和用电时间。基于碳排放成本的负荷响应作为先进的电力管理技术,可以协助楼宇管理碳排放,通过动态调整电力负荷到电网碳排放强度低的时刻,从而最小化企业间接碳排放量。该技术结合实时碳排放数据和电力负荷需求,利用人工源的使用,并在需求低谷期优化传统能源的使用,以平衡电网负载和降低碳排放。3.3.3 人工智能技术推动 城市建筑碳管理18气候变化CLIMATE CHANGE智能和机器学习算法,可以对建筑楼宇此类用电用户的能源使用进行智能管理和优化,在电网负荷高峰期或碳排放较高时,降低楼宇非关键设备的运行或推迟高能耗设备的使用。人工智能算法可以参与规划楼宇内高耗能设备在低碳时段运行,预测电网实时碳排放因子,减少整栋建筑楼宇碳排放,减少相应的环境成本。对于城市交通系统,人工智能可以通过分析交通流量数据、车辆类型和路线信息来监测和评估交通引起的碳排放。人工智能技术在城市交通系统中的应用,显著提高了碳排放监测和管理的效率。在城市交通系统中,交通信号控制的优化是减少交通拥堵和车辆排放的重要手段。AI技术可以实时分析交通流量数据,动态调整交通信号灯的时间和协调性。例如,洛杉矶市的智能交通系统利用人工智能技术分析交通流量和车辆数据,在高峰期动态调整信号灯时间,结果减少了30%的交通拥堵,显著降低了车辆的碳排放。通过分析车辆的使用模式和排放特征,AI技术可以帮助城市交通管理者制定更加精准的减排策略。人工智能可以预测不同时段和不同区域的车辆需求,优化公共交通调度,减少空驶和过度拥挤的现象。遥感卫星数据在交通行业的碳计量中也具有重要作用,通过提供高分辨率的地理和环境数据,使得碳排放的预测和监测更加精准和高效。此类数据通过人工智能技术进行处理和分析,能实现对交通行业碳排放的精准计量。AI技术可以分析卫星影像数据,识别和分类不同类型的交通工具(如汽车、卡车、公共交通工具),并计算它们在特定区域和时间段内的流量,这些信息对于估算碳排放量至关重要。通过对道路和交通基础设施的使用情况进行监测,AI系统可识别高使用率和高排放的道路段。结合车辆类型和流量数据,系统能够精确估算每条道路的碳排放量。此外,遥感数据还可以用于监测交通活动对环境的影响,如空气质量和噪音水平。通过分析这些数据,可以评估交通排放对环境和公共健康的影响,并提供相应的改进建议。人工智能技术通过整合来自遥感技术、地面测量和卫星数据的多源信息,不仅能为区域进行高精度碳计量,更针对企业所需要的范围一、范围二、范围三计量数据进行更多补全。目前市场受限于企业级碳排放数据颗粒度低、数据标准不统一、数据更新滞后的局限,同时缺少受国际认可且数据覆盖全面的企业级碳排放数据库。通过利用人工智能技术,可以自动分析企业多类环境数据(包括企业自主披露环境数据、电力排放因子、企业用电数据、碳卫星、卫星图像等数据),精确地定位企业碳排放的来源,实时监测企业的直接/间接碳排放情况。企业级碳排放数据通过对企业自主披露数据和其他多源测算数据的融合与交叉验证,将重新校验企业范围一、范围二排放值,显著提升企业排放披露数据的准确度和计量科学性。此外,企业电力大数据深度反映了其生产运行方式,通3.4 人工智能协助企业级 碳计量3.3.4 人工智能技术推动 交通行业碳管理19气候变化CLIMATE CHANGE人工智能技术可以高效地处理和分析大量的碳排放数据。通过对企业的生产、运输和能源使用等环节的碳排放数据进行全面分析,人工智能技术可以精确计算出企业的碳足迹。这种精确计量对于绿色金融机构评估企业的环保表现至关重要,确保资金流向环保效益显著的项目。过分析其电力数据厘清其内在特性,可以实现企业的实时碳排放计量。通过可视化工具,可以直观地分析和比较不同企业、行业和地区的碳排放情况,可协助企业进行碳管理和制定碳交易决策从而实现碳中和目标。企业级高精度碳排放数据便于协助企业进行碳管理和制定碳交易决策,从而实现企业碳中和目标。人工智能技术能进行企业碳排放趋势分析和预测,帮助企业制定长期的环保策略。通过分析碳卫星数据,不仅能够实时识别工业设施的超标排放和异常排放行为,还能提供帮助企业迅速采取修正措施。对于监管机构来说,AI提供的精准数据和分析结果,可以大大提升监管的效率和效果,减少漂绿、洗绿现象。这种高效、精准的环境监测和管理方式,为实现可持续发展提供了强有力的技术保障。基于人工智能的企业绿色金融,正在成为推动可持续发展的重要手段。绿色金融致力于为环保项目、可再生能源、能源效率和其他可持续发展领域提供资金支持,而通过人工智能技术对企业碳排放进行精确计量,可以确保资金流向真正环保的项目,并提高投资决策的科学性和透明度。绿色金融的核心理念是通过金融手段推动环境保护和可持续发展。这包括为低碳项目、清洁能源、环保技术和可持续基础设施提供融资,以及鼓励企业和机构减少碳排放。绿色金融旨在通过市场力量促进环境友好型经济的转型,推动全球气候目标的实现。3.4.1 绿色金融结合企业碳计量碳排放数据分析人工智能技术可以帮助金融机构评估环境风险和气候变化对投资项目的影响。通过分析历史数据和环境变化趋势,人工智能技术能够预测未来可能的环境风险,帮助金融机构制定更科学的投资策略。例如,人工智能技术可以基于跨域多源数据,识别出高碳排放企业的潜在环境风险,建议金融机构规避高风险投资。绿色债券(绿债)是一种专门用于资助环保项目的债务工具,旨在推动可持续发展和应对气候变化。企业发行绿色债券可以获得多方面的优势,其中包括但不限于降低资金成本、提升企业形象、吸引长期投资者和提高市场竞争力。目前,全球首只结合“碳卫星”、“碳无人机”等技术认证的绿色债券于港交所成功发行4。深圳市人工智能与机器人 研 究 院 和 深 圳 数 据 经 济 研 究 院 团 队 将“碳 卫星”、“碳无人机”等先进技术结合人工智能算法,实现了企业范围一、二和三的碳排放数据计量。通过资金驱动的绿色金融手段,促成了企业对风险评估和管理20气候变化CLIMATE CHANGE自身碳排放信息的主动披露。此次合作既是对国内外碳排放披露要求日趋强制化的正面响应,也是企业积极践行国家“双碳”战略要求的重要体现。该SPO报告框架符合国际绿色金融市场规则、数据采集完整合理、技术来源科学有效。环境、社会和治理(ESG)评级是评估企业在环境保护、社会责任和公司治理方面表现的重要指标。随着可持续投资理念的普及,投资者和监管机构越来越重视企业的ESG表现。基于人工智能的ESG评级技术,通过高效处理和分析大量数据,为企业提供更加全面、精准和客观的ESG评级,推动了可持续发展。基于人工智能的ESG评级系统通过多种途径收集和整合企业的ESG相关数据。在环境方面,人工智能技术能够利用传感器、卫星遥感和物联网设备,实时监测企业的碳排放、能源消耗和资源使用情况。此外,人工智能技术还可以监测企业在生产过程中的污染物排放,包括废水、废气和固体废物等数据。社会数据的收集则包括员工福利、劳动条件、健康与安全等信息,这些数据可以通过企业内部系统和第三方调查获取。同时,人工智能技术可以评估企业在社区发展、慈善捐助和社会公益等方面的表现,通过社交媒体和新闻报道获取公众反馈。治理数据的收集涉及企业的董事会构成、管理层薪酬、股东权益保护等治理结构信息,以及企业的法律合规情况、财务透明度和信息披露质量,这些数据可以通过新闻、法律文献和监管报告获取。3.4.2 基于人工智能的ESG评级人工智能技术通过机器学习和自然语言处理(NLP)等算法,对收集到的ESG数据进行深度分析和处理。人工智能系统能够高效处理海量数据,快速提取有价值的信息,避免人工分析带来的主观偏差和效率低下。利用NLP技术,人工智能技术可以对新闻报道、社交媒体评论和公众意见进行情感分析,了解社会舆论对企业ESG表现的评价。此外,通过机器学习算法,人工智能系统能够识别企业ESG表现的历史模式和趋势,预测未来的ESG风险和机会。基于人工智能的ESG评级模型结合多种数据源和分析方法,构建科学、客观的评级体系。该模型将环境、社会和治理三个维度的表现进行量化评分,综合评估企业的ESG表现。根据不同行业和地区的特点,人工智能技术可以动态调整各个维度的权重,确保评级结果的公正性和准确性。同时,人工智能技术能够实时更新ESG数据和评级结果,反映企业最新ESG表现,提供及时、准确的评级信息。基于多模态数据的大模型分析仍是一个前沿的应用领域,它利用人工智能技术处理和分析多种类型的数据,从而提供更全面和深入的环境表现洞察,目前主要应用在计算机视觉领域。而多模态数据分析涉及将来自不同来源的数据集成到一个分析框架中。这种集成允许模型从多个维度理解和预测环境现象,如气候模式、极端天气事件和生态系统变化。借助强大的计算能力,大模型(如深度学习网络和集成学习系统)能够处理和分析大规模的数3.5 多模态大模型集成分析 环境表现21气候变化CLIMATE CHANGE过精确的碳排放量计算,确保碳信用的公正和有效交易。在城市规划中,模型可以预测不同规划方案对碳排放的影响,支持低碳城市建设。多模态数据大模型大大增强了气象变化研究和碳排放计量的能力,为应对全球气候变化挑战提供了强有力的技术支持。据集,识别其中的复杂模式和关联。这些模型可以自动调整和优化,以提高预测的准确性和可靠性。多模态数据大模型在气象变化研究,特别是在碳排放计量方面,可以发挥重要的作用。首先,多模态数据大模型能够整合和处理来自多个来源的多种类型的数据,包括卫星图像、地面气象观测数据、海洋和大气传感器数据以及社会经济数据。卫星图像提供全球范围内的碳排放信息,包括森林砍伐、城市扩张等。地面气象观测数据提供精确的温度、湿度、降水量等信息,有助于理解局部气候变化的影响。海洋和大气传感器数据监测海洋中的二氧化碳吸收量以及大气中温室气体的浓度。社会经济数据包括能源消耗、工业活动、交通运输等,可以直接反映人类活动对碳排放的贡献。多模态数据大模型利用深度学习和集成学习技术,可以在大规模数据集上进行训练。这些模型能够自动学习和识别数据中的复杂模式和关联,提高对碳排放的预测精度。例如,深度学习网络通过多个层级的神经网络,可以捕捉到碳排放与环境因素之间的非线性关系。集成学习系统则结合多个模型的预测结果,能够减少单一模型的误差,提高预测的稳定性和可靠性。此外,多模态数据大模型为环境政策的制定和评估提供了科学依据。通过模拟不同减碳措施的效果,模型能够帮助政策制定者选择最有效的减排策略。利用实时数据监测政策实施后的实际效果,确保减排目标的实现。例如,在碳交易市场中,多模态数据大模型可以帮助建立和优化碳交易市场,通3.6.1 气候金融的概念3.6 气候金融气候金融,也被称为气候投融资,是国际社会为应对全球气候变化而实施的一系列资金融通工具和市场体系、交易行为及相关制度安排的总称。当前的金融市场对气候金融尚未存在统一的定义,但可大致将其分为狭义气候金融和广义气候金融。狭义的气候金融概念主要聚焦于具有制度创新性质的碳交易制度,将碳排放权(排放配额)及其衍生产品视为商品,并允许其进行交易。广义的气候金融除了涵盖传统金融活动的改造升级,还涉及为应对气候变化而采取的各类直接和间接金融交易活动,并涵盖了为低碳转型活动提供资金支持的金融活动,亦或是开发可再生能源等各类有利于气候保护的业务开展,例如高碳技术产业升级或是太阳能板安装等,旨在满足低碳发展的各项投融资需求。2020年10月,生态环境部、人民银行等五部委联合发布了关于促进应对气候变化投融资指导意见,正式对气候投融资进行了明确的定义:22气候变化CLIMATE CHANGE注:该图说明了ESG评级差异。横轴表示作为每家公司基准的Sustainalyt-ics评级值(n=924)。其他五位评分者的评分值以不同颜色绘制在纵轴上。对于每个评估者,值的分布已归一化为零均值和单位方差资料来源:Aggregate Confusion:The Divergence of ESG Ratings图1 ESG评级差异而人工智能的出现,为应对此类困难带来了突破性的变革。一是人工智能能够提升对气候数据的处理能力。在评估企业气候风险时,不但需要同时处理大量的数据,还要确保数据的质量,并对数据做一定的保密处理。二是运用集成人工智能的终端可以实现全流程自动化。集成了人工智能的信息终端能够实时采集企业的碳排放数据,建立完整的数据库,为金融机构、企业和监管部门提供数据信息服务。在此基础之上,人工智能能够通过整合现有数据,并结合不同地区的环境情况,自动建立符合当前地区的多维风险模型,提升气候风险评估与预测的精准度5。“气候投融资是指为实现国家自主贡献目标和低碳发展目标,引导和促进更多资金投向应对气候变化领域的投资和融资活动,是绿色金融的重要组成部分”。该指导意见将气候金融的活动范围分为减缓气候变化和适应气候变化两个部分。尽管国际上对气候金融的定义还没有形成统一的意见,但是发展气候金融的主要目的是一致的,即通过满足碳密集型行业绿色转型的资金需求来应对气候变化。气候金融是可持续金融的重要组成部分,通过引导市场资金流动从而降低气候变化带来的风险,减少温室气体排放,助力国家达成碳达峰、碳中和的战略目标。当前,业界在气候风险评估领域普遍面临一项挑战,即对于企业投资项目所产生的碳排放量难以进行精确预测,对企业的ESG评级标准也存在较大差异(见图1)。由于缺乏标准化的气候风险数据和评估方法,这不仅导致监管机构不能有效追踪企业的ESG动态,同时也使得银行在发放绿色金融贷款时无法准确评估企业的相关能力,进而制约了企业低碳转型的进程。3.6.2 人工智能赋能,开阔气候金融新局面(一)以数据处理为突破点,健全气候风险评估模式23气候变化CLIMATE CHANGE气候适应性融资在大多数国家仍然存在巨大的缺 口。联 合 国 秘 书 长 安 东 尼 奥 古 特 雷 斯(Antnio Guterres)在首届气候脆弱金融峰会上提到:“每年只有167亿美元的气候融资被用于环境适应和复原,但是发展中国家的适应成本为每年700亿美元,并且可能会在2030年提升至3000亿美元6。”靠国际公共资金无法填补这一缺口,政府也无法在不增加财政空间的情况下大规模吸收贷款融资。人工智能可以利用卫星图像、手机数据、传感器信息、无人机拍摄画面以及地理标记的社交媒体内容等多样化的替代数据来设计个性化的金融产品,进而吸引投资者通过购买相关金融产品的方式参与气候投融资活动。以银行为例,其可依托农作物生长情况的遥感监测数据以及农民的交易历史记录,对农民的信用风险水平进行全面而准确地评估,进而为符合条件的种植作物或耕作技术改进项项目提供专门的贷款支持。相较于传统的信用评分机制,人工智能算法在解析替代数据方面能够展现出更高的精确性和效率,从而有效推动气候金融领域的创新与发展。此外,在农业保险领域,农民购买保险产品后,保险公司可利用人工智能技术对气象站实时监测的天气触发因素进行精准识别,实现自动化索赔处理,提升保险服务的便捷性和准确性。气候融资流程一般基于标准工作流程,此类工作流程往往是简单但重复的,例如收集文件、验证资格、管理合规性等。以人工的形式对这些资料进行审核,不仅会极大地降低融资审批效率,也容易出现审核失误等非系统性风险。利用人工智能处理这类较为繁琐的流程,能够提高审批效率,还能最大限度地减少人工失误。例如通过人工智能自动处理非结构化数据,并从中提取关键信息进行填单,在减轻员工工作量的同时降低了贷款方的操作难度。另一方面,这种全自动的信息处理提高了气候融资流程的标准化程度,增强了信息透明度,还能降低银行的管理费用,使银行在风险控制和业务扩张之间找到更加平衡的发展路径。人工智能技术正迅速改变气象领域、气候变化研究和全球减排策略。传统气象学因数据和计算能力有限,而人工智能利用其强大的数据处理和先进算法,提高了天气预报的准确性,并为气候变化研究提供了新视角。通过深度学习处理海量气象数据,人工智能发现了隐藏的复杂模式,增强了极端天气事件的预警能力,减少了自然灾害损失,推动(二)以资本流动为动力点,开拓气候投融资新渠道(三)以简化流程为闪光点,加快气候融资审批效率24气候变化CLIMATE CHANGE3.7 总结与展望1 Crisp,David.Measuring atmospheric carbon diox-ide from space with the Orbiting Carbon Observato-ry-2(OCO-2).Earth observing systems xx.Vol.9607.SPIE,2015.2 章政文,顾津锦,赵俊华,等.基于碳卫星与电力排放数据的碳计量J.电力系统自动化,2024,48(1):2-9.DOI:10.7500/AEPS20230314004.ZHANG Zhengwen,GU Jinjin,ZHAO Junhua,et al.Carbon Measurement Based on Carbon Satellite and Electricity Emission DataJ.Automation of Electric Power Systems,2024,48(1):2-9.DOI:10.7500/AEPS20230314004.3 Liu,Guolong,et al.Real-time corporate carbon footprint estimation methodology based on appli-ance identification.IEEE Transactions on Industrial Informatics 19.2(2022):1401-1412.4 https:/ 薛志华&杭歆婷.(2023).金融科技赋能绿色金融的问题及对 策 研 究.国 际 金 融(1 2),9-1 7.d o i:1 0.1 6 4 7 4/j.c n-ki.1673-8489.2023.12.001.6 Developing countries could face annual adapta-tion costs of$300 billion by 2030,secretary-general warns in message to climate vulnerable finance summit|meetings coverage and press releases United Nations.Available at:https:/press.un-.org/en/2021/sgsm20816.doc.htm(Accessed:23 May 2024).3.8 参考文献25气候变化CLIMATE CHANGE了气候模型的精细化和长期研究。人工智能在监测和评估碳排放方面表现出独特优势,通过多源数据和深度学习算法,能够追溯关键碳排放点,优化碳排放测量精度,提供高精度、低成本的碳排放模拟和预测。碳卫星技术的应用,使全球二氧化碳浓度监测更为精确,有助于研究气候变化趋势和评估其影响:在行业层面,人工智能推动了工业园区、发电设备和城市建筑的精准碳管理,通过综合分析多源数据,识别超标排放和异常排放行为,优化能源使用,减少碳排放。此外,人工智能在交通系统中的应用,通过分析交通流量数据、车辆类型和路线信息,优化交通信号控制,减少拥堵和排放;在企业层面,人工智能整合多源信息,精确定位碳排放来源,实时监测直接和间接碳排放,提高企业碳管理和交易决策的准确性。绿色金融结合人工智能,推动可持续发展,通过高效处理和分析碳排放数据,评估环境风险,确保资金流向环保项目,提高投资决策的科学性和透明度;多模态大模型集成分析技术整合多种数据,提供更全面的环境表现洞察,增强气候变化研究和碳排放计量能力,为制定和评估环境政策提供科学依据。人工智能不仅推动了气候变化研究和碳管理的精细化,还赋能气候金融,通过高效数据处理、风险评估、个性化金融产品设计等方式,推动全球应对气候变化,助力实现碳中和目标。工业26工业INDUSTRIAL图4.1 AI助力工业结构图4.1 引言随着人工智能技术的迅猛发展,具身智能和大语言模型在工业领域的应用前景备受瞩目。具身智能赋予机器人和其他物理实体以感知、理解、交互和自主行为的能力,使其能够在真实世界中智能地执行任务。这不仅提升了工业系统的智能化水平和效率,也带来了新的能耗挑战。大语言模型,如OpenAI的GPT-3和谷歌的PaLM等,虽然在自然语言处理方面展现出色,但其训练和推理过程消耗的能源巨大。据统计,GPT-3的一次训练总能耗约为1287MWh,相当于120个美国家庭一年的用电量。而谷歌的PaLM消耗了3436MWh,超过了GPT-3的两倍多;GPT-4的一次训练总能耗超过50GWh,约为GPT-3的50倍,约占加利福尼亚州一年发电量的0.02%。面对如此巨大的能耗压力,如何在提升模型性能的同时,兼顾训练效率和能源可持续性,成为了业界关注的焦点。本章将详细探讨大语言模型在工业具身智能中的能耗特点及其优化策略,探究未来十年内工业领域AI技术的发展趋势及其对能源系统的影响。工业4.2 AGI技术及大语言模型的能耗分析AI4.3 工业领域具身智能的能耗分析4.6 本章小结4.2.1主流大语言模型介绍4.2.2大语言模型的推理部署能耗4.2.3大语言模型的AI芯片和专用硬件4.2.4 数据中心建设成本分析4.41工业领域用电现状及AI替代人工的可能性分析4.4.2电力系统发展规划及对大规模AI进入的保障能力分析4.5.1技术发达国家的一般性影响4.5.2 劳动力富裕国家陷阱内容总结讨论与展望4.4 能源系统对工业领域AI替代人工的支撑能力分析4.5 AGI对劳动力市场的影响4.3.1具身智能的能耗特点4.3.2工业具身智能的应用现状4.3.3工业具身智能未来十年发展的时间表4.3.4工业具身智能未来十年的发展和能耗趋势以中国和美国为例4.3.5工业具身智能未来十年的市场规模和能耗水平4.1 引言27工业INDUSTRIALV100 GPU,训练时间将长达288年。实际训练时,OpenAI使用了1000多个GPU进行并行计算,才将训练时间缩短到了几个月。其他大模型的情况也大抵如此。随着模型规模的不断增长,训练成本也呈指数级上升。这不仅对计算资源提出了更高的要求,也引发了人们对于能源消耗和环境影响的担忧。如何在提升模型性能的同时,兼顾训练效率和能源可持续性,已经成为了业界亟待解决的难题。训练大型语言模型需要消耗大量能源,其电力需求远高于传统数据中心。OpenAI的报告显示,自2012年以来,AI训练应用的电力需求呈指数级增长,每3到4个月翻一番。华为AI首席科学家田奇指出,过去10年AI算力增长了至少40万倍。由此可见,AI大模型的能耗问题十分突出。随着人工智能技术的飞速发展,大语言模型已经成为了自然语言处理领域的重要突破性成果。当前主流的大语言模型,如OpenAI的GPT-3、谷歌的PaLM、DeepMind的Gopher以及Meta的LLaMA2等,都拥有海量的参数和强大的性能。以GPT-3为例,其参数量高达1750亿个,PaLM则达到了5400亿个,Gopher和LLaMA2分别为2800亿和700亿个。然而,训练这些大模型需要耗费大量的计算资源和电力。据OpenAI披露,GPT-3的一次训练总能耗约为1287MWh,相当于120个美国家庭一年的用电量;GPT-4的一次训练总能耗超过50GWh,约为GPT-3的50倍,约占加利福尼亚州一年发电量的0.02%。谷歌的PaLM则消耗了3436MWh,超过了GPT-3的两倍多。即使是相对较小的Gopher和LLaMA2,其训练能耗也分别高达1066MWh和688MWh。这些数字远远超过了传统数据中心的能耗水平。训练一个大语言模型通常需要数周甚至数月的时间,并且需要大规模的并行计算。以GPT-3为例,如果只使用单个NVIDIA 4.2 AGI技术及大语言模型的 能耗分析4.2.1 主流大语言模型介绍4.2.2 大语言模型的推理部署能耗面对大语言模型训练成本和能耗的急剧增长,业界正在积极探索更加高效和可持续的部署方式。目前,主要有几种部署大语言模型的方式,每种方式在能源效率方面各有特点。云端API调用是最常见的方式之一,用户可以通过API接口调用云服务提供商的模型服务。这种方式的优势在于云服务商通常拥有优化的基础设施和高效的模型实例,可以在不同用户之间共享资源,提高利用率。但是,API调用可能涉及网络传输的额外能耗。本地部署则是在自己的服务器或工作站上部署模型,可以使用开源的模型实现。这种方式允许用户对硬件和软件进行定制优化,减少了网络开销。但是,单个用户可能无法充分利用计算资源,能效取决于具体的硬件配置和优化程度。此外,还有边缘部署这一方式,即将模型部署在边缘设备(如智能手机、IoT设备)上,通过模型压缩等技术减小模型体积。边缘部署可以减少网络传输,但受限于设备的算力和能效,更适合推理任务而非训练。除了单一的部署方式,业界也在探索混合部署和分布式部署。混合部署结合了云端和本地/边缘部署,针对不同任务28工业INDUSTRIAL采用不同的部署方式,在灵活性和效率之间取得平衡。分布式部署则是将模型分布在多个节点上,通过并行计算来加速训练和推理。分布式部署可以充分利用计算资源,提高吞吐量和速度,但也需要考虑节点间通信和同步的开销。总的来说,云端API调用和大规模分布式部署通常能效更高,而本地部署和边缘部署在隐私、安全和实时性方面有优势。混合部署则可以根据具体需求权衡利弊。不同部署方式的能效差异还取决于硬件选型、软件优化以及应用场景等因素。2024年6月3日,微软公司宣布,公司计划斥资337亿瑞典克朗(约合32亿美元)在瑞典扩建云服务和AI基础设施,原因是生成式AI技术发展导致云服务需求激增。北欧国家全年气温较低,可以节省制冷成本。例如,在挪威的北部地区,冬季的平均气温约为零下4度,夏季则不超过12度。业内人士表示,普通的数据中心人工制冷成本高昂,约占到总支出的25%到35%。另一方面,北欧国家提供低价的清洁能源,有助于降低成本。此外,在地缘政治环境恶化的情况下,北欧成为美国以外为数不多的安全地区。此外,为了进一步提升大语言模型部署的能效,业界还需要在多个方面进行持续的创新。一方面,需要研发更加高效的专用AI芯片和硬件架构,如优化的GPU、TPU、FPGA等,以减少能量消耗。另一方面,也需要从算法和软件层面入手,如采用稀疏矩阵运算、量化训练、混合精度训练等技术,提高计算效率。同时,采用可再生能源,优化数据中心的能源结构,也是推动大语言模型可持续发展的重要举措。未来,模型压缩和高效部署技目前,AI芯片和专用硬件已成为提升大语言模型能效的重要途径。主流的AI芯片,如NVIDIA的A100、H100 GPU,以及Google的TPU v4等,通过优化的架构设计和先进的制程工艺,在能效方面取得了显著的进步。以A100为例,其每瓦性能比上一代V100提升了1.7倍。而TPU v4则通过片上互联、稀疏矩阵加速等技术,进一步提高了能效表现。与通用CPU相比,当前的AI芯片在特定任务上的能效优势可达数十倍至数百倍。未来的10年内,AI专用硬件的能效有望得到进一步的大幅提升。一方面,芯片制程工艺的不断演进,如3nm、2nm乃至更先进的工艺的应用,将带来单位功耗性能的显著提高。另一方面,针对AI应用特点的架构创新,如更高效的数据复用、存储访问优化、稀疏计算加速等,也将极大地改善芯片的能效表现。此外,片上异构集成、先进封装等新兴技术,有望突破当前芯片能效的瓶颈。通过将计算、存储、互联等不同功能单元集成在同一芯片或封装中,可以显著减少数据移动的能耗开销,提高系统效率。一些前沿的研究,如类脑计算、模拟计算等,也为未来AI硬件能效的突破提供了新的思路和可能。术的进步,以及共享协作生态的建立,也将为解决大语言模型的能耗问题贡献力量。4.2.3 大语言模型的AI芯片和 专用硬件29工业INDUSTRIAL根据一些研究机构的预测,未来10年,AI专用硬件的能效有望在当前基础上提升100倍以上。这将大大降低大语言模型训练和部署的单位能耗,缓解其对能源资源的需求压力。但是,考虑到模型规模和计算需求的同步增长,AI系统的总能耗可能仍将保持增长态势,只是增速可能趋缓。未来,芯片技术与系统软件协同设计、软硬协同优化将成为大势所趋。只有软硬件协同创新,结合应用场景需求进行全栈设计和优化,才能最大限度地发挥AI专用硬件的效率优势,全面推动大语言模型乃至整个AI领域的能效提升和可持续发展。随着人工智能和大数据技术的快速发展,数据中心作为关键基础设施的重要性日益凸显。本节以美国为例,介绍数据中心的建设成本构成,并分析其未来可能的影响因素。根据 Synergy Research Group 的数据,2023年美国数据中心市场规模达到730亿美元,预计到2028年将突破1000亿美元。数据中心建设成本主要包括四个方面:土地成本、基础设施成本、IT设备成本和运营成本。在美国,一个大型数据中心(约10万平方英尺)的总体建设成本通常在8亿到12亿美元之间,具体取决于位置、规模和技术配置等因素:4.2.4 数据中心建设成本分析占总成本的5%-10%,主要受地理位置影响。北弗吉尼亚、达拉斯、芝加哥等传统数据1)土地成本中心集中地区的土地成本较高,而新兴的亚利桑那、内华达等地区则相对较低。占总成本的45%-55%,包括建筑、电力系统、冷却系统和网络基础设施等。其中,电力和冷却系统占据了大部分开支。美国平均每瓦IT负载的基础设施成本约为7-9美元。2)基础设施成本占总成本的30%-40%,主要包括服务器、存储设备和网络设备。随着AI芯片和高性能计算设备需求的增加,这部分成本呈上升趋势。3)IT设备成本虽然不属于初始建设成本,但在数据中心生命周期中占据重要地位。每年的运营成本约为初始资本支出的5%-10%,主要包括能源、人力和维护费用。影响数据中心建设成本的关键因素包括:4)运营成本数据中心的能源消耗巨大,电价直接影响运营成本。美国西部和中部地区由于可再生能源丰富,往往能源成本较低。1)能源价格寒冷地区可利用自然冷却降低制冷成本,如华盛顿州和俄勒冈州。2)气候条件30工业INDUSTRIAL具身智能是指赋予机器人或其他物理实体以感知、理解、交互和自主行为的能力,使其能够在真实世界中智能地执行任务。大语言模型通过海量语料训练,可以理解和生成自然语言,是实现具身智能的重要基础。具身智能需要语言交互、知识理解、逻辑推理等能力,而大语言模型恰好可以为其提供强大的语义理解和生成能力。两者的结合将促进人机交互、认知推理等方面的进步,推动具身智能向更高水平发展。未来10年,具身智能在工业领域的应用将逐步深入和广泛,从简单任务到复杂任务,从特定场景到通用场景,从单一智能体到多智能体协同,从感知控制到认知决策,不断提升工业系统的智能化水平和效率。具身智能与纯软件智能系统相比,在能耗特点上有一些显著的差异。具身智能需要感知、决策和控制等多个模块的协同工作,每个模块都有其独特的能耗特点。4.3.1 具身智能的能耗特点许多州为吸引数据中心投资提供税收优惠,如弗吉尼亚州、德克萨斯州等。3)税收政策高密度计算、液冷技术等创新可显著提高能效,降低单位计算能力的成本。4)技术创新与其他地区相比,美国数据中心建设成本处于中等偏上水平。相较于欧洲,美国的能源成本和土地成本普遍较低;但与亚洲一些地区(如中国内陆)相比则偏高。然而,美国在技术创新、人才储备和基础设施完善度方面具有显著优势,这些因素部分抵消了成本劣势。未来,美国数据中心建设成本将受到以下其他方面因素的影响:边缘计算的兴起可能导致大量小型数据中心的建设,改变传统的成本结构。可再生能源的广泛应用有望进一步降低运营成本。目前,谷歌、微软等科技巨头已承诺使用100%可再生能源。AI技术的发展将推动更高密度、更高能效的数据中心设计,可能带来单位计算能力成本的下降。1)2)3)尽管美国数据中心建设成本较高,但其强大的技术创新能力和完善的生态系统,仍将保持其在全球数据中心市场的领先地位。未来,如何平衡成本控制与技术升级,将是美国数据中心产业面临的主要问题。4.3 工业领域具身智能的 能耗分析31工业INDUSTRIAL感知模块通常需要处理来自多个传感器的大量数据,如视觉、听觉、触觉等,对计算能力和功耗有较高的要求。特别是视觉感知,需要进行图像预处理、特征提取、目标检测和跟踪等计算密集型任务。但是,与纯软件系统相比,具身智能可以通过在前端集成专用的低功耗传感器和处理器,在数据源头进行压缩和筛选,减少后端的计算负担和能耗。决策模块需要在实时性、准确性和能耗之间进行权衡。传统的基于规则或逻辑推理的决策方法能耗较低,但难以处理复杂和动态的环境。基于深度学习的决策方法虽然能适应更广泛的场景,但在计算和存储方面的能耗较高。针对具身智能的特定任务,可以通过设计高效的神经网络架构、压缩模型、量化等方法来优化决策模块的能效。控制模块需要根据决策的结果,实时地规划和执行运动控制指令,对实时性和稳定性有很高的要求。传统的基于物理模型的控制方法计算量较小,但难以应对未知环境。基于强化学习等数据驱动的控制方法虽然具有更好的适应性,但在训练阶段的能耗很大。针对具身智能,可以采用模型预测控制、分层控制等策略,在保证性能的同时降低控制的频率和计算量,从而优化能效。尽管具身智能需要多个模块协同工作,但与纯软件系统相比,它们可能带来显著的能效提升。首先,具身智能可以通过感知和交互直接获取环境信息,减少对大规模数据收集和处理的需求。其次,具身智能可以利用物理世界的规律和约束,简化建模和问题求解的复杂度。再者,具身智能可以通过柔性材料、被动动力学等机制,在机械层面实现能量优化利用。更重要的是,具身智能与环境的实时交互和反馈,有助于不断优化和改进系统的性能和能效。通过端到端的学习和适应,具身智能可以找到特定任务和环境下的最佳策略和参数,避免了大规模数据和计算资源的浪费。对于基于大语言模型的AGI技术而言,具身智能的能效优势将助力其广泛应用。大语言模型虽然在语言理解和生成方面表现出色,但在感知、交互和控制等方面仍有局限。将大语言模型与具身智能相结合,可以在降低整体系统能耗的同时,扩大AGI技术的应用范围和实用性。例如,在智能机器人领域,大语言模型可以为其提供自然语言交互、知识理解、任务规划等高层认知能力,而具身智能则负责感知、导航、操作等底层实时控制。两者的紧密集成,将大大降低对数据和算力的需求,提高系统的鲁棒性和适应性。类似地,在智能家居、工业控制、自动驾驶等场景中,具身智能也将成为大语言模型等AGI技术落地应用的有效载体和补充。目前全国有很多国家在工业具身智能领域都有广泛的应用探索,涵盖工业机器人、自动驾驶、智能制造等多个方面。本部分将以中国和美国为例来介绍这三个方面现有工业具身智能应用成果。在工业机器人方面,中国方面,新松机器人自主4.3.2 工业具身智能的应用现状32工业INDUSTRIAL4.3.3 工业具身智能未来十年 发展的时间表研发了工业机器人本体及控制系统,应用于汽车、电子、机械等行业。珞石机器人则专注于面向3C电子行业的高速、高精度机器人和自动化设备。美国方面,优傲机器人(Universal Robots)开发的协作型机器人UR系列,凭借其灵活性、安全性和易用性,在工业领域得到广泛应用。这些机器人可以与人类工人并肩工作,执行装配、搬运、检测等任务。域得到广泛应用。这些机器人可以与人类工人并肩工作,执行装配、搬运、检测等任务。在自动驾驶领域,中国方面,百度Apollo开放平台已与金龙客车、北汽等合作,开展自动驾驶巴士和乘用车的路测和小规模运营。华为、京东等也都在自动驾驶卡车领域开展先进的技术研发和应用探索。美国方面,Waymo公司在真实道路环境下开展了大规模的自动驾驶汽车测试,累计测试里程超过2000万英里。特斯拉也在推进其AutoPilot系统的迭代升级和商业化部署。智能制造是工业具身智能的重要应用方向。中国在智能制造领域也有诸多探索,如海尔COSMOPlat工业互联网平台,连接用户、工厂和供应链,实现大规模个性化定制。树根互联基于边缘计算打造了根云平台,将人工智能技术与工业控制系统深度融合,优化生产流程。美国通用电气公司推出了基于工业互联网的Predix平台,可以优化产品设计、生产流程和运营维护等环节。西门子的MindSphere平台聚焦工业数据分析和优化,助力企业实现数字化转型。总体而言,美国在工业具身智能领域起步较早,工业具身智能未来十年发展时间表简单任务的自动化1 2年复杂的工业任务中应用3 5年更高的自主性和适应性非常规不确定的任多6 8年跨领域跨场景的工业具身智能应用9 年初步应用阶段深度融合阶段自主智能阶段泛化应用阶段10图4.3 工业具身智能未来十年发展的时间表考虑未来十年,工业具身智能的发展可划分为以下几个阶段:主要以简单任务的自动化为主,如物料搬运、装配等,并着力推进具身智能系统与传统工业设备的集成和改造。初步应用阶段(1-2年)技术积累深厚,涌现出一批世界领先的科技公司和产品。特别是在自动驾驶、智能机器人等前沿领域,美国企业在核心技术和产业化方面保持领先优势。中国近年来在该领域的投入和发展速度明显加快,政府出台了一系列支持政策,产学研协同创新生态日益成熟。一些中国企业在细分领域已经形成了自主可控的核心技术和完整的产业化能力,在国内市场占据了重要份额。33工业INDUSTRIAL跨领域、跨场景的工业具身智能应用将不断涌现,助力智能制造、智慧物流等产业变革。同时,通用人工智能在赋能工业领域的探索也将取得阶段性突破。中美两国将进一步深化产学研协同创新,加速推进工业具身智能的技术进步和规模应用。美国将在智能工厂、数字孪生、网络物理系统等方面取得新突破,形成一批创新解决方案和标杆项目。AR/VR、5G、边缘计算等技术也将与工业具身智能加速融合,赋能更多应用场景。中国将发挥制造业规模优势和应用牵引力,在智能装备、工业软件、系统集成等方面加快追赶,涌现出一批掌握核心技术和产业化能力的领军企业。具身智能系统将具备更高的自主性和适应性,能够执行非常规、不确定的任务。大规模多智能体协同优化将成为可能,显著提升工业系统的整体效能。自主智能阶段(6-8年)泛化应用阶段(9-10年)美国凭借其在人工智能、机器人等领域的先发优势,将继续引领工业具身智能的早期应用探索。政府和龙头企业将加大研发投入,聚焦感知、控制、人机交互等关键技术,推出一批Pioneer项目和示范应用。中国也将通过政策引导和产业基金等方式,鼓励企业加快工业具身智能的落地部署,重点突破一些特定场景下的自动化需求,如3C制造业、仓储物流等。初步应用阶段(1-2年)深度融合阶段(3-5年)工业具身智能将进入成熟期,成为中美两国制造业数字化、智能化转型的重要支撑。美国将继续保持全球领先,深度学习、群体智能、类脑计算等前沿技术将不断拓展工业应用的广度和深度,高度自主的智能系统将在更多工业场景中得到部署。中国也将基本建成工业具身智能的创新体系和产业生态,关键核心技术和高端产品将实现自主可控,一些优势企业将进入全球产业链中高端,参与国际竞争与合作。自主智能阶段(6-8年)工业具身智能将进一步向纵深发展,推动制造业的智能化、服务化、生态化变革。美国将加快人工通用智能(AGI)技术与工业领域的融合创新,探索更具颠覆性的应用模式和商业路径。数字化设计、个性化定制、服务型制造等新业态将进一步发展,推动产业价值链重构。中国也将进一步聚焦产业链部署和价值链提升,推动工业互联网等新型基础设施建设,构建大中小企业融通发展、多产业协同创新的工业具身智能生态,走出一条高质量发展的新路径。泛化应用阶段(9-10年)未来十年,中美两国将在工业具身智能领域持续加大投入,推动技术创新和产业升级。具身智能将在更复杂的工业任务中得到应用,如质检、维修、操作等。多模态感知、认知决策等能力将显著提升,人机协作更加自然高效。深度融合阶段(3-5年)4.3.4 工业具身智能未来十年的发展 和能耗趋势以中国和美国为例34工业INDUSTRIAL未来十年,中美两国将在工业具身智能领域加速竞合,共同引领全球新一轮科技革命和产业变革。预计两国在该领域的年均研发投入将保持10%以上的增速,重点聚焦前沿理论、共性技术、创新应用等方面,产学研用协同创新的力度将持续加大。部分关键技术如认知智能、自主学习等将取得重要突破,融合应用的深度和广度将不断拓展。一批引领性重大科技项目、国家级创新平台和龙头企业将加速成长,有力推动制造强国和科技强国建设。4.3.5 工业具身智能未来十年 的市场规模和能耗水平工业具身智能的市场规模预计将突破500亿美元,但在制造业整体投资中的占比还不高。能耗水平总体可控,主要来自机器人本体、传感器、通信等设备的用电,以及数据存储、传输等信息化能耗。初步应用阶段(1-2年)工业具身智能的渗透率将明显提升,预计市场规模将超过1500亿美元,成为新的经济增长点。随着应用规模和复杂度的增加,以及数据量的激增,工业具身智能的能耗总量和强度将有所上升。但通过系统优化设计、智能调度控制等手段,单位产出的能耗水平有望实现下降。深度融合阶段(3-5年)工业具身智能将成为支柱产业之一,预计市场规模将突破5000亿美元,覆盖制造业的各个环节。智能化水平的大幅提升将带来显著的节能增效,工业系统自主智能阶段(6-8年)工业具身智能将全面赋能制造业转型升级,有望催生超过万亿美元的新增市场。由于通用人工智能的加速发展和融合应用,这一阶段的能耗增长可能出现拐点。一方面,AGI系统的能耗强度可能显著高于传统工业控制系统;另一方面,AGI驱动的颠覆性创新也将带来更高的资源配置效率和清洁生产水平。能耗结构将发生深刻变革,清洁低碳将成为主流趋势。的能源利用效率将较目前提高30%以上。同时,可再生能源的规模化应用,也将进一步降低工业具身智能的碳排放强度。未来十年工业具身智能的能耗总量可能较现在增长3-5倍,但单位产出能耗强度将持续下降,碳排放强度也有望下降50%以上。通过能效提升、智能优化、清洁能源等多种举措,工业具身智能将逐步实现高质量、绿色化发展。能源系统,尤其是电力系统,是工业领域人工智能替代人工的重要基础设施。充足可靠的电力供应,是支撑工业机器人、自动化生产线、智能控制系统等AI应用的根本保障。未来,能源系统的智能化、绿色化转型,将进一步提升其对工业领域AI发展的支撑和赋能作用,推动制造业实现更高质量、更可持续的智能化增长。本部分将以美国为例对该内容进行展开讨论。泛化应用阶段(9-10年)4.4 能源系统对工业领域AI 替代人工的支撑能力分析35工业INDUSTRIAL4.4.1 工业领域用电现状及AI 替代人工的可能性分析工业领域的用电量庞大,在用电结构中占据重要地位。以美国为例,根据美国能源信息署(EIA)的数据,2023年美国工业部门的用电量约为9890亿千瓦时,占全国总用电量的25.76%。其中,制造业是工业用电的最大组成部分,约占工业用电总量的70%。在制造业内部,化工、金属制品、机械制造等行业是主要的用电大户。此外,采矿业、农业等产业部门的用电量也不容小觑。近年来,随着美国工业的复苏和转型升级,工业用电需求保持稳定增长,年均增速在1%左右。未来,随着人工智能等新兴技术在工业领域的加速应用,机器换人趋势将带来显著的用电需求增量。据麦肯锡估计,到2030年,美国约有50%的工业活动有望实现自动化,相当于6000万个全职工作岗位。这将直接带动工业机器人、自动化设备、数字化系统的大规模部署,从而提升工业领域的用电需求弹性系数。初步估算,在乐观情景下,当工业自动化率每提高10%,用电量将增加5%-8%;在基准情景下,用电弹性系数约为0.3-0.5。考虑到未来工业领域AI应用的广度和深度将远超当前水平,实际的用电需求弹性可能更高。同时,5G、云计算等新型基础设施建设,也将进一步带动工业数字化转型,形成新的用电增长点。综合测算,到2035年,美国工业领域AI替代人工可能带来15%-30%的用电量增长,对电力系统的支撑能力提出更高要求。本小节仍以美国为例,首先讨论美国电力系统的发展现状和规划。美国拥有世界上最大的电力系统,2023年装机总量约为11.8亿千瓦。目前,化石能源仍占主导地位,煤电和天然气发电分别占总装机容量的19%和44%。核电约占19%,水电等可再生能源占18%左右。近年来,随着清洁能源转型的加速推进,风电、太阳能发电等新能源装机快速增长,成为电力供给侧优化的重要力量。2023年美国的总发电量为4178TWh,其中用于AI训练和应用的能耗约为652TWh,占总发电量的16%。美国电力系统规划致力于进一步提升清洁能源比例,保障电力供应安全。根据EIA的预测,到2050年,美国的总发电装机容量将较目前增加近50%,其中可再生能源装机占比有望提升至40%以上。大量在建、拟建的风电、太阳能、核电项目将为电力供给提供有力支撑。同时,随着电网基础设施的升级改造,特别是智能电网、微电网、储能系统的建设,电力系统的稳定性、灵活性、互动性也将显著增强。然后讨论电力系统对工业领域机器替代人工大规模应用的保障能力。随着工业领域AI、机器人等技术的快速发展和广泛应用,用电需求将呈现较大幅度的增长。在需求增量情况下,电力系统在总量和局部平衡能力方面面临一定挑战,但总体上仍有望满足工业机器换人的用电需求。4.4.2 电力系统发展规划及对大 规模AI进入的保障能力分析36工业INDUSTRIAL从电力供给总量来看,现有电源建设规划及技术进步趋势,有望在相当长一段时间内满足工业领域的用电增量。但在局部地区,特别是大型工业园区、智能制造集群等用电负荷高度密集的区域,电网平衡调节能力将面临严峻考验。新能源的波动性、间歇性,也将对电力供需实时平衡带来挑战。为更好地保障工业机器换人的大规模应用,电力系统需要采取一系列应对举措。首先,加快电源侧结构优化,大幅提升可再生能源装机占比,实现“碳中和”目标下的供给保障。其次,加快电网基础设施智能化升级,提升电网的韧性、灵活性和互动性,推动源-网-荷-储协同优化。再次,完善电力市场机制,充分发挥电力需求侧响应的作用,引导工业用户合理用电。最后,因地制宜推进风光水火储一体化的多能互补发展,提升区域电力系统对工业负荷的适应能力。层工人职位产生显著的替代效应。制造业、物流运输、零售服务等领域,大量涉及重复性、规则化操作的岗位面临较高的替代风险。例如,装配线工人、仓储搬运工、收银员等职位很可能被智能机器人和自动化系统所取代。据世界经济论坛估计,到2025年,智能自动化将导致全球8500万个工作岗位流失。假设AGI在2030年左右成熟并广泛应用,基层职位的替代速度将进一步加快。初步测算,AGI推广后10-15年内,发达国家35%-50%的基层职位可能被替代,发展中国家的比例可能更高。全球范围内,数亿基层工人面临失业风险。麦肯锡全球研究院近日发布名为工作的新未来:在欧洲及其他地区部署人工智能和提升技能的竞争的报告,预计到2030年,AGI将帮助美国和欧洲近三分之一的工作时间实现自动化。AGI的快速发展可能使就业市场两极分化:一方面,高技能和高薪岗位难以招募到合适人才;另一方面,低薪行业可能出现劳动力过剩的情况。预计在欧洲,高薪职位的比例将增加1.8%,而低薪职位比例将减少1.4%。报告预计,到2030年,欧洲可能需要多达1200万人进行职业转型,是疫情前的两倍。在美国,所需的过渡可能达到近1200万人,符合疫情前的标准。此外,预计到2030年,德国将有约300万个职位受人工智能影响,占总就业人数的7%。其中,办公室行政管理类职位受影响最大,这类职位变动占所有受人工智能影响工作的54%。AGI导致职位流失的基层工人,普遍存在受教育4.5 AGI对劳动力市场的影响大规模应用AGI可能对国家劳动力市场产生双向的影响。一方面,AGI可替代部分人工,提高生产效率,释放人力资本,促进产业升级和经济增长;另一方面,AGI也可能导致部分岗位流失,加剧结构性失业,加大就业市场的匹配难度。反之,目前劳动力过剩的国家或地区,可能会阻碍AGI的大规模应用。AGI技术的成熟和广泛应用,将对不同行业的基4.5.1 技术发达国家的一般性 影响37工业INDUSTRIAL水平不高、工作技能单一的特点,转岗再就业难度较大。他们中的不少人已经中年,学习新技能的能力和意愿较弱,难以适应智能经济时代的就业需求。纵观历史上的技术革命,如第一次工业革命、电气化革命等,机器替代人工导致的结构性失业往往会持续较长时间。部分失业人员通过学习新技能在新兴行业实现再就业,但也有相当一部分人难以完成转型,或长期处于失业状态,或退出劳动力市场。因此,AGI时代亟需提升基层工人的就业能力,加强针对性的教育培训,提高其数字技能和适应能力。同时,要建立健全的失业保障和再就业援助机制,兜住民生底线。政府、企业、社会组织等各方应携手合作,聚焦“人”的因素,促进包容性发展,让智能革命成果惠及每一个人。当AGI工业化浪潮来临时,这些国家可能出于维护就业稳定、保护传统产业等考虑,对智能化变革持谨慎甚至抵触态度。大量剩余劳动力似乎降低了AGI应用的紧迫性,使得政府和企业对技术升级和产业转型缺乏足够重视和投入。然而,从长期看,不接受AGI工业化将使国家错失新一轮科技革命的历史机遇,陷入“中等收入陷阱”“创新不足陷阱”等多重经济陷阱。首先,AGI工业化是提升全要素生产率、实现高质量发展的关键动力。错失这一轮变革浪潮,意味着与发达国家在产业竞争力和核心技术上的差距将进一步拉大。其次,不进行AGI改革,传统劳动密集型产业终将因比较优势丧失而衰退,大量低技能工人将面临失业困境。再次,过度依赖人口红利,忽视人力资本开发和劳动力素质提升,也将制约国家长期增长潜力。因此,要摆脱劳动力富裕国家陷阱,关键是要主动迎接和引领AGI工业化变革,加快新旧动能转换和经济结构优化升级。一方面,要加大AGI等前沿技术研发和产业化应用,抢占新一轮科技革命制高点。要在制造业、服务业等领域率先布局,打造一批智能化标杆企业和产业集群,以点带面促进产业体系整体升级。另一方面,要加强劳动力的教育培训和技能提升,增强其适应智能时代发展的能力。政府应完善职业教育体系,鼓励企业和社会力量参与,共同培养复合型、创新型人才。对于受智能化冲击的传统产业从业者,要提供针对性的技能培训,帮助其实现转岗就业。同时,要健全社会保障体系,加强再就业服务,维护劳动者权益,化解智能化转型阵痛。劳动力富裕国家陷阱是指一国拥有大量剩余劳动力,但却难以接受和适应AGI(通用人工智能)工业化改革,从而阻碍国家长期经济发展的困境。这类国家通常具有以下特点:人口基数大,劳动力供给充裕,但劳动力素质和技能水平普遍不高;产业结构以劳动密集型为主,技术和资本密集型产业发展不足;制度环境相对僵化,创新活力不够,社会流动性较差。短期内,廉价劳动力确实为经济发展提供了动力,但从长远看,过度依赖人口红利,缺乏技术进步和产业升级,反而可能成为经济转型的障碍。4.5.2 劳动力富裕国家陷阱38工业INDUSTRIAL此外,还要深化体制机制改革,优化创新创业环境,加强知识产权保护,为数字经济发展营造良好的制度环境。总之,只有正视劳动力富裕陷阱风险,以智能化变革倒逼经济转型,加快构建人机协同、数智驱动的现代产业体系,才能实现创新引领、动力转换和效率提升,跨越“中等收入陷阱”,开创高质量发展新局面。的早期应用探索。中国则将通过政策引导和产业基金等方式,鼓励企业加快工业具身智能的落地部署,重点突破特定场景下的自动化需求,如3C制造业和仓储物流。综合本章所述内容,未来十年,工业具身智能和大语言模型的结合,将显著提升工业系统的智能化水平和效率,推动制造业的转型升级。同时,通过持续的技术创新和优化能源利用,工业具身智能将实现高质量、绿色化发展,为全球科技革命和产业变革注入新的动力。4.6 讨论与展望未来十年,工业具身智能的发展将分为四个阶段:初步应用阶段(1-2年)、深度融合阶段(3-5年)、自主智能阶段(6-8年)和泛化应用阶段(9-10年)。在初步应用阶段,具身智能将主要应用于简单任务的自动化,如物料搬运和装配,并着力推进具身智能系统与传统工业设备的集成和改造。在深度融合阶段,具身智能将在更复杂的工业任务中得到应用,如质检、维修和操作,多模态感知、认知决策等能力将显著提升。自主智能阶段将见证具身智能系统具备更高的自主性和适应性,能够执行非常规、不确定的任务,大规模多智能体协同优化将成为可能,显著提升工业系统的整体效能。在泛化应用阶段,跨领域、跨场景的工业具身智能应用将不断涌现,助力智能制造、智慧物流等产业变革。同时,通用人工智能(AGI)在赋能工业领域的探索也将取得阶段性突破。中美两国将在工业具身智能领域持续加大投入,推动技术创新和产业升级。美国凭借其在人工智能、机器人等领域的先发优势,将继续引领工业具身智能39工业INDUSTRIAL航天40航天SPACEFLIGHT5.1 引言人工智能(AI)在星际生活、星际贸易和航天领域的应用日益广泛,并展现出巨大的潜力和发展前景。在星际生活中,AI通过实时监控和预测性维护,显著提高了航天器的整体安全性和可靠性。在星际贸易方面,AI优化算法能够最大化利用航天器的空间和重量,确保资源配置合理,避免浪费。在航天领域,AI涵盖任务设计与模拟、自主导航与控制、通信与数据处理以及新材料与技术发展等多个方面。例如,AI在任务设计中优化轨道参数,提升任务成功率和成本效益;在自主导航中实现避障与着陆,提高操作能力;在数据处理方面优化深空任务的信息传输,提高可靠性和效率;在材料研发中加速新材料的创新,提升航天器性能。总体而言,AI在这些领域的应用不仅提高了航天任务的成功率和成本效益,还在资源配置优化、新材料开发和深空通信等方面展现出巨大的潜力,为未来的星际探索和发展奠定了坚实的基础。图5.1 AI助力航天结构图航天5.2 星际生活AI5.2.1 环境控制与生态管理5.2.2 资源优化和自给自足系统5.2.3 自动化与机器人技术5.2.4 医疗健康5.2.5 通信与数据处理5.2.6 安全系统与威胁管理5.2.7 教育与训练5.2.8 娱乐和生活质量提升5.1 引言5.4 航天领域的AI应用5.5 总结与展望5.4.1 任务设计与模拟5.4.2 自主导航与控制5.4.3 通信与数据处理5.4.4 故障诊断与维护5.4.5 科学实验和探索5.4.6 新材料与技术发展5.3 星际贸易5.3.1 资源勘探与开采5.3.2 市场分析和贸易决策5.3.3 物流与供应链管理5.3.4 自动化交易系统5.3.5 风险评估和管理5.3.6 客户服务与交互5.3.7 环境监控和可持续发展41航天SPACEFLIGHT法,AI能够提前检测和预防植物和动物疾病的爆发,保护整个生态系统的稳定性和健壮性。在环境控制与生态管理领域,AI的应用能够大幅提升外星居住地的效率和可靠性。AI可以通过综合分析气象数据、居住者活动数据和居住环境传感器数据,实时调整温度、湿度、通风、氧气系统1。例如,AI系统能够根据天气预报和内部活动水平自动调节暖通空调系统,以保持舒适的温度;通过监测湿度传感器数据,自动调节加湿器或除湿器,维持适宜的湿度水平;并根据空气质量和居住者数量动态调整新风系统,确保持续的新鲜空气供应。AI还利用传感器网络持续监测空气中的氧气、二氧化碳、挥发性有机化合物(VOCs)和其他有害物质的浓度。AI系统可以实时分析空气质量数据,识别潜在污染源,并在空气质量下降时自动开启空气净化器或增加通风量。基于历史数据和模式识别,AI能够预测未来的空气质量变化并提前采取预防措施,确保居住者呼吸到洁净的空气。在水资源管理方面,AI通过智能监控和控制系统,优化水的使用和循环。智能水表监测用水量,识别漏水或浪费;AI算法优化污水处理过程,提高水的循环利用效率;并根据土壤湿度传感器数据和气象预报,自动调节控制灌溉系统,确保植物得到适量的水分,避免水资源浪费。为了维护生态系统的平衡,AI通过智能管理系统确保动植物和微生物的健康和多样性。利用传感器和摄像头监测生态系统内的生物活动,AI能够识别异常情况并采取对应措施。根据监测数据,AI可以调节光照、温度和湿度等重要环境参数,促进植物生长和动物健康。此外,利用先进算5.2 星际生活5.2.1 环境控制与生态管理 5.2.2 资源优化和自给自足系统在星际生活中,资源的有效利用和自给自足系统至关重要,AI在这一过程中发挥着关键作用2。首先,在食物生产方面,AI通过实时监控垂直农场的温度、湿度、光照和营养水平,利用算法预测和调整这些环境参数,以优化植物生长条件。AI还能通过计算机视觉和图像处理技术识别病虫害,及时采取防治措施,减少农药使用,并基于大数据分析预测产量,优化种植策略,提升资源利用效率。在合成生物学方面,AI帮助设计和优化植物和微生物的基因序列,使其在特定环境下具有更高的生长效率和抗逆性,如优化藻类基因以提高光合作用效率。AI还通过模拟和优化微生物的代谢网络,生产所需的营养物质和生物制品,如蛋白质和维生素。在能源管理方面,AI通过预测太阳辐射和天气情况,优化太阳能电池板的角度和位置,最大化太阳能捕获效率。AI算法用于储能系统的实时监控和管理,优化能量存储和分配,确保能源供应的稳定性和高效性。在核能领域,AI用于核反应堆的实时监控和控制,通过复杂算法优化反应堆的运行参数,确保安全和高效的能量输出。AI还可以优化核废料的处理和存储策略,减少环境影响并提升安全性。在水资源回收与净化方面,AI结合传感器网络和大数据分析,实时监控水资源的使用情况和质量,优化水资源的分配和回收。通过机器学习模型,AI可以预测水质变化趋势,提前预警可能的污染事件,并采取对应的预防措施。AI还用于优化水净化系统中的膜技术,通42航天SPACEFLIGHT过模拟和实验数据改进膜材料和结构,提高净化效率和使用寿命。此外,AI还可用于构建一个综合资源管理平台,实时监控和调度食物、能源和水资源,协调各系统的运行,最大化提高整体资源的利用效率。AI通过数据分析和预测模型,提供资源利用的最佳方案,帮助决策者制定长期规划和紧急应对策略。在星际生活中,AI驱动的自动化与机器人技术在建设基础设施、进行地质勘探、挖掘矿产资源以及日常维护和紧急修复中起到了至关重要的作用3。这些机器人通过先进的机器学习算法和传感器网络,在极端或危险环境中操作,将大幅减少人员风险。在基础设施建设方面,AI驱动的建筑机器人能够自主进行各种建设任务,如搭建栖息地、道路和桥梁等。通过机器学习算法,这些机器人可以根据实时环境监测数据,动态调整施工方案以优化建造过程。它们可以精确执行切割、焊接、装配和涂装等任务,确保建筑质量和施工速度。例如,在建造星际栖息地时,机器人可以在恶劣的环境下完成复杂的结构组装和外部防护层的建设,减少人类暴露在危险环境中的时间。在地质勘探中,AI控制的机器人利用先进的传感器和数据分析技术进行详细的地质调查。这些机器人能够在地面探测和地下钻探中采集岩石、土壤和矿物样本,并实时分析其化学和物理成分。通过AI分析收集到的数据,机器人可以识别出有潜力的矿产资源和水源位置,帮助科学家制定进一步的勘探和开采计划。例如,在火星上,机器人可以勘探地下水冰的存在和分布,为未来的水资源开发提供关键信息。在矿产资源挖掘方面,AI驱动的矿产挖掘机器人能够在极端环境下高效、安全地进行矿产资源的开采工作。通过计算机视觉和路径规划算法,这些机器人可以自主导航到目标矿藏区域,进行精准的挖掘和采集。AI还用于优化挖掘策略,最大化资源回收效率,减少能源消耗和环境影响。例如,机器人可以通过实时调整挖掘力度和角度,减少矿石损失,提高资源利用率。在日常维护和紧急修复任务中,AI驱动的维护机器人能够自主执行设备检测、故障诊断和维修工作,确保系统的稳定运行。这些机器人配备了各种工具和传感器,可以进行复杂的维修操作,如更换部件、修补结构损坏等。在紧急情况下,AI可以快速评估情况,部署维修机器人进行及时的修复工作,防止事故扩大。例如,当出现气压泄漏或辐射泄漏时,机器人可以迅速到达现场,采取紧急修复措施,确保安全。AI驱动的机器人在极端或危险环境中操作,显著减少了人员风险。这些机器人能够在极端温度、辐射、高压或低重力环境下执行任务,如探测火山活动、研究冰层下的海洋等。通过AI的实时决策能力,机器人可以迅速响应环境变化,调整操作策略,确保任务成功和安全。例如,在极寒环境下,机器人可以通过内部加热系统保持工作温度,继续进行冰层钻探和样本采集任务。AI赋予机器人高度的自主性和协同工作能力。多个机器人可以通过无线网络相互通信和协调,共同完成复杂任务。AI算法使它们能够分工合作、相互支持,提高整体任务效率。例如,在建设大型结构时,多个机器人可以同时进行不同部位的施工,互相配合完成整体工程。通过AI控制的任务分配和进度管理,这些机器人能够高效协调工作,减少施工时间和资源浪费。5.2.3 自动化与机器人技术43航天SPACEFLIGHT手术操作。AI算法在手术过程中提供支持,包括图像识别、路径规划和实时反馈,确保手术的精确性和安全性。例如,AI可以实时分析手术区域的三维图像,辅助医生进行复杂的手术操作,减少手术风险和时间。此外,AI还可以在术后监控病人的恢复情况,提供个性化的康复建议,确保术后恢复顺利。还可通过AI构建一个综合健康管理平台,整合健康监控、疾病预防、医疗建议和远程手术等功能。该平台通过大数据分析和机器学习模型,提供全面的健康管理服务。居民可以通过平台实时查看自己的健康数据,接受个性化的健康建议和医疗服务。平台还可以与其他系统(如环境监控系统)协同工作,提供更全面的健康保障。例如,当环境传感器检测到空气质量下降时,平台可以提醒居民采取防护措施,减少健康风险。在星际生活中,AI在通信与数据处理方面的应用至关重要,通过高效处理和分析从地球和其他星球传输来的大量数据,提升通信效率和数据的使用价值5。AI还能够优化数据传输方法,减少星际通信中的延迟和数据丢失,确保信息的及时和准确传递。AI在数据处理与分析中发挥重要作用。由于星际任务产生的大量科学数据,传统数据处理方法难以应对。AI利用先进的算法和机器学习技术,能够快速处理和分析这些数据。例如,AI可以实时处理来自星际探测器的图像和传感器数据,识别和分类地质特征,发现潜在的科学价值点。通过大数据分析,AI还可以从海量数据中提取有用信息,支持科学研究和决策制定。AI通过优化通信协议和路由策略,提高星际通信在星际生活中,AI在医疗健康监控方面的应用至关重要,通过健康监控、疾病预防、定制医疗建议和治疗,以及远程医疗操作和手术,AI显著提升了医疗服务的质量和效率4。AI通过整合各种生物传感器和可穿戴设备,实时监控居民的健康状况。这些设备可以连续采集心率、血压、血糖、体温等生理数据,AI算法分析这些数据,及时发现异常情况。例如,通过机器学习模型,AI可以识别早期的心血管疾病迹象,提示用户进行进一步检查或采取预防措施。健康监控系统还可以记录居民的运动、睡眠和饮食习惯,提供个性化的健康建议,帮助维持良好的生活习惯。在疾病预防方面,AI通过分析大规模健康数据,识别流行病的早期迹象,制定有效的防控措施。例如,AI可以通过分析生物传感器和环境传感器的数据,预测感染性疾病的爆发趋势,并及时向居民发出预警。AI还可以根据个体健康数据,评估居民的健康风险,提供个性化的预防建议,如疫苗接种、饮食调整和运动方案,降低患病概率。AI在定制医疗建议和治疗方面具有重要应用。基于个人的基因组数据、健康记录和生活习惯,AI可以提供个性化的医疗建议和治疗方案。例如,通过分析基因数据,AI可以预测个体对某些药物的反应,制定最有效的药物治疗方案,减少副作用。AI还可以根据实时健康监控数据,调整治疗计划,如调整药物剂量或改