投资投资研究报告研究报告 2024年年01月月05日日 请请仔细仔细阅读阅读本报告尾部本报告尾部的的重要重要法律声明法律声明 人工智能人工智能深度报告深度报告:服务服务机器人机器人篇篇 核心观点核心观.
2025-09-11
13页




5星级
请务必阅读正文之后的免责声明及其项下所有内容20252025年年0909月月1010日日人工智能行业专题(人工智能行业专题(12)行业研究行业研究 行业专题行业专题 互联网互联网互联网互联网投资评级:.
2025-09-11
78页




5星级
人工智能人工智能促进高质量充分就业系列报告之一促进高质量充分就业系列报告之一 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 北京大学数字金融研究中心课题组 课题组成员课题组成员 黄益平、王靖一、费越、李振华、王芳、李勇国 技术支持团队技术支持团队 张韶容、钟亮华、樊雪娟、阎峰、耿东东、陈凯勋、叶政君、邵黎明 2025 年 9 月 黄益平为北京大学数字金融研究中心主任,北京大学博雅特聘教授、北京大学国家发展研究院院长;王靖一为北京大学数字金融研究中心特约研究员,中央财经大学金融学院助理教授;费越为德国曼海姆大学助理教授;李振华、王芳和李勇国为蚂蚁集团研究院研究人员。在课题研究与报告撰写过程中,课题组得到了北京大学数字金融研究中心和蚂蚁集团各位领导和同事的大力支持和帮助,特此致谢。本报告不代表北京大学数字金融研究中心和蚂蚁集团的观点,所有问题由课题组负责。课题组感谢李昀达、姚依珣、刘曜嘉、谭励为四位同学的助研工作。ii “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ iiii 2022025 5 年年 9 9 月月 目录目录 一、内容提要一、内容提要.1 二、研究背景二、研究背景 .2 2 三、研究方法三、研究方法 .5 5 四、主要研究发现四、主要研究发现 .5 5(一)AI 训练的整体影响.5 1.对收入的影响.6 2.对客户满意度的影响.7 3.对服务标准程度的影响.8(二)分人群的 AI 训练影响.9 1.不同性别的 AI 训练影响差异.10 2.不同年龄段的 AI 训练影响差异.11 3.不同所在区域的 AI 训练影响差异.13(三)AI 训练作用机制的初步分析.14 1.AI 身份与性格设计的影响.15 2.AI 情绪设定的影响.17 五、总结与讨论五、总结与讨论 .1818 参考文献:参考文献:.2020 1 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1 1 2022025 5 年年 9 9 月月 一一、内容提要内容提要 近年来,随着以大语言模型为代表的生成式人工智能飞速发展,关于人工智能对于就业的影响成为国内外研究关注的焦点。部分研究通过招聘文本描述的分析判断岗位所受冲击的程度;另外一些研究则利用随机试验,分析在工作过程中使用 AI 工具对于工作表现的影响。而本研究则试图更进一步地挖掘基于人工智能的培训对于劳动者能力的影响:AI 不是作为工具出现在工作过程中,而是出现在训练环节增强劳动者的工作能力,这使得我们可以尝试探索人工智能如何促进劳动者技能升级,以智能手段,应对技术带来的就业冲击。2024 年 3 月,蚂蚁集团数字蚂力上线了基于大语言模型构建的陪练智能体,这一智能体可以在训练环节中模拟真实客户行为与客服人员交互,提升客服能力。7-10 月间,业务团队进行了随机试验:部分新入职客服使用陪练智能体训练(下简称 AI 训练),部分则保持传统方式,基于此研究团队分析了 AI训练对于劳动者后续工作表现的影响,并对其作用机制进行了初步分析。在我们的认知范围内,这应是首个关于 AI 在训练中如何影响劳动者能力的实证研究。研究结果显示:AI 训练对于劳动者收入、客户反馈、服务标准性上均有显著正面效果,并呈现出人群特征、地理分布上的普惠性,同时初步的分析也展示出 AI 训练一项核心优势:更加精巧、贴近现实情况的设计,可以带来更为显著的训练增益。相较于传统训练方式,AI 训练对于新入职客服,在薪资提升、客户满意度、服务标准性等方面均有显著的积极影响。具体而言,AI 训练使得新入职的客服在开始工作的前六个月,单次服务平均薪酬上升了 14.02%、日均获得客户差评数下降了 29.46%,日均人工质检不合格数量下降了 29.70%。AI 训练同时展示出了普惠性质。得益于智能体交互的真实性,AI 训练对不同性别、年龄段、所处城市线级及城乡区分的人群均带来了显著的正面效果,且组间差距很小。同时,女性在收入、男性在减少差评率、45 岁以上人群在提升服务标准性上,均获得了强于整体平均的更大改善,展现了 AI 训练的普惠性 2 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 2 2 2022025 5 年年 9 9 月月 质。这也是本轮人工智能浪潮显著特征之一:大语言模型、智能体降低了使用相关技术的门槛,为相对弱势群体提供了改善通道。AI 训练的核心能力之一,在于陪练智能体可以为所扮演的客户赋予不同的身份、性格与多样化多阶段的情绪,使得客服在训练场景中积累更多经验,应对工作场景中的多样化问题。研究发现,当智能体具备非一般的身份、性格,具备负面、对抗性与不少于三阶段情绪时,AI 训练的增益被进一步放大,特别是当 AI 扮演暴躁、愤怒等对抗性情绪的客户时,效果尤佳:这部分经历对抗性情绪的客服,在上岗后五个月的差评数量减少 79.79%,质检不合格数量下降49.40%。为在深入实施“人工智能 ”行动中坚持以人民为中心的发展思想,充分发挥我国数据资源丰富、产业体系完备、应用场景广阔等优势,我们建议:(1)应当在确保用户隐私、数据安全前提下,充分发挥既有产业优势与数据沉淀,利用 AI 提升产品、服务的效率与质量,提升社会整体福利水平。(2)应当直面 AI 发展对劳动者就业质量的冲击,探索利用 AI 提升、延展劳动者工作能力的路径,充分利用智能技术提升劳动者能力,对抗技术迭代压力,根本上缓解就业压力。(3)应当重视人在工作、特别是直接与人交流的工作中的独特价值,留意考量人的体验与满意度,在追求运行效率、经济效益的同时,兼顾体验等隐性指标。二、二、研究背景研究背景 以大语言模型为代表的生成式人工智能的快速发展,正深刻改变就业格局。现有研究大体可以分为三条路径:一是基于岗位暴露度的测算,二是聚焦岗位需求与企业行为的实证研究,三是通过理论模型推演 AI 对劳动市场的整体冲击。第一,岗位暴露度测算奠定了研究基础。Felten 等(2018)首次提出将 AI能力与 O*NET 数据库中的岗位能力相匹配,以量化不同职业受 AI 影响的程度,并建立标准化指标体系。后续 Felten 等(2023)将该方法扩展至大语言模型,发现教育、客服等语言密集型行业暴露度明显上升。Eloundou 等(2023)则强调 GPT 类模型的通用性,指出约八成劳动力可能受到至少 10%的影响。张丹丹等 3 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 3 3 2022025 5 年年 9 9 月月 (2025)在此思路上进行了本土化拓展,基于大语言模型技术暴露度测算中国劳动市场的冲击程度。研究发现,在 2018 年 1 月2024 年 5 月,中国劳动力市场上新增职位的大语言模型人工智能技术暴露度呈现降低的趋势;暴露度较高的职业主要是对受教育程度要求较高和薪资较高的白领职业,包括会计、编辑、销售及程序员等。第二,实证研究揭示了 AI 与劳动市场的现实互动。Acemoglu 等(2022)利用美国招聘数据发现,AI 技能需求快速上升,但就业和工资增长尚无显著变化,暗示 AI 在扩散早期主要改变技能结构而非总量。Babina 等(2024)则基于员工简历数据度量企业 AI 投入,发现高 AI 投入企业表现出显著的营业额、雇员与市值增长,其增长动力主要来自产品创新而非过程效率提升。这些研究说明,AI 对劳动市场的作用具有间接性和滞后性:在短期内,劳动者面临技能错配风险,但在长期,企业扩张和创新可能创造更多就业。第三,理论模型描绘了 AI 冲击的可能情景。Korinek 与 Suh(2024)提出“原子任务”框架,设定自动化通过逐步提高任务可替代的复杂度阈值来重塑就业。在不同自动化速度下,劳动工资可能出现增长、骤降或回升等多种路径,资本回报则大多呈上升趋势。这类模型强调了 AI 冲击的非线性和不确定性,提醒我们政策与培训干预在缓冲短期冲击、促进长期适应中的重要作用。总体而言,三类研究构成了由微观到宏观的逻辑链条。岗位暴露度研究提供了识别冲击的工具与指标;实证研究揭示了劳动市场和企业层面的动态反应;理论模型则拓展到宏观结构与长期演化。近期的中国研究将国际方法与本土数据结合,揭示了大语言模型对中国劳动市场的差异化影响。这表明,AI 并非单向的“岗位替代者”,而是在不同情境下同时展现“替代创造”的双重效应。但以上研究存在一个较大的现实制约:缺乏对于劳动者个体层面真实的 AI暴露度的直接度量(而是以工作描述、企业投资等间接方式估测),Brynjolfsson等(2025)通过随机试验获得了劳动者层面的直接度量,并开创性地结合大规模现场部署,直接获取了劳动者的暴露度与生产率变化。他们基于一项涵盖 5179名客户支持坐席的实地研究发现,接入生成式 AI 助手平均提升了劳动者 14%的问题解决效率,且这种提升主要集中在新手与低技能员工群体(生产率提升高达35%),而经验丰富的高技能员工几乎未受影响。4 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 4 4 2022025 5 年年 9 9 月月 我们的研究则更进一步,基于个体层面的 AI 度量,探索 AI 训练对于劳动者工作表现的影响。相较于在工作中使用 AI 工具,AI 训练的作用机制更加间接,却更为重要:AI 能否、如何改变了人的能力,这一改变的效果、持续时间、作用机制如何。本研究便是利用数字蚂力上线基于大模型的客户智能体的宝贵研究素材,进行了因果识别与影响测算。我们研究的主要对象是数字蚂力的云客服板块:不同于传统印象中的呼叫中心模式,在固定时间、固定地点招聘客服人员提供客服服务,云客服的工作人员可以自选工作地点与工作时间,灵活的工作模式、相对丰厚的报酬吸引了许多劳动者的青睐,但是如何将这些分散的“新手”训练成可以上岗的合格客服,是一个挑战。在之前,学习材料主要以文字、图片、视频等非互动形式,之后加入了基于关键词匹配的固定剧本模式,都无法将培训与材料背诵脱离开来。2024 年 3 月 28 日,基于大模型打造的陪练智能体上线,该智能体可以不依赖繁琐的脚本配置(明确对话机器人每个步骤的对话内容与语义识别关键点,这是之前的训练脚本的主要运行方式),使用自然语义与被训练的客服交流,并理解客服的反馈,推动训练情节。5 月 17 日,智能体进一步升级,具备更加贴近真人的音色,可以模拟特殊身份、性格带来的独特表达方式,模拟冷淡、愤怒、宽容、尊重等数十种不同情绪。在 2024 年 7 月-9 月,为了验证 AI 训练的有效性,数字蚂力团队在部分业务板块进行了随机试验,对于同一批入职的新客服,将其随机分为两组:一部分采用 AI 训练为主,另一部分采用传统训练为主。实验主要在涉及行业知识与针对性场景强化的训练中进行,对于一些基本的、共性的场景,比如用户隐私、数据安全的训练,则统一进行。下图左图汇报了实验中客服在岗前训练阶段,AI 训练占整体时长的分布直方图,我们将 AI 训练的阈值设为 50%,即如果一个客服的岗前训练超过一半以上的时间是由 AI 完成的,我们便认为他是 AI 训练的客服(实验组),否则则为控制组,之后我们将重点比较这两类人群之间的差异。如下图右图所示,最终我们包含了 512 个实验组客服和 1497 个控制组客服。5 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 5 5 2022025 5 年年 9 9 月月 图 1 岗前 AI 训练时长占比及实验标签分布图 三、研究方法三、研究方法 因果森林(Causal Forest)是 Wager 等(2018)在 Athey 等(2016)的因果树(Causal Tree)的基础上的扩展,具备更强的稳健性,是一种用于评估“某项干预措施对不同人群效果是否不同”的机器学习方法,尤其适用于在存在大量个体差异的现实场景中。与传统平均处理效应(ATE)方法相比,因果森林不仅能估计整体干预效果,还能识别在哪些特定人群中效果更强(即条件平均处理效应 CATE),从而揭示政策或措施背后的异质性,这在我们的研究中有特别的价值。该方法在本研究中尤为适用。我们评估的是 AI 训练能否提升新客服的工作表现,受试者来自不同地区、背景和技能组,表现差异显著。同时,个体培训前的属性可能同时影响培训方式的选择和最终绩效,存在“混淆因素”。因果森林在模型中纳入了多种控制变量(如性别、年龄、入职时间等),这使得我们不仅可以估计 AI 培训的总体效应,还能探索在如女性、特定技能组或经历特定培训情境的新员工中,AI 培训的优势是否更为显著,从而为研究 AI 训练的普惠性与作用机制奠定基础。具体到本研究,我们控制了所在业务板块、所在区县、第一天工作日期、支付宝注册时间、年龄、性别、上岗前三个月支付宝支付笔数、上岗前三个月支付宝支付金额、上岗前三个月支付宝基金余额,作为分析中的协变量。四、主要研究发现四、主要研究发现 (一)(一)AIAI 训练的整体影响训练的整体影响 在本小节,我们将汇报整体层面的分析结果,即对于客服整体而言,接受 AI训练相较于如果没有接受 AI 训练的反事实,带来了多少增益。在不同场景下,我们分析了 AI 训练在客服上岗后首月、前两个月直至前六个月的影响。6 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 6 6 2022025 5 年年 9 9 月月 1.1.对收入的影响对收入的影响 云客服的灵活性的一个集中体现便是在其工作方式与薪酬度量上,我们需要以三种不同的角度来衡量他们的薪资。在进行真正工作之前,云客服需要自主选班:每天 8-24 点的班次被以 1 个小时的颗粒度推送给客服进行选择,他们可以选取其中自己偏好的班次。故而一个客服每个月有班次的工作日、每个工作日的工作时间、工作时长都十分灵活。而云客服的薪资组成则更为复杂,其薪酬计算方式如下:薪水=基础薪酬*绩效系数 奖励薪酬-扣罚 其他薪酬 其中,基础薪酬=服务数量*计件薪酬 在线时长*在岗时薪。计件薪酬在同一个业务板块中的所有客服中保持统一,而在岗时薪则在更大的人群中保持相同。绩效系数是按照客服在当月同一业务板块中所有客服的服务质量排名进行赋分,这个数字一般大于 1,高者可以超过 2.5。由于这一薪酬设计方式,片面地追求数量而忽视质量,往往不能带来更高的收益。我们对于薪酬的考察主要关注两个维度:小时收入:样本期内总收入/样本期内工作小时数。单次服务收入:样本期内总收入/样本期内进行的服务数。小时收入/单次服务收入是我们关注的一项核心变量,一方面由于薪酬的特殊设计,使得其成为客服服务质量与效率的综合评价指标;另一方面,收入是最可感知,劳动者最为关心的核心指标。7 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 7 7 2022025 5 年年 9 9 月月 图 2 AI 训练对于客服收入的影响 上图展现了 AI 训练对于客服收入影响在上岗后六个月的变化情况,图中纵轴为 AI 训练相较于没有 AI 的反事实带来的收入增益。在各个时间尺度,以各类收入口径计量,AI 训练对于收入的影响均是正面的,以小时收入计,最大的正面增益发生在上岗后首月:15.93%。随着上岗时间的增加,AI 训练带来的增益在逐步收敛,但是单次服务收入的增益则不降反升,上岗后前六个月,AI 训练使得每次服务获得的平均薪酬上升了 14.02%。2.2.对客户满意度的影响对客户满意度的影响 客服工作的最终目标是解决客户问题,提升客户满意度,保证业务的良好运行。故而客服在工作中服务的客户的满意度,也是一个核心的度量指标。客户满意度的指标主要有两种:按键满意度,即在服务结束后,使用数字、星级、好差评按钮等方式对客服表现进行评价;调查满意度,即在服务结束后一段时间,通过应用内消息、短信等方式对客户进行调研,让其对服务进行打分。不论按键满意度还是调查满意度,均会存在一个召回率的问题:并不是每次服务都会获得评价。故而我们选取的核心考核指标是,服务每小时/每个工作日获得的平均差评数,这基于一个朴素的逻辑:做出好评的客户并不一定真的觉得服务很好,但是做出差评的客户大概率是真的不开心;同时想做好评的人可能因为疏忽遗忘保护隐私等诸多考量不予好评,但是想做差评的人大多会突破重重阻碍反馈不满。8 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 8 8 2022025 5 年年 9 9 月月 图 3 AI 训练对客户差评数的影响 各个维度而言,AI 训练均会显著降低用户的差评,在上岗后当月,AI 训练使得客服日均按键差评的数量降低了 13.56%;而在上岗后六个月内的日均按键差评的数量降低了 29.46%;而若以日均调研差评率计算,这两个数字分别为55.12%与 26.57%。较为有趣的一点是,调研差评率和按键差评率的 AI 影响在较长时间窗口内区别不大,但是在上岗初期有较大的差别,这一区别可能来自于调研与按键不同的反馈成本:按键反馈只是在界面上选择,而调研反馈则往往需要点击链接、填写问卷、提交等等复杂操作,复杂操作蕴含的不满是更大的。换言之,AI 训练对客户不满行为的抑制作用,在严重错误情境下可能更为显著。而这里的“严重错误”,则更可能是在服务态度等情感方面而非业务熟练等事实错误层面。这只是对于当前结果的一个合理猜想,更加严谨的研究有赖于后续对相关文本的语义分析。3.3.对服务标准程度的影响对服务标准程度的影响 客服在服务质量的另外一个维度,则是服务标准程度。由于客户在信息上处于劣势,其满意度更多地反映是其主观判断,而满意并不代表着客服反应的信息准确,服务流程标准、合规。一个形象的例子便是大模型中的幻觉,大模型幻觉 9 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 9 9 2022025 5 年年 9 9 月月 即是让客户满意但不能称之为标准的服务。对于客服服务的标准程度,在实践过程中,业务方安排专职专业人员对部分客服的服务记录进行人工校验。与差评类似,我们的主要考核指标是日均质检发现问题和时均质检发现问题。图 4 AI 训练对质检发现问题的影响 AI 训练使得,客服在上岗当月日均质检不合格数量下降 16.72%,这种优势在上岗后六个月的区间内持续,六个月整体不合格数量下降 29.70%。相较于服务评价,AI 训练对于服务标准程度的影响更加显著、稳健;同时 AI 训练对服务标准度的正面影响是随着时间增长放大的,这从一定程度上说明,更加灵活的 AI剧本并没有使得服务标准化缺失,反倒因为其生动的方式形成了更加深刻、持久的影响。(二)(二)分人群的分人群的 AIAI 训练影响训练影响 近年来,数字鸿沟的影响引起了学者的广泛关注。数字鸿沟是指不同群体在信息通信技术(如互联网、智能终端等)的可获得性、使用能力及由此带来的经济社会收益上存在显著差距。故而 AI 训练是否带来了数字鸿沟,即在不同人群中产生不同的影响,值得特别关注。我们采取的方法是,利用因果森林的特性,研究 AI 训练在不同人群中的条件平均处理效应(CATE)。因果森林在计算 CATE 的优势主要在于:它能够在非参数框架下灵活捕捉异质性处理效应,通过随机森林的集成机制降低因果树估计的 10 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1010 2022025 5 年年 9 9 月月 方差,从而在保持模型可解释性的同时提高估计的稳健性与精度;此外,它内置“忠诚样本分割”(honest splitting)方法,有效避免过拟合,确保对 CATE 的推断更具统计一致性。我们主要关注三个方面的区分:性别、年龄、所在区域。1 1.不同性别的不同性别的 AIAI 训练影响训练影响差异差异 图 5 AI 训练对于收入影响的性别差异 上图展示了 AI 训练对于不同性别的客服,每次服务的平均收入的影响。结果表明,两性的劳动者收入均能得益于 AI 训练,但女性的增益效果更大。得益于 AI 训练,女性客服上岗后六个月内的件均收入增加了 14.52%,而男性群体这个数字为 11.75%。11 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1111 2022025 5 年年 9 9 月月 图 6 AI 训练对客户差评数量影响的性别差异 上图展示了 AI 训练对于客服平均每小时获得的差评数量的影响,在两性之间的差异,整体而言,男性则在服务满意度上更多的获益于 AI 训练,上岗后六个月时均差评量,降低了 19.4%。最有意思的一点是,在服务的前四个月,男性的获益是相对更小的,特别是前两个月的整体水平,AI 训练对于男性的影响是负面的(他们相较于不经历 AI 训练的反事实情况,收获了更多的差评)。同样现阶段只能提出一个猜测:这在某种程度上反映了一些逆反心理:“非不能也,不为也”经历了一个月的工作,发现大可不必如训练时那般小心翼翼,但松懈带来了差评,差评又让人恢复了对于规矩的记忆。2.2.不同年龄段的不同年龄段的 AIAI 训练训练影响影响差异差异 综合考虑现实意义、数据样本描述统计特征,我们将研究对象划分为 30 岁以下、30-45 岁、45 岁以上三个组别。12 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1212 2022025 5 年年 9 9 月月 图 7 AI 训练对收入影响的年龄差异 上图展示了 AI 训练对于不同年龄阶段的客服,每次服务的平均收入的影响。数字鸿沟并没有在 AI 训练的场景中出现,除上岗当月外,不同年龄段的平均收入受 AI 训练的影响几乎没有区别。45 岁以上,岗后六个月内的每次服务的平均收入增加了 12.62%,30 岁以下群体、30-45 岁群体的这个数字则为 12.11%和14.92%。这种数据鸿沟的消弭应是预期中的,因为基于大模型的生成式 AI 的一个显著特征是使用门槛的大幅度降低,驱动智能的不再是代码而是自然语言,在ChatGPT 3.5 的时代还要有特别的指令(Prompt)技巧来发挥模型的最大效率;之后愈发先进的模型的对于特殊指令的依赖愈发降低,只需要像对一个人那样细致、耐心、明确地描述需求便可以获得高质量答案;而到了智能体阶段,其工作流中已制定好的指令则可以进一步降低使用门槛客户智能体的目标是模仿客服工作中可能遇到的客户,即像一个真人那样交流,那么使用这个智能体也只需要和“与人沟通”相一致的技巧,而这一技巧本不应存在数字鸿沟那些年龄稍长的人往往有更强的沟通经验与处事技巧。13 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1313 2022025 5 年年 9 9 月月 图 8 AI 训练对质检发现问题的影响的年龄差异 上图展示了 AI 训练对于服务标准性的影响在不同年龄段的差异,AI 的普惠性质则体现的更加明显,45 岁以上人群的服务标准性获得最大程度的改善,他们上岗后六个月日均质检不合格数量,下降了 33.46%,这一程度大于其他年龄组。这无疑是 AI 魅力的一大展现:受限于记忆力、技术理解力的差异,年长者在服务标准程度上原本处于劣势,但是却在 AI 训练中获益最多。这初步体现了AI 对于能力培养的一种潜在优势:减弱了知识性的门槛,强化了与人沟通等通用能力的重要性,这不只有利于技能落后于时代的劳动者重返职场,也将助力劳动者在不同细分专业岗位上转换,找到与自己最匹配的职业。3.3.不同所在区域的不同所在区域的 AIAI 训练影响差异训练影响差异 云客服的一项核心优势是,劳动者可以自由地选择工作地点,云客服往往可以选择居住在小城市、县城以降低生活成本,同时享受全国统一的薪资标准。云客服的广泛分布使得我们可以考察 AI 训练影响在城市等级、城乡间的差异。14 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1414 2022025 5 年年 9 9 月月 图 9 AI 训练对收入影响在地区间的差异 上图展示了 AI 训练对于客服平均每次服务收入的影响,在地区间的差异。我们主要考察了两个维度上的区分:按照第一财经周刊评定的城市分级,我们将客服分为两组:处于一线、新一线、二线城市;处于三线及以下城市。同时又将客服按所在区县的六位行政区划代码,分为两组:处于城区;处于县(旗)、县级市。研究发现,地理上的区分几乎未带来任何显著的影响。其他收入维度的指标、客户满意度、服务标准程度的指标,均为展现出地理区域间的差别,受限于篇幅,此处省略。(三)(三)AIAI 训练作用机制的初步分析训练作用机制的初步分析 AI 训练的一项核心优势在于可以基于精巧的设计,模拟的客户具备多样化的身份、性格与情绪,提升客服在高压情况下的表现。在研究样本期内,我们发现了 23 种身份:如白领、时尚达人、技术控、普通身份等。在本研究中,我们将其二分为普通身份与其他复杂身份。同时,AI 客户被按照 DISC 分型设计成四种人格。它将人的行为特征划分为四种基本类型:D(Dominance,支配型)、I(Influence,影响型)、S(Steadiness,稳健型)和 C(Conscientiousness,谨慎型)。支配型的人目标导向强,决策果 美国心理学家威廉莫尔顿马斯顿博士在 1928 年提出,Marston W M.Emotions of normal people M.New York,NY:Harcourt Brace&Company,1928.15 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1515 2022025 5 年年 9 9 月月 断,善于把握全局;影响型的人外向乐观,善于沟通,倾向于通过关系和情感影响他人;稳健型的人注重合作与和谐,耐心可靠,强调团队与稳定环境;谨慎型的人重视规则与细节,逻辑性强,追求精确与高标准。在本研究中,我们将人格二分为稳健型与其他复杂性格。同样,在剧本设计中,AI 客户涉及多种情绪转换,这些情绪包含许多种类型:乐观、暴躁、低落等等,我们识别出其中两个集合:负面情绪与对抗性情绪,对抗性是负面的一个子集;同样,一个剧本可能涉及到多阶段的情绪,比如客户会从平静转变到低落继而到暴躁最后归于和解,在我们观察的样本中,一个剧本最多包含了七个情绪阶段。如果一个剧本包含 3 个或以上情绪阶段,我们将其定义为多阶段情绪剧本。对于每一个 AI 训练的客服,我们构造一个哑变量(dummy)来衡量其是否得到了特别 AI 的训练:特殊 AI 训练时长占比超过 AI 其所经历 AI 时长训练的一半以上。1.1.AIAI 身份与性格设计的影响身份与性格设计的影响 图 10 AI 身份与性格对于差评数量的影响 上图展示了 AI 训练对于客服平均每小时获得的差评数量的影响,在不同身份、性格上差异。结果显示,复杂性格和复杂身份的设计显著改善了客服在工作 16 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1616 2022025 5 年年 9 9 月月 中的客户评价。得到复杂身份剧本训练的客服五个月差评数量下降了 40.08%,复杂性格则带来了 27.91%的下降,均强于 AI 训练平均的 27.42%的效果。图 11 AI 身份与性格对于质检不合格数量的影响 上图展示了 AI 训练对于客服服务标准性的影响,在不同身份、性格上差异。得到复杂身份剧本训练的客服五个月质检不合格数量下降了 47.22%,复杂性格则带来了 42.08%的下降,均强于 AI 平均的 34.51%的效果。17 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1717 2022025 5 年年 9 9 月月 2.2.AIAI 情绪情绪设定设定的影响的影响 图 12 AI 情绪对于收入的影响 上图展现了 AI 情绪对于客服收入的影响。对抗性情绪的 AI 训练显著地改善了客服的收入,得到对抗情绪剧本训练的客服,五个月件均收入提升了 13.92%,大幅强于 AI 整体的 9.37%。而负面情绪、多阶段情绪的训练则提升不大。图 13 AI 情绪对于差评数量的影响 18 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1818 2022025 5 年年 9 9 月月 对抗性情绪的 AI 训练显著地改善了客服的客户评价,得到对抗情绪剧本训练的客服,五个月客户差评数量下降了 79.79%,负面情绪与多阶段情绪带来约36%的差评减少,均强于 AI 训练整体带来的 27.42%的改善。对抗性情绪对于差评的减少是预期内,而减弱的幅度是超预期的。同时减少趋势随时间的变化则更为有趣,随着时间的累计,对抗情绪 AI 训练对于区间内平均差评数量的抑制作用逐步加强,从一定程度上佐证了,AI 训练是在能力上达到了“治本”级别的改进,而非对于工作流程、结果的“治标”。图 14 AI 情绪对于质检发现问题的影响 上图显示,AI 情绪的设计对于服务标准性的提升则更为一致、稳健,得到对抗情绪、负面情绪、多阶段情绪剧本训练的客服,五个月质检不合格数量下降了49.40%、48.44%、49.33%,均强于 AI 训练整体带来的 34.51%的改善。五、五、总结与讨论总结与讨论 至此,我们已经从整体、分人群、AI 复杂设计等多个角度揭示了 AI 训练对于客服能力及工作表现的提升作用。研究结果表明,AI 训练能够有效地提升新入职客服在上岗后的收入,提升其服务客户的满意度,增进其服务的标准性,那些更充分发挥生成式人工智能优势、贴近现实精巧设计的 AI 训练取得了更好的效果;同时,针对性别、年龄、所在区域的差异分析表明,AI 训练不存在数字鸿沟,甚至呈现出对弱势群体提升更大的普惠性质,这对我们如何利用相关技术,19 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 1919 2022025 5 年年 9 9 月月 提升劳动者技能,促进高质量就业有所启发。技术发展对于就业冲击的问题是无法回避的,但技术引起的问题应首先尝试用技术去解决。生成式人工智能技术对使用门槛的降低是前几次人工智能浪潮未曾经历的,应当把握转型期的机遇窗口,充分利用数字经济过去十数年发展累积的数据沉淀与基础设施,着力开发针对劳动者技能提升、转换的 AI 训练应用、流程、体系,以智能手段,应对智能发展过程中的问题。同时,应倡导在发展人工智能时,依照领域现实情况,设定多元价值取向。比如在事关大量人员就业岗位的行业,应当强调“就业优先”的理念。但这一追求并不是违背企业追求利润的“与虎谋皮”或者恐惧技术进步的“因噎废食”,而是规避市场参与者因片面追寻利益而导致市场失灵的“宏观调控”。这一论述来自以下一个有趣的发现:图 15 AI 训练对单次服务平均时长的影响 上图展示了 AI 训练对于单次服务平均时长的影响,整体而言,上岗后六个月,AI 训练使得服务时长增长了 8.42%。这一点是有些反直觉的,以至于我们需要把它特意放作最后一张图展开讨论。在一般场景下,单次客服时间较长往往被当作负面信号:需要更长时间,才能够“解决一个问题”,这无疑加重了企业提供客服的成本,降低了“效益”。然而上一节各个角度的分析结果表明,AI 训练的效果都是积极,为什么这里相左?20 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 2020 2022025 5 年年 9 9 月月 我们不妨再思考一下企业的“效益”与客户获得的“问题解决”,企业管理对于一般读者可能陌生,但是找客服去解决问题应当都有所经历,在相当多的时候并不只是在寻求一个疑问的解答,而是同时或者更看重一个情绪的平复。在训练台本中,多次出现一个“流动性”的关键词,经询问业务专家得知,这是其内部对于一类场景的特殊描述:用户的诉求无法解决,比如因为信用问题无法获得消费信贷的额度。而这时可能尽快完成一个标准答案的交付,并不能够说是“问题解决”,也无从提升企业的“效益”。故而我们提出一个猜测,AI 训练带来的单次服务时长的提升,并非是客服熟练度不足的体现,而是他们在服务过程中包含了更多情绪共鸣、倾听理解的人文关怀,这一点的最终证实需要后续研究分析对话记录,但本次报告的发现是可以在一定程度上支持这一思路的。这样的取舍并非来自于价值观的训导,而是在于薪酬机制的精心设计我们的研究结果表明,客服在完成效率上的损失,带来的是单次服务收入、单位时间收入的提升。就此我们更进一步地将讨论扩展到 AI 对齐目标之上,现阶段再强大的智能也离不开人类意志的对齐,即 AI 的行动目标是满足人类为之预设的偏好,在一些领域更高更快更强天然地意味着更好的结果,而在一些满足人类需求的行业,AI 应用的目标是否该被锚定在效率之上?不同主体、不同时间窗口的思考会得到不同的结果,但人类经济发展史无数次地证明了单纯依靠市场调节的局限性,那么 AI 领域应也无法例外,对于 AI 对齐目标的“宏观调控”,应当被重视起来:不同企业、行业的 AI 在追求自身利益、恪守基本道德底线的同时,应当为社会整体的福利提升,对齐何种目标,值得讨论。参考文献:参考文献:1 Acemoglu,Daron,David Autor,Jonathon Hazell,and Pascual Restrepo.“Artificial Intelligence and Jobs:Evidence from Online Vacancies.”Journal of Labor Economics,vol.40,no.S1,2022,pp.293340.2 Athey,Susan,and Guido W.Imbens.“Recursive Partitioning for Heterogeneous Causal Effects.”Proceedings of the National Academy of Sciences,vol.113,no.27,2016,pp.73537360.21 “时雨润无声”:“时雨润无声”:AIAI 训练赋能劳动者训练赋能劳动者职业发展职业发展 https:/ 2121 2022025 5 年年 9 9 月月 3 Babina,Tania,et al.Artificial intelligence,firm growth,and product innovation.Journal of Financial Economics 151(2024):103745.4 Eloundou,Tyna,Sam Manning,Pamela Mishkin,and Daniel Rock.“GPTs Are GPTs:Labor Market Impact Potential of LLMs.”Science,vol.384,no.6702,2023,pp.130608.5 Felten,Edward,Manav Raj,and Robert Seamans.“A Method to Link Advances in Artificial Intelligence to Occupational Abilities.”American Economic Association Papers and Proceedings,vol.108,2018,pp.5457.6 Felten,Ed,Manav Raj,and Robert Seamans.How will language modelers like ChatGPT affect occupations and industries?.arXiv preprint arXiv:2303.01157(2023).7 Korinek,Anton,and Donghyun Suh.Scenarios for the Transition to AGI.NBER Working Paper no.32255,National Bureau of Economic Research,2024.8 Wager,Stefan,and Susan Athey.“Estimation and Inference of Heterogeneous Treatment Effects Using Random Forests.”Journal of the American Statistical Association,vol.113,no.523,2018,pp.12281242.9 张丹丹,于航,李力行,胡佳胤,莫怡青,and 李泓孛.中国人工智能技术暴露度的测算及其对劳动需求的影响基于大语言模型的新证据.管理世界,no.7,2025,pp.5970.
2025-09-10
23页




5星级
中国科学院香港创新研究院 AI 中心译 1 美国卫生与公众服务部:人工智能在健康、公众服务和公共卫生中的应用战略计划 战略计划 2025 年 1 月 美国卫生与公众服务部 中国科学院香港创新研究院 A.
2025-09-10
193页




5星级
AIAI应用驱动应用驱动PCBPCB行业景气上行,行业景气上行,PCBPCB材料迎来重大机遇材料迎来重大机遇AIAI赋能化工之七赋能化工之七评级:推荐(首次覆盖)证券研究报告2025年09月09日PC.
2025-09-10
61页




5星级
液冷加速渗透,中国厂家迎出海机遇液冷加速渗透,中国厂家迎出海机遇分析师:分析师:丁志刚丁志刚(S0190524030003)石康石康(S1220517040001)郭亚男郭亚男(S0190522120.
2025-09-10
30页




5星级
海外映射视角下的海外映射视角下的AIAI应用投资机会应用投资机会证券研究报告2025年09月09日胡国鹏(证券分析师)袁稻雨(证券分析师)常毅翔(联系人)S0350521080003S03505210.
2025-09-10
28页




5星级
一窥 AI 未来:初创公司可借鉴的观点Future of AI:Perspectives for Startups202502 前言06 AI 趋势展望10 给创业者的建议 15 AI 发展方向:行业.
2025-09-10
81页




5星级
一马当先:AI规模化应用指南行业领跑者的经验分享作者森蒂尔拉马尼(Senthil Ramani)埃森哲全球数据与AI主管菲利普鲁西埃(Philippe Roussiere)埃森哲商业研究院全球创新与A.
2025-09-09
39页




5星级
智算产业发展研究报告(2025 年)中国电信研究院(天翼智库)2025 年 8 月智算产业发展研究报告(2025)编制说明主编单位:中国电信股份有限公司研究院(简称:中国电信研究院)顾问专家:中国电信.
2025-09-09
48页




5星级
江苏省人工智能产业标准体系建设指南(2025版)为贯彻落实省委、省政府加快人工智能发展部署要求,推进实施 国家人工智能产业综合标准化体系建设指南,加快以标准提升引领人工智能产业发展,特制定本指南。一.
2025-09-09
21页




5星级
GenAI数据(网页端)2025 Q2报告2025.09.08郎瀚威AIwatch.ai2aiwatch.ai 01前言12教育:语言教育、拍照搜题02总体分析13金融03Chatbot:AI Cha.
2025-09-09
263页




5星级
摘摘要要金融行业正经历从数字化向智能化的深刻转型,生成式人工智能及大模型成为这一变革的核心驱动力。然而,大模型在金融场景应用中存在局限性,如缺乏自主感知与决策执行能力、“幻觉”问题等。金融智能体应运而生,它通过“感知-推理-规划-执行-进化”的闭环机制,将大模型的认知能力转化为具体金融业务行动,有效打破流程壁垒,实现端到端自动化和实时响应,显著提升金融业务的效率和智能化水平。目前,我国金融智能体的应用呈现出单智能体与多智能体协同并存的态势,主要聚焦于客服、风控等核心场景,并不断深化。技术底座与金融场景深度融合,形成了专业化架构。蚂蚁数科立足“场景驱动、价值创造”,其金融智能体产品已经在银行、保险、证券等金融细分行业落地实践,覆盖财富管理、营销增长、信贷管理、风险防控等核心业务场景,真正实现“天天用、时时用”的规模化应用。本报告重点呈现核心 100 深度业务场景,在技术路径上从“通用智能”迈向“领域专精”,业务场景实现“广度覆盖”与“深度渗透”,商业模式注重“生态赋能”。未来,金融智能体将推动个性化与嵌入式金融服务、智能化产品设计、实时智能风险管理及全新合规监管模式的发展,驱动金融行业未来变革。主编柏亮零壹智库课题组成员柏亮、陈小辉、张燕雪马文波、章铖红、李自荣、蔡雨佳目目录录第一章拐点已至:智能体重塑金融未来.2一深层痛点:金融业体系瓶颈与技术局限.2(一)存量之困:金融行业现有体系的瓶颈.3(二)基石与局限:大模型的双重角色.4二破局之道:金融智能体的价值与潜力.5(一)金融智能体的核心价值.6(二)颠覆性潜力:智能体重塑金融生产力.8三金融智能体的演化路径:一场不可逆的生产力革命.10(一)从辅助走向主导:自动化与自治的演进.10(二)“人机协同”深度融合:重塑金融机构组织形态.10(三)新兴金融业态的催生:创新金融产品与服务.11第二章 浪潮涌起:金融智能体应用.12一金融智能体应用概况.12(一)单智能体与多智能体协同应用并存.12(二)智能体应用聚焦金融核心场景并逐步深化.13(三)技术底座与金融场景深度耦合的专业化架构逐渐形成.14二金融智能体落地实践以蚂蚁数科为例.14(一)案例全行级智能体平台实践.15(二)案例银行业务增长智能体体系.20(三)案例AI 原生手机银行.22(四)案例安全风控智能体实践.24(五)案例保险数据运营实践.26第三章蚂蚁数科 100 金融智能体深度业务场景全景解析.28一垂直行业分布.28(一)银行板块.29(二)证券板块.30(三)保险板块.31(四)通用板块.32二业务链条解析.33(一)客户服务场景重塑体验,提升效率.33(二)内部运营场景赋能员工,降本增效.33(三)营销与销售场景精准触达,提升转化.34(四)风险管理场景智能预警,防范未然.35(五)产品创新场景洞察需求,加速研发.35(六)决策支持场景数据驱动,辅助管理.36第四章蚂蚁数科智能体独特性与行业普遍性.37一技术路径从“通用智能”到“领域专精”.37(一)行业普遍性.37(二)蚂蚁数科的独特性.37二业务场景从“广度覆盖”到“深度渗透”.37(一)行业普遍性.37(二)蚂蚁数科的独特性.38三商业模式从“技术竞争”到“生态赋能”.38(一)行业普遍性.38(二)蚂蚁数科的独特性.38第五章结论与展望:金融智能体驱动的未来已来.39一结论.39二未来展望.39(一)个性化与嵌入式金融服务.39(二)智能化产品设计与创新.40(三)实时、智能的风险管理.40(四)全新合规与监管模式.401引引言言金融行业正处于关键转折点,生成式人工智能的突破,特别是大模型能力的显著提升,成为重要驱动力。在这一变革中,智能体作为核心载体,推动了金融生产力的显著变革。目前,金融行业在数字化方面取得了显著成就。业务流程逐步线上化、数据实现电子化管理、IT 基础设施建设日益完善。这些进步为金融服务效率的提升和覆盖面的扩大奠定了坚实基础。然而,数字化并非终点,金融体系仍然面临诸多瓶颈:历史遗留系统导致数据孤岛普遍存在;复杂的业务流程使自动化程度受限,难以实现端到端的流畅自动化;对非结构化数据(如合同、报告、语音记录)的处理能力不足,大量有价值的信息未能有效利用。大模型作为新一代人工智能的基石,为金融行业的智能化提供了强大的技术底座。它们凭借海量数据训练,具备卓越的自然语言理解、生成和推理能力,能够处理复杂文本、进行逻辑分析并生成高质量内容,显著降低了开发和应用的门槛,是金融智能化的“基建”。如果说大模型是“大脑”,那么智能体就是将这个“大脑”的认知能力转化为具体金融业务执行力的“身体”和“行动者”。金融智能体通过其独特的“感知-推理-规划-执行-进化”闭环机制,成为连接大模型与现实金融世界的桥梁。它能够自主感知外部环境,进行推理和决策,规划复杂任务的执行路径,并调用外部工具(API、系统接口、金融模型等)来完成具体操作,甚至根据执行结果进行学习优化。智能体的出现,使得金融机构能够将大模型的能力真正落地到复杂的业务流程中,实现从单点智能到流程智能、决策智能的飞跃。2第一章拐点已至:智能体重塑金融未来拐点已至:智能体重塑金融未来过去二十年,金融行业在数字化方面取得了显著成就:业务流程逐步线上化、数据实现电子化管理、IT 基础设施建设日益完善。这些进步为金融服务效率的提升和覆盖面的扩大奠定了坚实基础。如今,金融行业正处于一个关键的时代拐点,正在经历从传统模式向数字化、再向智能化的深刻转型。这一转型核心由生成式人工智能,特别是大模型(Large LanguageModels,LLMs)带来的能力范式跃迁所驱动,而智能体(AI Agent)则成为承载这些强大能力的核心载体,预示着金融生产力范式的根本性变革,具体见图 1-1。图 1-1金融行业的智能转型一、深层痛点:金融业体系瓶颈与技术局限一、深层痛点:金融业体系瓶颈与技术局限金融业在推动经济发展中扮演着关键角色,然而,其发展并非一帆风顺,面临着诸多深层痛点。其中,金融体系瓶颈与技术局限是制约其进一步发展的两大关键因素。这些瓶颈与局限不仅制约了金融业自身的创新与发展,也阻碍了其更好地服务于实体经济,成为亟待解决的深层痛点。因此,深入分析这些瓶颈与局限,并寻求有效的突破路径,对于推动金融业健康可持续发展具有重要意义。3(一)存量之困:金融行业现有体系的瓶颈当前的金融体系,尽管已具备一定数字化基础,但在高度复杂的业务场景下,依然面临流程固化、数据孤岛、人力成本高企、个性化服务不足等问题,这些“存量之困”构成了金融智能化转型的内在驱动力。1 1、流程固化与自动化断点、流程固化与自动化断点传统金融业务流程往往基于人工经验和预设规则构建,结构固化,难以快速适应不断变化的市场环境和客户需求。虽然部分流程实现了自动化,但大多局限于单一环节,难以实现端到端的流畅衔接。例如,KYC(Know Your Customer,了解你的客户)文件核验、复杂交易审批、贷后管理等流程涉及大量人工审核和跨系统操作,效率低下。从银行一线反馈的情况来看,当前金融机构在应对合规高要求、处理大量文件核验等实际痛点场景时,现有自动化模式仍显不足,自动化效率提升空间有限。2 2、数据孤岛与价值烟囱、数据孤岛与价值烟囱金融行业积累了大量的数据,然而这些数据往往分散在不同部门和系统中,它们之间的壁垒限制了数据的互联互通和整合分析,因此,金融行业内部普遍存在数据孤岛现象。这导致难以形成统一、全面的客户视图、风险画像和市场分析,数据价值难以充分释放。神州信息联席董事长王永利强调,数据壁垒是人工智能时代金融数智化转型亟须解决的关键问题之一1。1王永利.神州信息王永利:推动大模型金融应用需解决数据壁垒问题EB/OL.(2025-05-31)2025-06-13.https:/ 3、人力成本高与重复性工作、人力成本高与重复性工作金融行业属于劳动密集型行业,需要投入大量的人力资源。然而,随着劳动力成本不断上升,金融机构的人力成本压力越来越大。尤其是在经济下行时期,高企的人力成本会严重影响金融机构的盈利能力。同时,在现有体系下,大量金融行业员工仍需花费精力从事重复性、流程性的操作任务,如数据录入、文档整理、报告生成、标准查询回复等。这不仅占用了高素质专业人员的时间,降低了整体生产效率,也推高了运营成本。4 4、个性化服务不足与客户体验滞后、个性化服务不足与客户体验滞后面对海量客户群体,传统的金融服务模式难以实现千人千面的定制化金融产品和服务推荐。客户只能被动地接受金融机构提供的标准化产品和服务,缺乏选择权和参与感。客户需求响应速度慢,服务体验与互联网时代用户对“实时、个性化、便捷”的期待存在明显差距。剑桥大学替代金融中心AI研究主管Kieran Garvey等指出,传统方式难以有效实现个性化理财、动态风险评估等面向未来的金融服务进阶路径。(二)基石与局限:大模型的双重角色大模型作为金融智能化浪潮的技术基石,其强大的能力为解决上述“存量之困”带来了曙光。然而,其自身的固有局限性也催生了对更高层级智能形态“金融智能体”的需求。1 1、大模型的核心能力与价值、大模型的核心能力与价值大模型凭借其强大的语言理解、文本生成和推理能力,能够显著提升金融行业在信息处理、内容生成和分析辅助方面的效率。例如,它们可以快速摘要海量金融报告、生成初步的分析文档、辅助撰写邮件或客户沟通脚本,并在智能客服、文档问答等场景中展现出色的表现。正如英国投资协会技术工作组主席Michelle Scrimgeour所言,生成式AI带来了能力范式的跃迁,为投资管理带来了巨大的创新空间。中国人民银行科技司司长李伟也指出,大模型正逐步落地,有望统筹业务、提升协同与创新能力,并有望催生新型金融服务模式2。2 2、大模型在金融场景下的局限、大模型在金融场景下的局限尽管能力强大,大模型本身在金融行业的复杂应用场景下存在显著局限(表 1-1),这正是智能体诞生的必要性所在。2新浪财经.人民银行科技司司长李伟:稳妥有序推进金融领域人工智能大模型应用EB/OL.(2025-05-06)2025-06-13.https:/ 1-1大模型在金融场景下的局限表现这些局限性表明,简单地将大模型应用于金融业务难以实现真正的端到端智能化,必须构建一个能够将模型能力转化为实际行动的桥梁,这就是金融智能体诞生的必要性。二、破局之道:金融智能体的价值与潜力二、破局之道:金融智能体的价值与潜力金融智能体正是为了弥合大模型的局限性与金融业务的复杂需求之间的鸿沟而诞生的。它将大模型的强大认知能力与自主行动能力相结合,为解决当前的“存量之困”提供了破局之道。6(一)金融智能体的核心价值1 1、金融智能体的定义、金融智能体的定义金融智能体(Financial AI Agent)是一个具备一定自主性的AI实体,它能够感知其所处的金融环境,基于内部的模型或知识进行推理和决策,规划实现目标的行动步骤,并通过调用外部工具或系统接口来执行复杂金融任务,并根据执行结果进行反馈和调整。其核心在于构建一个“感知-推理-规划-执行-进化”的闭环机制,具体见图 1-2。剑桥大学Kieran Garvey等将Agentic AI定义为较传统GenAI,是更能自主学习、协作推理与自动决策的新一代AI形态。图 1-2金融智能体的能力2 2、金融智能体的核心模块、金融智能体的核心模块一个完整的金融智能体通常包含以下六大核心模块,现针对每个模块提出细化与增强建议,旨在构建一个更强大、更智能、更安全且能持续进化的金融智能体:(1)业务场景支撑:定制化智能体与市场资讯处理设计精细化和场景化的智能体,强化实时市场洞察与个性化服务能力。一是深化金融场景智能体。比如理财智能体细分客户风险承受能力(保守型、稳健型、积极型)与投资偏好(股票、基金、债券、贵金属)设计差异化推荐策略。二是升级市场资讯处理能力。如应用Transformer等深度学习模型,对海量市场资讯进行情感分析,量化市场7情绪,辅助投资决策。构建事件驱动的知识图谱,自动识别市场重大事件(如政策变动、公司并购),分析其对金融市场的影响,并及时推送给用户。(2)知识供给体系:构建全面、专业的金融知识库提升金融知识库的结构化程度、专业度和更新频率,确保金融智能体拥有高质量的知识源。一是增强产品知识库。利用知识图谱技术,构建理财、保险、信贷等金融产品的知识图谱,清晰展示产品特点、适用人群、风险等级等信息。定期更新金融产品知识,确保信息准确性和时效性。建立产品评价体系,收集用户反馈和专家评价,为用户提供更客观的产品参考信息。二是精细化管理场景知识。针对不同金融场景(如投资咨询、风险评估、信贷审批),构建专项知识库,提升金融智能体在特定场景下的专业能力。(3)专业工具与模型:打造全流程金融服务工具箱提升工具模型的智能化水平和覆盖范围,实现金融服务的自动化和智能化。一是优化和扩展小模型库。利用机器学习技术,优化风险评估模型,提高风险预测准确性,例如使用GA-SVM算法更精确地评估房地产企业的信用风险。设计更多定制化推荐模型,根据用户需求和市场情况,提供个性化的产品推荐服务。二是专业工具智能化升级。利用AI技术,实现活动配置和产品组合的智能化,例如自动生成营销活动方案、智能优化资产配置组合。参考NIST网络安全框架,强化工具的安全性设计,确保用户数据安全。(4)安全合规围栏:构建多层次金融安全防护体系构建主动防御体系,提升风险预测和应对能力,确保业务安全合规。一是升级风控体系。利用大数据技术,实时监控金融风险因素,及时发现异常情况并发出预警。融合多种风险模型,构建多层次风险评估体系,全面评估金融风险。定期更新和优化风险模型,提升风险预测的准确性和时效性。二是强化安全防护。继续加强专职安全人员队伍建设,提升安全防护能力。常态化开展红蓝对抗攻防演练,及时发现和修复安全漏洞,提升系统安全性。(5)底层数据与模型基建:打造坚实的数据和模型基础提升数据质量和模型性能,为金融智能体提供强大的底层支撑。一是优化大数据中枢。优化数据接入和处理流程,提升数据质量和实时性。采用联邦学习等技术,实现多源数据融合,扩大数据覆盖范围。加强数据安全管理,确保用户数据安全和隐私。二是金融行业大模型精调。持续扩充金融语料库,利用千亿级金融语料训练,提升模型金融知识储备和理解能力。与金融专家合作,进行指令对齐优化,提升模型在金融场景下的指令理解和执行能力。探索多模态大模型,支持文本、图像、语音等多种输入方式,提8升金融智能体的交互能力和服务范围。(6)持续优化机制:构建自进化的智能体实现智能体的持续学习和进化,确保其始终保持领先水平。一是迭代闭环优化。建立完善的人工标注反馈机制,及时收集用户反馈和专家意见,指导模型优化。应用强化学习技术,让智能体在实际应用中不断学习和优化策略。二是规模化落地路径。制定详细的流程和指南,规范智能体的开发、部署和应用,确保规模化落地。建立知识共享平台,促进团队成员之间的知识交流和协作,共同提升智能体的能力。引入A/B测试等方法,评估不同优化方案的效果,选择最优方案进行推广。通过以上六个模块的增强,可以构建一个更强大、更智能、更安全且能持续进化的金融智能体,为用户提供更优质、更专业的金融服务。同时,需要关注AI伦理和监管合规,确保AI应用符合相关法律法规和伦理规范。3 3、金融、金融智能智能体的核心价值体的核心价值金融智能体凭借其独特的架构和能力,能够为金融行业带来颠覆性的价值,具体见表 1-2。表 1-2金融智能体的核心价值(二)颠覆性潜力:智能体重塑金融生产力金融智能体不仅仅是现有工具的简单升级,其自主工作能力正在从根本上重塑金融行业的生产方式,释放巨大的生产力。1 1、打破流程壁垒,实现端到端自动化、打破流程壁垒,实现端到端自动化智能体的核心优势在于能够感知、规划并执行复杂任务链,从而打破传统流程中的自动化断点,实现端到端的流程自动化。例如,从接收客户贷款申请到完成身份核验(KYC)、信用评估、合同生成、放款通知等一系列跨系统、跨环节的操作,都可以由9智能体协同完成。一线银行AI负责人的实践经验表明,通过智能体实现的自动化KYC文件核验能够提升 60%的审核效率,客服智能体可自动解决 70%的标准客户查询,显著提升效率、降低运营开支。2 2、自主自主感知与实时响应感知与实时响应智能体能够通过感知器实时监控内外部环境变化,例如市场价格波动、风险事件发生、客户行为模式改变或突发事件。基于这些实时感知的信息,智能体能够迅速进行分析和决策,并触发相应的行动,实现金融业务的实时、动态响应。剑桥大学的KieranGarvey和世界经济论坛的相关报告指出,智能体可实现实时市场响应和动态风控,这超越了传统基于滞后数据和人工分析的处理模式。3 3、智能、智能规划规划与复杂任务执行与复杂任务执行面对一个高层级的业务目标(如“为客户生成一份定制化投资报告”),智能体能够自主将其分解为一系列具体的子任务(如“查询客户持仓”、“获取最新市场数据”、“运行资产配置模型”、“根据模型结果撰写报告草稿”、“格式化报告”),并规划执行顺序。通过调用相应的外部工具(如投资模型API、报告生成工具),智能体能够自主完成整个复杂任务链。尽管纯粹的“强自主性”通用智能体在金融领域的稳定性仍需提升,但结合传统工作流的混合方式已能有效增强任务执行能力。此外,MCP(ModelContext Protocol)等协议,作为连接大模型与外部工具的“万能接口”,进一步提升了智能体调用外部工具的集成度和效率。4 4、持续学习与自我优化、持续学习与自我优化优秀的金融智能体具备从历史任务执行中学习的能力。通过分析成功或失败的案例,智能体可以不断优化其决策逻辑、规划策略和工具调用方式,提高应对复杂和未知情况的能力,从而在长期应用中持续提升性能和准确性。5 5、降低金融服务的门槛和成本降低金融服务的门槛和成本金融智能体的自动化和低成本特性使其能够有效地触达传统金融服务难以覆盖的边缘人群和欠发达地区。通过智能体自动化微贷风险评估、提供定制化的移动银行保险产品、简化开户流程等方式,显著降低金融服务的门槛和成本,推动金融普惠的实现。Kieran Garvey和世界经济论坛将此列为Agentic AI在金融领域的重要创新优势之一。10三、金融智能体的演化路径:一场不可逆的生产力革命三、金融智能体的演化路径:一场不可逆的生产力革命金融智能体在金融体系中的角色正在逐步演进,引领一场不可逆的生产力革命,其发展轨迹从最初的辅助工具向更高级别的协作者发展,在特定场景下甚至可能成为任务主导者。然而,鉴于金融行业的高度监管和风险敏感性,人机深度协同将是金融智能体的长期共存形态,具体见图 1-3。图 1-3金融智能体的角色演进(一)从辅助走向主导:自动化与自治的演进最初,人工智能(AI)主要在金融领域扮演辅助角色,例如自动化数据录入、报表生成等。但随着机器学习(ML)算法的进步和算力的提升,AI在金融领域的应用正迅速扩展至更复杂的任务,如风险评估、欺诈检测和投资组合优化。智能体,作为AI在金融领域的具体化应用,将逐步承担更多的决策与执行职责。例如,在信贷审批方面,智能体可以分析大量的企业财务数据和市场信息,更准确地评估企业的信用风险。在交易执行方面,智能体可以根据预设的算法和市场条件,自动执行交易,提高交易效率。最终,在特定领域,例如高频交易、智能投顾等,智能体有望实现自动化甚至自治,自主完成投资决策和风险管理。(二)“人机协同”深度融合:重塑金融机构组织形态未来,金融机构的组织形态将发生深刻变革,人与智能体之间的协同将成为主流模式。智能体将成为金融专业人士的“超级助理”,提供实时的市场分析、风险预警和投11资建议,帮助金融专业人士更高效地完成工作。更进一步,智能体将与金融专业人士“并肩作战”,共同服务客户、管理风险、进行投资决策。例如,在客户服务方面,智能体可以处理大量的日常咨询,并根据客户的需求提供个性化的理财建议,而金融顾问则可以专注于为高净值客户提供更专业的服务。在风险管理方面,智能体可以实时监控市场风险和信用风险,并及时发出预警,而风险管理人员则可以根据智能体的建议,采取相应的风险控制措施。这种人机协同的模式将充分发挥人和机器的优势,提高金融服务的效率和质量。(三)新兴金融业态的催生:创新金融产品与服务基于智能体的全新金融产品、服务模式和风险管理体系将不断涌现,推动金融业态的创新发展。高度个性化的实时理财顾问将成为可能,智能体可以根据客户的财务状况、风险偏好和投资目标,量身定制投资方案,并提供实时的投资建议。全自动化的交易执行与风控闭环将提高交易效率和风险管理水平,智能体可以根据预设的算法和市场条件,自动执行交易,并实时监控交易风险,及时采取风控措施。智能合规审计代理将降低合规成本和操作风险,智能体可以自动审查交易记录和财务报表,识别潜在的违规行为,并生成合规报告。这些新兴金融业态将为客户提供更高效、便捷和个性化的金融服务,同时也为金融机构带来新的增长机会。综上可见,金融智能体的演化路径是一场不可逆的生产力革命,它将重塑金融行业的组织形态、业务模式和技术体系,为金融业带来前所未有的机遇和挑战。通过合理利用AI和智能体技术,金融机构可以提高效率、降低成本、改善客户体验,并在激烈的市场竞争中脱颖而出。12第二章浪潮涌起:金融智能体应用浪潮涌起:金融智能体应用一、金融智能体应用概况一、金融智能体应用概况金融智能体作为大模型技术的进阶,正重塑国内金融行业格局。它突破大模型仅具备语言理解生成的局限,通过感知、规划、记忆和行动能力形成闭环反馈系统,实现从“被动问答”到“主动决策”的跨越。当前,智能体的金融业务场景以“金融业务 RPA(Robotic ProcessAutomation)”为主3,在客服、风控等场景实现规则化任务自动化,但受基座模型能力、思维链技术等限制,尚未实现完全自主工作。不过,随着 DeepSeek-V3 等大模型迭代、蚂蚁 AgentUniverse 等平台开源,以及算力成本下降,智能体在投研分析、量化交易等复杂场景的多智能体协同应用逐步展开,正从单一工具向全业务链智能化解决方案演进。(一)单智能体与多智能体协同应用并存当前金融智能体应用中,单智能体与多智能体协同应用并存。单智能体通过结合智能体应用框架,在信贷审批、客户服务、文档审批等具有一定规划要求但业务复杂度不3 黄悠文,叶敏,师祺.智能体在金融业务领域应用的全景洞察:从概念到评估EB/OL.北京:CAICT 金融科技,2025-01-212025-06-10.https:/ Erica、摩根大通 COiN 等也在海外展现类似价值。智能投顾类智能体赋能财富管理,如工商银行“AI 投顾”平台结合大模型和行为画像生成个性化资产配置建议,高盛 Marcus Invest 机器人顾问为中产客户提供投资建议。风险管理与欺诈检测智能体成为关键方向,花旗银行与 Feedzai 合作的系统、中国农业银行4周宁人,张璐.区域型银行如何实现 AI 战略突围?EB/OL.上海:麦肯锡,2025-06-112025-06-12.https:/ 诸赞松.银行业智能化转型:AI 智能体的变革力量与未来展望EB/OL.北京:清华金融评论,2025-06-112025-06-12.https:/ LangChain、AutoGPT、蚂蚁 AgentUniverse 等多智能体框架,结合 DeepSeek-V3 等大模型的金融垂类微调,实现“感知规划记忆行动”闭环。中层通过 RAG(检索增强生成)技术整合产品知识库、投研观点库等异构数据,如天府绛溪实验室的投资助理智能体能将初步研究时间压缩 80%,行业分析精准度突破95%,并推动投资决策效率跃升 70%6。上层通过 PEER 协作模式(如支小助的计划执行表达评价循环)实现复杂任务拆解。随着人工智能与金融的深度融合,人工智能在金融领域的应用场景不断拓展,从信贷管理到风险防控,再到承保核赔以及信息披露审核等,为金融业务的创新与发展提供了有力支持。同时,区块链、隐私计算等新技术的运用,进一步推动了金融数据安全与合规应用,进一步推动了金融监管领域的数字化与智能化发展。模型安全平台与合规引擎的集成,确保智能体在金融数据脱敏、监管合规等方面的落地可行性。二、金融智能体落地实践二、金融智能体落地实践以蚂蚁数科为例以蚂蚁数科为例在金融行业智能化转型的浪潮中,蚂蚁数科凭借深厚的技术积累与行业洞察,构建起覆盖财富管理、精准营销、风险管控、数据分析等核心领域的金融智能体矩阵,依托Agentar 金融智能体开发平台、AI 大模型服务网关等全栈技术体系,推动智能体解决方案在银行、保险、证券等多元金融场景落地生根。据此,我们以蚂蚁数科的实践为例,可以清晰地洞察到我国金融智能体的发展风貌。以下将从背景痛点、解决方案、技术亮点以及业务成效与价值四个层面,深入解析其在银行、保险领域的智能体应用案例,一探我国金融智能体在实际业务场景中的运作细节与创新模式。6 成都商报红星新闻.天府实验室研发的投资助理智能体,在金融投资领域找到“新场景”EB/OL.成都:成都商报红星新闻官方账号,2025-03-252025-06-09.https:/ 1、背景痛点、背景痛点金融行业数字化进程加速,客户对个性化服务(如动态理财建议、实时风险预警)需求激增,传统规则引擎与人工服务模式难以满足“千人千策”要求,导致客户黏性不足。其次,内部效能瓶颈突出,前台行员服务半径受限,缺乏实时投研支持,后台知识管理分散导致服务专业性不足。2 2、解决方案、解决方案以金融大模型为核心,结合外部客户与内部行员需求,构建覆盖全业务线的智能化平台能力,通过建设全行级金融大模型,重塑数智化时代的客户体验和业务范式。通过分阶段落地实施,实现从传统业务模式向数智化业务模式的全面转型,推动客户价值、行员价值和业务价值的全面提升,助力在未来竞争中占据领先地位。金融大模型的落地场景规划为两大方向(图 2-1),分别为:(1 1)ToCToC AIAI 智能助理(面向客户版):智能助理(面向客户版):提供直接服务于外部终端客户的智能化解决方案,例如个性化理财推荐、智能投顾等。目标客户:面向手机银行 App 的客户,面向个金业务。优化客户体验,提升客户满意度与粘性。(2 2)ToPToP AIAI 行员助手(面向行员版):行员助手(面向行员版):为银行内部员工提供智能辅助工具,如客户洞察、业务推荐及运营支持。目标客户:优先服务前台对客营销客户经理,再覆盖中后台运营岗和管理岗。提升行员的工作效率与决策能力,助力业务增长。16图 2-1金融大模型的落地场景该金融智能体平台以蚂蚁数科金融大模型为核心,构建了“底层算力支撑-中台能力整合-上层场景落地”的完整技术架构,实现了从技术底座到业务应用的全链条贯通。金融大模型作为“大脑”,依托知识库的专业知识,在关键平台的支撑下,生成智能化服务(如理财推荐、行员辅助),最终通过端侧平台触达用户,并通过运营数据反哺模型优化,实现技术与业务的双向驱动。(1)核心驱动:蚂蚁数科金融行业大语言模型是整个技术方案的“智能引擎”,具备金融知识问答、文本摘要、市场分析等核心能力,支持 14B 和 72B 两种参数规模,适配不同算力场景。(2)知识供给:多维度金融知识库体系。知识库通过蚂蚁数科金融行业知识库管理引擎与大模型对接,通过自建的知识库检索高时效、可信、丰富的知识,确保大模型输出符合金融行业的严谨性要求(图 2-2)。17图 2-2金融知识库构成(3)技术支撑:全链路关键 AI 基础平台产品。该项目构建了“底层算力支撑-中台能力整合-上层场景落地”的完整技术架构。图 2-3蚂蚁数科金融行业大语言模型以底层算力平台为基础,构建起全链路的智能体开发与运营能力。底层支撑层:智能计算平台实现异构算力池化管理,智能运维软件实时监控大模型运行状态,三者共同为大模型训练与推理提供稳定的算力支撑。18中台能力整合形成技术枢纽,AIPaaS 平台通过 Agent 智能体研发平台、Max 训练推理平台等组件,实现智能体及模型从开发、微调至部署的全流程管理;数据智能平台通过DI 与 DP平台完成数据洞察与研发治理;模型安全与评测平台则通过大模型评测平台、大模型防御引擎等工具保障大模型安全可控,蚂蚁数科金融行业知识库管理引擎进一步链接金融知识库与大模型,确保内容生成的专业性。端智能重塑手机银行 APP 交互模式,助力银行用户界面从传统 GUI 升级为更智能、更便捷的 LUI/CUI 模式,实现抽屉式菜单界面到对话式、指令式服务界面的转换。通过端智能平台和运营优化平台,将智能体能力嵌入 ToC(手机银行 App)和 ToP(掌上银行系统)场景。LUI 动态卡片平台与移动 AI 流式网关优化用户交互体验,智能搜推与运营优化平台驱动业务增长。表 2-1关键平台或产品简介3 3、技术亮点、技术亮点(1)全栈自研与整合。依托蚂蚁完整技术栈构建全行级智能体平台,从底层智算基础,到中台 AI PaaS 能力,再到数据智能、模型安全、端智能等全链条,技术同源性保障系统兼容性与协同性,避免多技术来源的适配难题,加速平台搭建与迭代,形成全面自主可控的 AI 基础平台技术架构。19(2)打造全行级智能体平台,打破业务条线技术与数据壁垒。以统一技术底座,支撑覆盖 ToC(如理财、基金、信用卡智能服务)、ToP(如客户经理助手)等 30 智能体场景,实现客户服务、行员效率、业务运营全维度智能化升级,推动金融服务模式从“单点支撑”向“全域协同”演进,释放规模效应与协同价值。(3)金融场景深度适配。借助蚂蚁对金融场景的深度理解,蚂蚁数科金融行业知识库管理引擎联动金融知识库,保障大模型输出符合金融严谨性;模型安全平台针对性解决金融大模型安全合规问题,让技术栈优势精准落地金融业务,助力银行构建差异化智能服务能力。(4)构建起多维度严苛评测体系,包含相关性、专业性、表达层等维度,保障金融智能体服务质量(表 2-2)。表 2-2评测体系4 4、业务成效与价值、业务成效与价值该项目能帮助银行建设全行级金融业务智能体,依托蚂蚁集团在金融 AI 领域的实践经验,及 AI 全技术栈端到端平台化能力,助力金融机构“热启动”快速搭建 AI 金融智能化应用,实现显著成效与多重价值。ToC 端 30 智能体覆盖理财、基金、信用卡等场景,预计服务超数千万客户群体,客户体验提升预计 8-10 倍,实现从被动问答到主动营销升级;ToP 端行员助手预计扩大客户经理服务半径 2-10 倍,提升投研投顾专业度与工作效率。20通过构建财富知识中台,整合产品、投研等知识库,实现知识标准化沉淀与复用,降低运营成本。同时,搭建端到端全栈 AI 技术平台,形成金融级工程化能力,3-6 个月内完成从 AI 基础平台及 7 大个金领域智能场景落地,并形成可复制的技术方案,推动银行数智化转型,为行业智能化发展提供标杆。(二)案例银行业务增长智能体体系1 1、背景痛点、背景痛点传统技术架构下,银行零售业务面临客户服务、产品推荐、营销触达等核心环节的效率与体验瓶颈,难以有效支撑个性化服务需求与业务流程效率提升。具体来看:(1)内部服务端:理财经理/客户经理操作界面分散,业务人员需跨多个界面处理常规咨询,耗时严重;(2)客户经营端:缺乏全生命周期精细化策略,客户持续服务覆盖不足,业务机会识别滞后;(3)交互渠道端:手机银行等线上平台服务模式标准化,个性化推荐能力缺失,用户黏性待提升。2 2、解决方案、解决方案该类项目通过 AI 智能化技术构建面向业务增长的智能体体系,通过多个业务智能体赋能零售业务线,提升财富管理领域的数智化水平。针对银行各个业务角色提供 toP、toO、toC 的场景赋能,构建零售业务客户精细化经营的基础设施。技术架构上,依托金融专用大模型基座,采用“通用层 业务层”协同框架,如客户咨询触发ToC智能体后联动引推品智能体,结合动态调度与金融知识库支持策略迭代。各智能体角色定位具体见表 2-3 所示。21表 2-3蚂蚁数科银行智能体体系角色定位与关键能力3 3、技术亮点、技术亮点该方案通过大模型技术深度应用、多智能体协同架构创新、大小模型协同优化机制三大核心技术突破,解决传统零售业务在需求解析、策略协同、场景适配层面的效率与体验瓶颈,为银行零售业务转型提供技术范式,具体见表 2-4。表 2-4蚂蚁数科银行智能体体系技术亮点4 4、业务成效与价值、业务成效与价值目前,通过与部分银行合作共建,已初步验证该方案能够在服务效能、客户体验等多个方面带来较为显著的效果。以面向零售理财客户经理服务为例,通过 AI 智能助理辅助理财经理扩大客户服务半径、提升服务响应时效性。理财师相当于同时拥有了三个数字分身助手,客户需求专家 理财分析专家 销售专家,整体效率预计提升 5 倍 。22此案例突出了智能体体系在零售银行业务增长中的关键价值,通过构建面向不同角色的多智能体协同工作模式,有效提升了业务人员效率和服务覆盖能力。大模型与小模型的协同策略是其重要的技术亮点,平衡了泛化能力和场景适配深度。预期的理财师服务能力大幅提升,有力印证了智能体在赋能员工、扩大服务半径方面的巨大潜力。(三)案例AI 原生手机银行1 1、背景痛点、背景痛点随着金融科技的快速发展,传统手机银行 APP 的用户体验逐渐暴露出诸多问题,如操作流程繁琐、功能界面复杂、适老化不足等。传统手机银行 APP 界面复杂,功能图标繁多,用户需要在多个菜单和界面中来回切换,操作繁琐,尤其对于老年用户来说,使用门槛较高。为化解这些矛盾,需积极探索创新的解决方案,以满足用户日益增长的数字化金融服务需求:(1)打破传统 GUI 界面束缚,以自然语言交互重构操作路径,显著降低交互复杂度;(2)通过多智能体协作与大模型技术构建“千人千面”的精准服务体系,满足个性化需求;(3)构建跨生态可信 AI 应用体系,在兼容年轻用户高效诉求与老年群体适老需求的同时,运用知识约束机制解决大模型“幻觉”风险,筑牢金融级严谨性底座。2 2、解决方案、解决方案行业内多家银行机构携手蚂蚁数科打造 AI 原生手机银行,采用“对话即服务”的理念,将传统的 GUI 模式转变为 LUI 模式。用户只需通过语音或文字与智能伙伴进行对话,即可完成账户查询、转账汇款、理财咨询等操作。在建设中,针对自然语言理解精准性、金融级严谨性、复杂业务场景智能化三大核心挑战,通过技术创新实现关键突破,具体见表 2-5。23表 2-5AI原生手机银行智能体挑战与解决方案3 3、技术亮点技术亮点AI 原生手机银行的实现,依赖多项前沿技术的协同。蚂蚁数科打造了一套从“算力-数据-模型-应用”全链条贯通的一站式企业级智能体开发平台,从最底层的计算能力到最终落地的应用场景,拥有全栈的技术产品矩阵,并且经过了规模化业务的验证。该平台能够支持不同的开发模式,还支持本地化、SaaS化以及混合云等多种部署方式。同时,构建起一套覆盖平台开发、模型管理、场景落地的完整技术体系,以技术驱动实现手机银行服务的智能化升级(表 2-6)。表 2-6蚂蚁数科AI原生银行关键技术244 4、业务成效与价值、业务成效与价值该类项目通过 LUI 重构 多智能体协同能力,构建“语言交互-场景穿透-价值闭环”的全链路智能服务体系,加速金融服务从工具属性向体验升级跃迁,具体见表 2-7。表 2-7蚂蚁数科AI原生银行智能体业务成效AI 原生手机银行是一个“多智能体的 AI 专家”。无论是理财、保险、养老、旅游还是其他服务,通过训练整合各领域专家能力的 AI 专家都能够快速提供专业参考建议,突破了传统客户经理的个人知识限制。该项目展示了 AI 原生设计在重塑用户侧金融服务交互模式方面的巨大潜力,核心在于通过自然语言交互和智能体将复杂业务操作进行大幅简化。其成功关键在于结合金融领域知识(知识图谱、业务规则)解决大模型准确性与合规性挑战,并辅以全面的平台和陪跑服务。首家 AI 原生手机银行的推出,证明了在“AI 平权”时代,中小银行也有机会小跑创新,实现自身的变革式突破。(四)案例安全风控智能体实践1 1、背景痛点、背景痛点在与部分金融机构合作过程中,我们发现金融机构在风控过程中面临着多方面的挑战,大致归纳如下:(1)尽调报告数据维度数量多,数据结构复杂,非标的尽调素材阅读极耗费时间;(2)部分场景样本少,数据复杂,传统机器学习方法无法支持做到自动决策;(3)模型开发周期长、成本高,由于建模人员时间有限,导致模型训练不充分,影响了模型的准确性和可靠性;(4)建模人员的经验水平存在较大差异,这直接影响了模型的质量和效果;25(5)对离线端的可信建模特征环境有诉求,确保数据的安全性和模型的准确性。2 2、解决方案、解决方案面对上述风控领域的痛点,蚂蚁数科提供了安全风控智能体,基于领先的人工智能和数据处理技术,提供了一套全面的智能风控体系解决方案。该方案涵盖了信贷尽调、特征衍生、智能建模和策略生成等多个环节,旨在通过科技赋能,助力金融机构构建智能化的风控系统。(1)信贷尽调:解析银行或机构历史沉淀的尽调报告内容,获取特征;(2)特征衍生:从原始数据中提取或创建新的特征,增强模型可解释性,提高模型的预测能力;(3)智能建模:依托大模型的意图和推理能力理解用户的建模需求,并基于目标自主驱动模型构建流程,提升建模效果和效率;(4)策略生成:通过 Agent 自主规划的“生成 评估 迭代”闭环,为客户在反欺诈、额度、利率等环节提供风险收益更高的策略建议。3 3、技术亮点、技术亮点安全风控智能体凭借其卓越的技术亮点,为金融机构和合作伙伴提供了高效、精准的风险控制解决方案。这些技术亮点不仅提升了风控模型的开发效率和质量,还为金融机构在复杂多变的市场环境中提供了坚实的保障,详见表 2-8。表 2-8安全风控智能体技术亮点4 4、业务成效与价值、业务成效与价值安全风控智能体已邀请多家客户进行试用,获得多位客户的肯定,并有客户已进入商务签约环节。在实际应用中,安全风控智能体表现出显著的效果,详见表 2-9。26表 2-9安全风控智能体业务成效(五)案例保险数据运营实践1、背景痛点、背景痛点当前保险行业处于强监管与快速变化的环境中。(1)监管政策频繁变动,如医疗险销售规则每年调整,使得运营策略必须快速迭代;(2)行业内数据基建薄弱,人工难以完成运营全链路归因,造成转化效果回收不全,优化跟不上节奏;(3)转化链路效果衰减快,策略迭代周期长,对服务商贡献评估缺乏清晰标准,难以精准判断各环节效果。多重问题叠加之下,保险企业在运营管理、策略优化上急需新的解决方案。2 2、解决方案解决方案为有效破解上述运营困境,保险行业亟须引入创新技术手段实现突围。数据运营智能体凭借其强大的数据处理与智能决策能力,以多 Agent 分工协作,聚焦保险企业运营核心需求,以四大核心功能精准靶向痛点。从会员运营、业务咨询、风险管控到策略执行,全方位提升运营效能,为保险企业在多变的市场环境中注入新动能,助力其实现高效、精准的运营管理,具体见图 2-4。(1)会员复购提升:基于数据分层与人群画像制定差异化触达策略,优化存量会员复购效果;(2)智能咨询解答:搭建知识库提供核保顾问、智能投顾等实时服务,解决业务积压;(3)风险监控与归因分析:自动追踪营销活动效果来源,如服务商贡献、外呼/短信转化率,快速定位问题并迭代策略;(4)策略生成与执行:根据目标产品,如宠物险,生成话术素材,输出具体执行计划(外呼/投流/短信),分配任务并闭环跟踪效果。27图 2-4蚂蚁数科保险数据运营智能体逻辑架构图3、技术亮点、技术亮点数据运营智能体方案之所以能有效应对保险行业运营痛点,源于背后强大的技术支撑。该智能体方案依托 AI 安全运营智能体平台,以三项关键技术为核心驱动力,从数据挖掘、工作流程到人工干预,全方位保障方案落地的精准性、高效性与安全性,为保险企业的运营升级筑牢技术根基。(1)联合建模与知识库构建:结合企业知识库与客户行为数据筛选人群(需客户共享后续行为数据);(2)自动化工作流闭环:内容生成知识查询执行计划效果归因策略优化,形成动态迭代;(3)渐进式人工干预机制:初期人工监督执行过程,后期逐步减少干预,确保策略安全性。4、业务成效与价值、业务成效与价值在历经约半年精心研发后,数据运营智能体项目即将迎来推广复制阶段,预计 8 月底前便能开启新征程。在实际应用中,该智能体已在标杆保险公司中展现出强大实力。表 2-10智能体业务成效28第三章蚂蚁数科蚂蚁数科 100 金融智能体金融智能体深度业务深度业务场景全景解析场景全景解析蚂蚁数科金融智能体的强大能力,最终体现在其对金融业务全价值链的广泛渗透与深度赋能。其超过 100 个的深度业务场景,不仅展示了技术的广度,更彰显了对金融业务理解的深度。这些场景系统性地覆盖了从外部客户服务到内部运营管理,从精准营销到严密风控的各个关键环节。本章将对这些丰富的业务场景进行全景式解析,以揭示金融智能体如何重塑金融服务的生产与消费范式。一、垂直行业分布一、垂直行业分布在数字经济时代,人工智能正以前所未有的速度重塑金融行业生态。作为金融科技创新的重要推动者,蚂蚁数科智能体依托领先的AI技术能力,构建了覆盖银行、证券、保险及通用场景的全方位解决方案体系。这些智能体不仅深度融入各细分领域的核心业务流程,更通过场景化、智能化的服务模式,持续推动金融服务向更高效、更精准、更普惠的方向演进。从银行网点的智能化改造到证券投研的数字化升级,从保险全流程的自动化运营到跨行业的通用能力建设,蚂蚁数科智能体正在重新定义金融服务的边界与可能。以下将从银行、证券、保险及通用四大板块,全面解析蚂蚁数科智能体如何通过技术创新赋能金融行业转型升级,为机构客户创造切实价值,最终实现“科技让金融更普惠”的愿景。图 3-1蚂蚁数科 100 金融智能体深度业务场景29(一)银行板块蚂蚁数科智能体在银行领域构建了覆盖零售金融、经营分析、信贷风控及营销管理的全场景解决方案。在客户服务侧,AI原生手机银行提供账户管理、信用卡还款、情感陪伴等智能化功能,同时通过适老关怀提升普惠金融体验;在经营分析中,智能助手可自动生成分支行报告、挖掘商机,赋能精细化管理;零售业务场景下,从实时行情问答到客群智能推品,从持仓解读到投资决策辅助,全面升级财富管理服务;信贷风控环节则通过AI尽调报告生成、智能审核、风险预警等工具,实现全流程自动化与精准防控;此外,营销助手和通用助手进一步优化客户触达与内部协同效率,推动银行业务向数据驱动范式转型。表 3-1蚂蚁数科银行板块智能体深度业务场景详表图 3-2 蚂蚁数科银行板块智能体深度业务场景占比图30(二)证券板块蚂蚁数科智能体为证券行业提供覆盖投研、投顾、合规与运营的智能化支持。在投资研究领域,智能体可辅助生成研报框架、总结路演要点,并快速分析市场事件影响;投资顾问场景下,通过初选投顾方案、预处理理财产品问答,提升服务响应速度;风险控制模块聚焦客户流失预警,而合规审查则通过合同初审、交易存证等功能降低合规风险;通过智能运营工具,如信披报告初审、营销物料合规提示等,进一步优化中后台效率,助力券商实现业务敏捷性与合规性的平衡。表 3-2蚂蚁数科证券板块智能体深度业务场景详表图 3-3蚂蚁数科证券板块智能体深度业务场景占比图31(三)保险板块蚂蚁数科智能体深度融入保险业务全链条,推动产品创新与服务升级。在产品及客户服务中,智能体赋能代理人助手、个性化方案推荐及投诉根因分析,提升销售转化与用户体验;承保管理环节通过自动报价、核单及风勘报告生成,显著缩短业务周期;理赔服务依托智能定责定损、反欺诈技术,实现车险、健康险等多险种的高效处理;合规与监管模块提供稽核检查、政策摘要生成等工具,确保业务合规性;此外,数据资产管理实现保险数据的智能分级分类,为精细化运营夯实基础。表 3-3蚂蚁数科保险板块智能体深度业务场景详表图 3-4蚂蚁数科保险板块智能体深度业务场景占比图32(四)通用板块蚂蚁数科智能体的通用能力模块横跨金融与泛行业场景,聚焦安全合规、客户体验与效能提升。安全合规领域涵盖内容审核、合同审查,筑牢风险防线;客户体验工具通过标签挖掘与用户洞察,优化交互设计;智能办公与智能客服场景下,从工作报告助手到数字人坐席,全面提效内部协作与客户响应;智能陪练和智能研发模块提供交互式培训、AI编程辅助等功能,加速人才与技术创新;智能用数则通过领导驾驶舱、问数助手等,将数据转化为决策洞察,赋能企业智能化升级。表 3-4蚂蚁数科通用板块智能体深度业务场景详表图 3-5蚂蚁数科通用板块智能体深度业务场景占比图33二、二、业务链条解析业务链条解析(一)客户服务场景重塑体验,提升效率在直接面向客户的服务层面,智能体致力于解决传统金融服务的服务时间有限、响应不及时、体验同质化等核心痛点。通过提供 7x24 小时在线的智能化服务,不仅极大地提升了服务效率与可得性,更能通过深度个性化,重塑客户体验,增强客户粘性。图 3-6智能体增强客户体验业务场景(二)内部运营场景赋能员工,降本增效金融机构的内部运营涉及大量重复性、流程化的工作。智能体在此领域的应用,旨在将金融从业者从繁琐的事务中解放出来,作为其“智能副驾”,优化内部流程,显著降低运营成本,使其能专注于更高价值的专业性工作。34图 3-7智能体提升内部效率业务场景(三)营销与销售场景精准触达,提升转化在营销与销售环节,智能体通过强大的数据分析和内容生成能力,帮助金融机构从“大海捞针”式的传统营销,转变为“精准滴灌”式的智慧营销。其核心价值在于深度洞察客户,实现个性化触达,从而最大化营销投入产出比(ROI)。图 3-8智能体促进金融销售业务场景35(四)风险管理场景智能预警,防范未然风险管理是金融行业的生命线。智能体能够处理和分析比传统规则引擎更复杂、更海量的数据,从而在风险发生前进行更早、更准确的识别与预警。其应用旨在将风控从事后补救,向事中拦截和事前防范的范式迁移。图 3-9智能体风险管理业务场景(五)产品创新场景洞察需求,加速研发在快速变化的市场中,产品创新能力是金融机构保持竞争力的关键。智能体通过对海量非结构化数据(如用户反馈、社交媒体讨论、市场研究报告)的深度分析,能够帮助产品团队更敏锐地洞察客户需求和市场空白,从而加速产品研发迭代周期。图 3-10智能体产品创新业务场景36(六)决策支持场景数据驱动,辅助管理对于金融机构的管理层而言,及时、准确、有洞察的数据是科学决策的基础。智能体能够扮演高级数据分析师的角色,对复杂的经营数据进行多维度分析,并以自然语言的形式呈现核心洞察,从而为战略规划、业务调整等高层决策提供有力支持。图 3-11智能体在金融机构中的应用37第四章蚂蚁数科智能体独特性与行业普遍性蚂蚁数科智能体独特性与行业普遍性将蚂蚁数科的实践置于金融智能体行业的宏观背景下进行对比,可以更清晰地洞察其技术路径、业务场景和商业模式的独特性与行业共性。一、技术路径一、技术路径从从“通用智能通用智能”到到“领域专精领域专精”(一)行业普遍性当前行业主流的技术路径普遍遵循“大语言模型(LLM) Agent框架”的范式。各参与者均在探索如何利用LLM的通用认知能力,并结合包含规划、记忆、工具使用的Agent架构,实现对复杂任务的自动化处理。知识图谱、多模态技术也被广泛认为是增强模型能力、弥补其短板的关键辅助技术。(二)蚂蚁数科的独特性蚂蚁数科的核心差异化在于其技术栈中高度内化的“金融行业模型与能力层”。这不仅仅是在通用模型基础上进行简单的微调,而是一个系统性工程。主要措施是利用海量高质量金融语料进行深度微调,使其“懂行话”;构建庞大的金融知识图谱以保证事实准确性;集成丰富的金融业务API作为“工具箱”;以及内嵌一个强大的金融风控引擎作为“安全阀”。这种将通用AI能力与深厚金融领域知识(Domain Knowledge)深度融合的路径,使其智能体不仅“能说会道”,更在专业性、可靠性和合规性上构筑了坚实的壁垒。二、二、业务业务场景场景从从“广度覆盖广度覆盖”到到“深度渗透深度渗透”(一)行业普遍性行业内对金融智能体业务场景的探索,普遍集中在智能客服、量化投资、信贷风控、报告生成等几个热点领域。这些场景通常是痛点最明确、最容易看到短期效益的环节。38(二)蚂蚁数科的独特性蚂蚁数科的显著特点在于其“100 深度业务场景”的系统性布局。这种布局不仅实现了对金融业务前、中、后台(客户服务、风险管理、内部运营等)的广度覆盖,更体现了对单一业务链条的深度渗透。例如,在营销环节,智能体不仅能生成文案,还能进行潜客识别、效果预测和策略优化。这种从“点状应用”到“线状、面状解决方案”的演进,展示了其将AI能力融入金融机构全价值链的决心与能力。三、商业模式三、商业模式从从“技术竞争技术竞争”到到“生态赋能生态赋能”(一)行业普遍性市场参与者众多,包括提供底层模型的科技巨头、专注细分应用的FinTech初创企业,以及自行研发的传统金融机构,竞争激烈。尤其在中国市场,科技巨头倾向于将AI能力集成于自身的“超级应用”中,形成闭环生态。(二)蚂蚁数科的独特性蚂蚁数科明确的战略定位是“技术赋能者”而非“业务竞争者”。其商业模式的核心是开放其经过验证的技术栈和产品(如“支小助”“蚂小财”),帮助金融机构构建自身的智能化能力。这种“授人以渔”的开放生态模式,旨在与合作伙伴共同成长,而非直接争夺终端客户。这使其能够最大限度地减少与金融机构的直接冲突,建立更广泛的信任与合作关系,从而推动其技术和解决方案在行业内的规模化落地。39第五章结论与展望:金融智能体驱动的未来已来结论与展望:金融智能体驱动的未来已来一、结论一、结论金融智能体作为金融行业数字化转型的核心驱动力,正通过整合生成式人工智能、大模型与自主行动能力,系统性重塑金融生产力范式。它有效弥合了大模型技术局限与金融业务复杂需求间的鸿沟,在客户服务、内部运营、营销销售、风险管理等核心场景中,通过“感知-推理-规划-执行-进化”的闭环机制,实现了从单点智能到流程智能、决策智能的跨越。从行业实践来看,国内金融智能体已形成单智能体与多智能体协同应用、核心场景深度渗透、技术与场景专业化耦合的发展格局,蚂蚁数科等机构通过全栈技术体系与100 场景的规模化落地,验证了智能体在提升效率、优化体验、创新模式等方面的显著价值。二、未来展望二、未来展望作为核心驱动力,金融智能体将催生全新的金融产品、服务模式和风险控制体系,深刻改变金融行业的竞争格局和生态。(一)个性化与嵌入式金融服务智能体凭借其对海量数据的感知和分析能力,能够更精准地理解用户需求、预测其行为模式,从而实现实时、动态、高度个性化的金融产品和服务推荐,包括定制化理财规划、保险方案设计、信贷产品匹配等。同时,智能体能够将金融服务无缝地嵌入到各种生活、消费、产业场景中(嵌入式金融),更好地贴近用户的个性化需求,让金融服务无感可用。Kieran Garvey 和世界经济论坛强调,智能体将是推动个性化金融服务和普惠金融的关键力量。40(二)智能化产品设计与创新智能体能够辅助金融机构进行更高效的市场分析、竞争情报收集和用户画像构建,加速金融产品的设计和迭代周期。例如,智能体可以自动化生成金融合同草稿、分析现有条款的潜在风险、优化产品参数以满足特定客户群需求等。(三)实时、智能的风险管理智能体能够对海量、多源的金融交易数据、市场信息、社交媒体舆情等进行实时监控和异常行为识别。基于强大的推理和决策能力,智能体可以构建动态的风险评估模型,实现更前瞻、更精细的风险控制,例如实时反洗钱(AML)监控、交易欺诈检测、信用风险预警、市场风险监测等。英国投资协会(IA)报告、Kieran Garvey/WEF 以及一线银行 AI 负责人的实践都印证了智能体在提升风控效率和准确性方面的巨大潜力。(四)全新合规与监管模式在日益严格的金融监管环境下,智能体能够辅助甚至部分自主完成复杂的合规检查、法规解读、报告生成和审计支持工作,显著提升合规管理的效率和准确性。同时,监管机构自身也可以利用智能体技术提升监管效率、实现穿透式监管和风险画像,更有效地维护金融市场稳定。英国金融行为监管局(FCA)国际与市场执行董事 Sarah Pritchard 表示,FCA 支持在安全、责任、合规的前提下推动 AI 创新,并强调监管需要以原则为基础、突出结果导向,密切关注 AI 对风险管理和合规的影响。本报告由零壹智库和蚂蚁数科联合发布,知识产权归零壹智库和蚂蚁数科共同所有。在智能体高速发展的当下,鉴于课题组成员在认知等方面的局限性,2025 金融智能体深度应用报告100 深度业务场景全揽难免挂一漏万,恳请社会各界人士批评指正。
2025-09-08
46页




5星级
如何从试点探索向产业重塑武连峰副总裁兼席分析师IDC中国AI转型的必要性AI转型需要转什么AI转型的合适策略如何给技术提供商的建议IDC CONFIDENTIALIDC CONFIDENTIALIDC.
2025-09-08
25页




5星级
?贵州省数据流通交易服务中心贵州大数据集团贵州贵旅数网科技有限公司华为云计算技术有限公司朱宗尧 徐 昊 张 广 肖 霏潘伟杰 金 凯 艾晓松 胡琼元 黄籽渝赵 将 吕 东 宋 雪 胡 鹤 袁 波吴 越 邓龙江 刘志杰 刘泥君 代新敏王似巍 冯俊峰 吴忠林 李 勇 龙 婕杨文敬 张洪能 尹舒鹤 李 媛 杨 松张 中 黄 涛 陈 媛 黄 松 杨舒宁徐 强 徐 俊 悦 怡 张志刚 霍战鹏邝逸鹤 周 岩 王 立 乔丽娜 陈 勇邴 丽 孙梦龙 陈 玙 杨梦辉 唐如兵雷鸿伟 郑 辉 张小军 柏 君 孙思东张鑫洁 唐 文 张 溯 陈吉栋 叶 飞 白文武 何志强编制委员会P R E PA R AT I O N C O M M I T T E E编制单位编委顾问编写成员(排名不分先后)(排名不分先后)01CONTENTS?01?02?0304?前言PREFACE构建可信数据空间与人工智能协同创新范式,开启人工智能新时代。在数字文明加速迭代进化的时代洪流中,数据与人工智能共生发展正重塑全球经济的格局。数据作为我国第五大生产要素,其价值释放的深度与广度,直接决定了人工智能产业从“感知智能”向“认知智能”跃迁的新高度。当前全球数据总量虽呈指数级增长(2023年突破 175ZB),但高质量语料尤其是中文语料严重匮乏,实际流通率却不足 5%。数据产业面临“不敢共享、不愿共享、不能共享”的困局如同无形枷锁禁锢着 AI 创新的步伐。比如医疗数据因隐私顾虑难以赋能疾病预测模型,工业数据因竞争壁垒阻碍供应链协同优化,金融数据因权属模糊制约风险管控精度,这些挑战的本质,是数据要素市场化配置过程中“信任基础”的不足,也将严重制约着人工智能产业的发展。国家数据局重磅出台 可信数据空间发展行动计划(20242028 年),以国家战略方式推动可信数据空间的加速建设,预计 2028 年国内将建成 100 个以上可信数据空间,包括城市、行业、企业、个人、跨境五类可信空间,打通数据要素流通的“最后一公里”。在AI 时代,可信数据空间是战略级新型数据基础设施,它不是单一技术、工具的堆砌,而是制度规则、技术架构、生态系统三位一体协同的创新范式,将成为全域数字化转型的核心数字底座。随着人工智能技术指数级增长,生产型 AI 场景爆发式应用,大模型对高质量数据的“饥渴需求”进一步放大了可信数据空间的价值。本白皮书结合新技术的理解与创新实践的探索,梳理可信数据空间与 AI 协同发展的技术路径、制度框架与实践蓝图,提出 AI 可信数据空间的顶层设计与创新架构,希望借此推动产业共识,联合各界探索数据要素市场化改革的灯塔,共同开启“数据可信即 AI 未来”的新纪元。0501数据空间与人工智能协同发展挑战1、数据空间发展与挑战1.1 数据空间国内外发展趋势国际数据空间(IDS,International Data Space)的概念最早起源于欧洲,旨在解决数据孤岛、隐私安全和权属不清等问题,推动数据的高效流通与价值释放,促进数字经济的快速发展。2016 年,德国工业 4.0 战略率先提出工业数据空间的概念,随后欧盟推出 欧洲数据战略,将数据空间建设提升至战略高度。美国、日本等国纷纷跟进,结合自身特点探索数据空间建设模式。截至 2024 年,全球已建成超过 200 个可信数据空间,覆盖工业、医疗、金融、能源、农业、交通等多个领域,实现了数据的安全可信流通与价值共创,成为数字经济高质量发展的关键基础设施。欧盟是国际数据空间建设的先行者,其发展模式以联邦式去中心化为核心。欧盟通过 欧洲数据战略、数据治理法案、数据法案 等政策文件,强调数据主权、多方协同治理和标准化,GDPR(通用数据保护条例)为数据保护奠定了法律基础。在技术架构上,欧盟以 GAIA-X、IDSA 为代表,采用联邦式、去中心化架构。数据不集中存储,而是保留在数据源地,通过联邦学习、隐私计算等技术实现协同分析。此外,还利用区块链、分布式身份认证等技术,保障数据流通的安全与可控。通过连接器机制(Connector Mechanism),实现了不同系统间的数据互操作,提升跨域数据流通效率。在生态与应用方面,欧盟已启动14个共同数据空间,覆盖工业制造、医疗健康、金融、能源、农业等领域。典型案例包括 Catena-X(汽车行业)、欧洲健康数据空间(EHDS)、德国工业数据空间(IDS)等。这些数据空间推动了产业链上下游企业的数据共享与协同创新,为欧盟数字经济的发展注入了新动能。全球可信数据空间建设发展日趋成熟,随着国家数据局的战略布局和重点工作推进,我国可信数据空间的建设已逐步从试点探索走向规模化建设。2024 年11月国家数据局发布 可信数据空间发展行动计划(20242028 年),首次在国家层面对这一新型数据基础设施系统布局,明确到 2028 年建成 100 个以上可信数据空间的目标。?图 1 可信数据空间建设发展历程07我国可信数据空间的建设可以分为四个主要阶段:第一阶段:建制度(2020-2022 年):国务院陆续发布 关于构建更加完善的要素市场化配置体制机制的意见、关于构建数据基础制度更好发挥数据要素作用的意见 等文件,明确数据列为新型生产要素,提出“三权分置”等制度,形成基础的制度框架,明确数据要素使用规则,为数据要素市场化配置奠定基础。第二阶段:立顶设(2023-2024 年):数据局负责完成发布 数字中国建设整体布局规划,明确构建全国一体化数据资源体系,提出让数据“供的出、流得动、用得好”的顶层设计方案。第三阶段:强行动(2024-2025 年):陆续发布“数据要素”三年行动计划(20242026 年)、公共数据资源授权运营实施规范(试行)等管理要求,推动数据要素在各行业的应用与价值释放,明确从登记授权定价的完整链条。同时发布 可信数据空间发展行动计划 2024-2028明确可信数据空间定义与定位,提出100 可信数据空间建设目标。第四阶段:促发展(2025 年-):数据局发布 2025 年可信数据空间创新发展试点名单、数标委发布 可信数据空间技术架构,进一步加强牵引各类数据空间的加快建设。1.2 可信数据空间主要挑战可信数据空间作为国家数据基础设施的重要组成部分,作为全域数字化转型的新型底座通过构建安全可信的数据流通利用环境,促进数据资源的共享共用,进而释放数据要素价值。国家数据局发布行动计划明确推进企业、行业、城市、个人、跨境五类可信数据空间建设,可信数据空间建设目前还处于发展初期面临诸多堵点问题与挑战:挑战一、数据供给意愿不足权属不清与价值分配难:数据产权界定模糊,数据供给方担心共享后失去控制权或收益被稀释。例如,担忧数据泄露导致核心竞争力丧失;合规成本高:数据分级分类标准不统一,敏感数据(如医疗、金融)脱敏处理需专业团队,数据供给方难以承担人力与资金成本。挑战二、数据流通效率低跨域系统数据协议不统一:政府、企业、行业数据分散在异构应用系统中,数据结构、接口标准不统一,跨域流通效率低;安全与实时性矛盾:为满足“数据不出域、可用不可见”安全要求,隐私计算(如多方计算、同态加密、联合分析)导致计算性能延迟增加 50%以上,难以支撑高价值场景(金融、物流、交通)等低时延响应要求。08挑战三、高质量语料稀缺政府、金融、医疗、制造等行业大模型专业语料稀缺,海量多模态数据(文本、图像、传感器)待标注数据占比高,高质量语料转化率低(语义缺失、时效滞后等),无法满足行业大模型训练推理阶段对行业标注数据的诉求。挑战四、安全能力参差不齐数据流通涉及数据提供方、使用方、服务运营方等众多参与主体,不同主体的网络安全、传输安全、数据安全等防护水平差异较大,容易成为攻击者突破的薄弱环节,无法满足全链路数据安全防护要求。2、人工智能大模型语料发展与挑战2.1 人工智能大模型语料发展趋势1.从大语言模型到多模态/具身智能大模型的语料演进当前大模型技术正经历从弱人工智能(机器学习、神经网络、大语言模型)向通用人工智能(Agent、多模态、具身智能)的范式跃迁。这不仅对于模型架构的设计理念进行了重构,同时也对大模型各阶段的训练语料提出全新要求。?图 2 大模型技术发展演进阶段09首先,对多模态关联的复杂语料需求日益迫切。针对大模型语料质量,传统纯文本数据已经无法支撑多模态与具身大模型联合建模的需求。业界实践表明,在多模态场景下的语料供给,需要进行跨模态语料数据精准对齐,实践通过融合图文信息,运动轨迹,场景数据,使得复杂论文的解析准确率提升 37%。此类多模态场景在处理包含图表、公式的复杂文档时,需要在语料标准中体现语义逻辑关联能力,同比文本标注对于数据融合要求更高。其次,语料规模需求同样呈现量级扩张。根据行业报告分析,多模态(视频)语料在智能监控领域的渗透率从 2023 年 18%提升至 2025 年 35%,例如特斯拉自动驾驶系统当前需要超 20 万小时多模态场景数据进行模型能力提升。此外,具身智能模型更需要空间动态语料,比如物体运动轨迹、各类参数信息等。据求思咨询报告分析,全球 AI 语料市场规模预计在2025 年突破 109 亿元。并且数据合成成为当前突破现在数据规模的主流路径,预计 2025 年合成数据在AI 训练中占比将达 40%,例如工业数字孪生场景中,合成图像替代率从 30%升至 65%。同时语料数据的内容可信度保障面临更高要求。多模态语料的质检需建立跨模态的数据质量检验流程机制,避免图文内容不一致从而导致模型“越训越差”,造成模型认知偏差。再例如,具身智能模型将与物理世界进行高度交互,语料内容中需要包含安全边界参数(如机械臂操作力度阈值),确保与现实环境的适配。2.从通用模型到行业大模型的语料深化随着通用模型发展从试点到落地,具有行业属性的行业大模型也逐步成为模型能力提升的重要转变,意味着 AI 技术从广度覆盖转向行业深度赋能,而行业大模型的性能则更是高度依赖领域的高质量语料。?图 3 通用大模型到行业大模型的数据需求演进10语料质量:随着通用语料的逐步耗尽,在高质量行业数据上的加工与使用成为各模型能力差距的主要原因。例如上海规划资源专项语料库,通过归集 1200份技术标准、5.7 万份城建档案,建立“专家标注 AI校验”双重标注模式,可以实现地图信息的精准规划,从而代替通用语料仅能提供政策咨询渠道等简单能力,成为垂类模型的“高配置语料库”。内容可信:语料构建需要兼顾内容合规与机密性。尤其在医疗行业,领域语料常涉及大量个人隐私信息,医疗记录,企业信息等敏感内容,因此对于数据内容的隐私保护,催生出隐私计算技术的逐步成熟与落地。比如每日互动公司推出的 GAI Station 智能工作站,公开数据即将耗尽:随着智能化进程逐步推进,不同语种的语料资源质量与规模差异巨大,在全球数据训练集中,英语等主流语言拥有海量高质量数据,中文语料数据的占比仅为 1.3%。Epoch 研究表明,基于当前语料消耗速度,预计将在 2026 年,现有的公开高质量语言数据即将耗尽。领域数据流通困难:近年来,在数据流通、数据共享、数据开放已有很多先进探索,但依然存在“主动找数、被动供数”,高质量领域数据的流通性问题仍然没采用“本地小模型 云端大模型”架构,通过将企业内法务、财务等数据进行向量化处理,并结合联邦学习技术,使得跨机构数据协同合作的数据泄露风险降至0.001%以下。2.2 人工智能大模型语料主要挑战当前随着模型尺寸及模型场景的不断发展,语料的端到端建设与工程化能力也面临着挑战,具体展开为公开数据即将耗尽、领域数据流通困难、多模态对齐与合规性制约等三大维度,使得高质量数据资源成为模型能力提升的关键瓶颈。有得到解决。虽然私域数据的专业性、可靠性、准确度可与行业场景更好适配,但专业领域知识积累门槛高,周期长,数据隐私要求高,所以领域知识的共享在实际落地上还存在难度。多模数据对齐与合规制约:不仅多模态数据的对齐与融合、数据合规流通等受制于技术的发展,在数据产权确权、数据资产入表等方面也需要通过政策法规制定数据加工的标准与规范。?图 4 人工智能大模型语料面临的关键挑战113、数据空间与 AI 协同发展的关键挑战在当前数智化转型加速的时代,数据与人工智能的协同创新成为推动各行业数字化、智能化升级的引擎。然而,这一融合过程中面临多重挑战,“数据壁垒、隐私合规、技术异构性、信任机制不透明”成为数据驱动 AI 创新的关键瓶颈,Data AI 协同创新存在“三不可”的核心挑战。3.1 挑战一、数据 AI 不可见在过去的数十年时间内,各行业客户建设了大量的数据库、数据仓库、大数据等系统,形成了非常复杂的数据架构和庞大的数据资源体系。但由于上一阶段的数据建设通常是围绕交易、分析等特定目标建设的系统,从而逐步形成了大量的数据烟囱(Data Silos)架构,数据的协同共享面临诸多断点和壁垒,无法满足AI 大模型时代对全量用数、高质量供数等新要求,因此 Data For AI 用数核心诉求是让全量数据“AI 看得见”。多形态异构技术体系,跨系统数据 AI 不可见当前模型训练/推理数据涉及多主体、多云、多业务系统间的数据集成与数据汇聚,由于多主体大数据平台建设采用异构技术平台、不同元数据管理、独立数据接口标准,导致跨主体跨域间数据无法高效流通、无法高效发现、汇聚、治理、加工、访问与检索,大量高价值数据难以被快速、高效集成至 AI 训练/推理生产流程中。跨域多主体系统异构建设,跨系统横向集成难,无法为 AI 统一供数:缺少统一元数据管理,治理复杂度剧增:Iceberg、Hudi、Delta Lake、语料集对象存储各表格式的元数据访问协议差异大,多个数据湖独立部署元数据管理,异构数据湖无法形成全局数据地图,跨系统数据发现成本高、血缘追踪割裂等。缺少统一数据格式,跨格式数据计算性能差:多引擎(Spark、Flink、模型训推等)编排场景下兼容性差,跨格式联邦查询通过多 catalog 路由,查询计划复杂、性能差。?图 5 数据湖仓的架构演进发展历程12缺少统一权限管理,合规管控复杂度高:异构元数据管理多重权限体系叠加、审计日志分散,满足统一IAM 策略、统一审计的技术成本高、漏洞风险大。缺少云边端一体化管理,中心训练-边缘推理纵向数据供给不足:云边端数据孤岛导致语料碎片化:大量高价值行业数据(工业设备、医疗检测、城市治理监测)滞留边缘端,导致垂直领域语料严重短缺;云边端元数据描述不统一:云边端数据缺乏统一元数据管理和存储标准,导致语义对齐困难,需要大量人工治理,高质量供给成本高、难度大;云边端多级数据权限割裂:大量高价值端侧生产数据,缺少统一的权限管理和脱敏管理,合规使用风险大。3.2 挑战二、数据 AI 不好用语料数据是大模型训练的重要“燃料”,但大模型语料因为“数据分散、质量参差不齐、多样性不足、过拟合风险”等问题存在数据 AI 不好用困境。基于私域行业数据加工高质量语料供给大模型训练与推理,需系统性解决清洗、标注及优化等高质量语料要求的核心问题。数据质量差,AI 不好用数据噪声与错误:大量的语料存在拼写错误、语法错误、乱码、隐私非合规、内容非合规、重复内容、低质内容等,并且自动化和智能化去噪程度低、成本高、准确率低。标注质量、自动化程度低:行业标注标准不统一(例如医疗影像-磨玻璃影有多种定义)、专业人员参与人员不足(海量医疗影像,需要专业医学专家参与标注)、人工标注成本高,准确率低。数据时效性差:行业语料、特定领域知识库的词汇和术语未及时更新,无法覆盖新事件与新知识例如 行业政策法规语料停留在“2024 年 9月”。过时数据引发“假事实”、加剧模型幻觉。多模态数据碎片管理,跨模态语义难对齐,AI 不理解长 期 分 散 存 储 和管 理 大 量 结 构 化 数 据(OLTP/OLAP)、多模态数据(文本、图片、视频、语音等),导致多模态大模型训练与推理语料供给不足。数据特征异构性导致语义对齐失效:同一对象的跨模态描述难以对齐,例如“医疗报告的文本描述与 CT图像的病症的映射关系不一致”;多模态元数据管理割裂,跨模态检索准确度低:不同数据系统的元数据标准不一致,无法跨数据系统的元数据多模态样本自动关联,例如“IT 系统身份证 ID体系与人脸照片模式识别自动关联”。专业领域知识的理解瓶颈,高度专业化术语与上下文缺失高价值结构化数据关联断裂:传统高价值结构化数据集缺少跨表跨字段的语义关联,结构化数据集的离散型导致大模型难以构建实体间的语义联系,例如 大模型无法理解外键语义、无法理解多字段含义关联等;13多时态数据采集不全,不满足 AI 对实时数据的关键诉求针对分析目的的数据系统建设,通常对历史数据、离线数据或者准实时数据进行了采集分析,但 AI 从训练进入到生产推理、智能体/智能应用投产阶段,对实时数据的采集和反馈尤为重要,尤其是针对制造等工业领域大模型来说,获得实时数据的反馈对提升模型精度至关重要,直接关系到 AI 在生产应用的实际效果和价值收益,因此 AI 进入生产阶段,数据平台需完成对实时、准实时、非实时全时态数据的全量采集和治理。3.3 挑战三、数据 AI 不可信由于多方协作对全链路、全过程的数据安全要求高,在数据语料供给方与行业大模型消费方会存在多方身份不可信、数据来源不可信、数据使用过程不可信、数据传输不可信、数据 AI 不可控等关键挑战。参与方身份不可信:是阻碍数据要素高效流通的核心瓶颈,其本质在于传统身份验证机制无法适配数据跨域流通的复杂场景。一方面,不同机构/平台采用异构身份管理系统,缺乏统一的元数据标准和互操作协议,另一方面,动态身份管控难,数据离开持有方安全域后,缺乏对参与方行为的实施检测与权限回收机制,身份信任链断裂。数据来源不可信,数据完整性受损及责任追溯困难。一方面,数据易篡改,数据生产链权责模糊,多主体参与导致源头数据被伪造或污染。另一方面,追溯机制缺失,缺乏全链路审计技术,数据泄露或滥用后难以定位责任主体。数据使用过程不可信:也是根源性技术瓶颈之一。现有的 CA 体系仅能验证机构实体的身份,无法对数据应用实体(如虚机、容器)、计算环境进行可信认证,导致参与方对数据使用过程中执行环境真实性和安全性存疑。数据传输安全不可信。一方面,传输协议存在安全缺陷,传统加密协议(如 SSL/TLS)存在中间人攻击风险,攻击者可以伪造证书截获明文数据。另一方面,跨域管控机制缺失,导致数据跨域流通时不能及时阻断数据截取行为,导致数据泄露事件。数据权限策略不可控。多系统权限孤岛与多角色协同失效,导致多系统(如标注平台、训练集群、推理API)权限策略不互通;权限粒度与效率的冲突,导致过细管控“按数据字段或操作步骤分权(如 ABAC 模型),导致审批流程冗长,拖累治理效率”;过粗管控“角色泛化(如“训练工程师”角色)可能赋予过量权限,增加误操作或恶意泄露风险”。审计链条断裂导致数据从采集到输出的全流程涉及多角色(标注员、算法工程师、运维人员),权限变更日志分散在各系统,无法关联分析。1402AI 可信数据空间顶层设计围绕数据空间与 AI 协同发展的“三不可”关键挑战,应对数据、人工智能产业需求、场景、技术快速变化的不确定性,迫切需要一揽子迭代升级的顶层架构和体系设计来应对未来的不确定性。全新升级的“三位一体”的顶层设计包括新体系、新架构、新生态三大部分:“数模协同”新体系从传统大数据时代的行业数据治理,到 AI 时代的数据工程、知识治理和 AI 智能用数的发展与变化,应对数据要素流通和大模型高质量可信供数,需要建设一套更为完善的“数模协同”体系,包括制度体系、技术体系、价值体系的深度协同。“一湖一链一中枢”新架构通过 OneLake 技术架构升级,打造一个融合数据湖 一条端到端智能数据工具链 一个数据空间中枢的“一湖一链一中枢”新型数据底座平台,构建“全域入湖、数据可信、AI 好用”的 AI 可信数据空间方案,作为 AI 时代的新型数据基础设施,促进 Data AI 的全面融合发展与创新。“数智共生”新生态Data AI 时代数据与智能深度耦合在一起,你中有我,我中有你,难以剥离。尤其在生态体系方面更为密不可分,单纯的数据或 AI 生态体系都无法满足数据要素流通、大模型供数和 AI 智能业务等新场景新业态的诉求,因此未来必定是一个“数智共生”的全新生态体系,包括数据生态、模型生态、Agent 生态、应用生态、服务生态等不同维度的生态系统深度融合、相互促进,共同生长,形成繁荣的超级应用体系。?图 6 AI 可信数据空间“三位一体”顶层设计架构161、新体系:数模协同在数智融合创新发展进入新时期,可信数据空间与大模型的协同治理,正在从技术耦合升级为数字生态的范式革命。制度协同锚定监管共识,通过跨主体权责契约与动态合规框架,破解数据主权与模型效能的两难;技术协同贯穿全链路防控体系,以隐私计算为盾、区块链为链、AI 治理为眼,实现从数据开发流通到模一、制度协同:建立“权责明晰、动态确权与授权、健全授权运营”的治理机制“数据二十条”以解决市场主体遇到的实际问题为导向,创新数据产权观念,淡化所有权、强调使用权,型价值释放的可信穿透;同时,价值协同激活要素功能,在安全可控的底座上,推动数据资产化、数据知识化与模型智能化的双向赋能,让流动的数据成为大模型创新的引擎,而非沉睡的资源-以制度为纲、技术为脉、价值为魂,构建数模协同新体系。聚焦数据使用权流通,创造性提出建立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权制度框架,构建中国特色数据产权制度体系,旨在破解数据确权难题、激活要素市场。但在实际落地中,面临以下三大现实挑战:?图 7“数模协同”体系框架表 1“数据二十条”面临的关键挑战171、立法赋权建议通过逐步完善数据权责类法律法规,明确“三权”的法律属性:创设独立的数据财产权体系,界定“持有权”为事实管控权、“加工使用权”为受限用益权、“经营权”为产品化收益权;规定权利取得方式:原始取得(数据采集)、继受取得(授权许可),并明确“持有权”以合法控制为前提。“数据资源持有权”,亦称数据持有权,指权利人有权对数据实施自主管控。未经权利人同意或出现法定事由,任何人不得侵害权利人对数据的持有状态。持有权的常见权利形式为消极的“防御”。“数据加工使用权”或数据使用权,指的是权利人有权通过分析、加工、融合等各类方式,对其依法持有的数据进行自主利用。数据加工是行使数据使用权的重要方式,权利人通过行使该使用权,可发挥数据价值,以满足自身产业需求。“数据产品经营权”或数据经营权,指权利人可通过转让、许可使用、合作开发及设立担保等方式,将数据上的部分或全部财产权益向外部进行转让。权利人行使该经营权以实现数据的流通与复用。上述三种权利存在不同的组合状态。权利可因原始的数据生成行为等,同时获得数据持有权、数据使用权和数据经营权。在数据流通交易过程中,应允许不同市场参与主体通过合同交易获取数据三权中的部分或全部。当然,数据权利的形式应当受到一定限制。这些前置条件包括遵循 个人信息保护法 数据安全法等法律规定,不得侵犯个人隐私及信息权益,不得损害数据安全。2、技术探索-确权与授权全链追溯数据要素确权追溯与安全可控技术探索,不仅仅促进数据要素市场化,降低交易成本,激活数据资产流通,同时,通过动态确权、动态授权、多方隐私计算等,构建“以技术赋能监管,以合规促进流通”的新型治理体系。1)动态确权:通过区块链的分布式、不可篡改、共识机制特性,将数据权属信息及流转记录上链存证,确保历史记录无法被篡改。同时将数据确权规则(使用权、收益权分配)编码为智能合约,自动执行权属转移和权限控制,减少人为干预风险,当满足预设条件时,智能合约自动触发数据所有权变更,并在链上更新权属记录。2)动态授权:在数据要素流通领域,通过结合区块链、隐私计算、智能合约等前沿技术,实现了数据权属的实时调整与精准管控,实现“智能合约驱动,一次确权、动态授权”,例如基于预设规则(时间、地域等)自动调整数据权限即限定数据在特定时段或者区域内使用,超范围自动失效。3)可用不可见:结合联邦学习、安全多方计算、密态训练与推理,在数据不离开本地的前提下进行协同计算或者可信计算环境下密态训练与推理,确保原始数据不被泄露的同时,权属和使用过程可审计、可追溯。从数据生成、数据计算、数据流通的每个环节均上链存证,形成不可篡改的审计轨迹,从而支持全生命周期的合规溯源。183、流通机制:从被动开放走向主动赋能在数据要素流通领域,公共数据授权机制与流程优化是释放数据价值、平衡安全与效率的关键。建设公共数据授权平台,标志着公共数据资源迈入“价值化转型、集约化开发、规模化流通”新阶段。“公共数据授权运营空间”以区块链、隐私计算、使用控制等技术为基础支撑,采用“开发工具库 业务管控台”模式,按照数据资源、数据治理、数据开发、数据运营、数据流通五大层级进行架构。一是通过零信任、云桌面等技术确保终端接入安全;二是开展数据分类分级制定对应安全管控策略;三是通过数据脱敏、数据水印、隐私计算、API 接口管控等能力确保数据开发、测试及使用安全;四是建设数据安全监管平台,通过采集流量和日志实现全流程风险预警和及时处置;五是通过区块链技术确保全流程操作可溯源存证。二、技术协同:建立“可信供给-可控训练-合规推理”的全生命周期的防控体系数据要素与大模型的技术协同,需要融合“可信数据空间”与“AI 安全防控”双轨能力,构建覆盖数据加工与流通-模型训练-推理部署-应用监控等系统性防护框架。1、可信供给:数据可用性与可信流通通过可信数据空间构建安全合规的数据供给与流通技术体系,确保语料来源合法、权属清晰、质量可控。基于区块链存证与动态确权,记录语料来源及流转路径,实现全链路可追溯,结合动态脱敏、合规算子、多级过滤等关键技术,系统性的抵御数据投毒、对抗样本攻击、价值偏见渗透等语料污染与危害。2、可控训练:环境隔离与模型安全 通过训练环境隔离、隐私保护机制、污染防御与模型鲁棒性实现模型训练分层防护“环境可信、数据可控、模型安全”。1)训练环境安全隔离:构筑数据与模型参数“防火墙”,将敏感数据与模型参数隔离在受保护的区域,阻止外部攻击与窃取。例如 可信执行环境 TEE 硬件级隔离。2)污染防御与模型鲁棒性:预训练阶段嵌入异常检测模型和知识图谱一致性,识别被篡改数据,抵御恶意数据侵蚀;遵循“先攻击后防御”的对抗训练优化逻辑,通过模拟攻击方法和对抗数据样本增强(例如 FGSM、PGD),提高模型鲁棒性以及泛化能力,从而覆盖训练集未见的边界,减少过拟合。3、合规推理:环境隔离与输入输出管控大模型在推理阶段面临的安全合规技术挑战涉及多个层面,需要兼顾模型行为可控性、数据隐私保护、内容合规等。1)对抗性攻击与思维链劫持:攻击者通过篡改或操纵模型的推理步骤,诱导模型跳过安全审查,输出有害内容。例如部署语义防火墙拦截越狱指令,结合检索增强实时校验内容的准确性和合规性。2)数据隐私泄露:用户与模型的交互内容可能被拦截或者非法存储。攻击者可通过 API 漏洞或者身份验证不足,窃取隐私数据。例如通过密态推理和区块链存证实现密文推理和泄露溯源。3)输出内容合规:训练数据的隐性偏见或者投毒攻19击,可能导致模型输出歧视性内容,带来合规偏差和意识形态风险。例如通过多层级审核引擎、敏感数据实时监测、价值观对齐指标等系统级防御。三、价值协同:建立“数据驱动模型进化,模型释放数据价值”可持续双向闭环数据要素与大模型的协同发展构成了双向赋能的闭环价值体系,数据作为核心生产资料驱动大模型的能力进化,大模型通过智能化释放数据的深层次价值。1、数据驱动模型进化:大模型训练依赖大规模、高质量、多模态、实时更新的行业专属数据集,通过高质量数据集提升认知广度和语言泛化能力以及模型输出的准确性,剔除冗余和敏感信息,确保训练数据“可信合规”,避免大模型生成错误和偏见内容。同时,从原始数据资源到“模型燃料”的转化,成为模型可识别的标准化输入,支撑模型实时检索增强,减少幻觉问题。对于文本、图像、语音等跨模态数据的联合标注与配对,驱动模型理解跨模态语义对齐,实现物理世界交互场景的深度认知。充分利用人类和模型反馈数据(交互日志、错误修正样本)持续优化输出,动态生成高质量训练数据,推动模型自主进化。2、模型释放数据价值:大模型突破传统数据分析的局限,实现数据价值的跃迁,从海量信息提取行业级的知识发现,例如在行业预测大模型,通过结合文本、图像、时序数据,构建实时分析能力,实现故障根因溯源、风险预测、故障率预测、决策精度、流程动态调优、自动化元数据管理与知识图谱构建等。双向的价值协同不仅推动数据要素从“资源”向“资产”跃迁,更通过“数据驱动模型进化,模型重构数据价值”的飞轮效应,成为数字化转型的核心引擎。202、新架构:AI 可信数据空间2.1“三可”架构原则可信数据空间作为“人工智能 ”行动的数据基座,旨在构建“数据高质量供给-模型深度赋能行业-模型释放数据价值”的闭环。当前行业大模型语料质量差、资源结构单一、流通成本高“等制约人工智能 的深度发展。高质量数据集供给与流通作为系统性复杂的软件工程,涉及多模态数据工程、隐私计算、区块链、向量数据库、RAG等创新技术组件的统一集成、统一管控、统一监控与运维。“三可架构”原则全域数据可见:通过统一数据架构平台,打破跨系统、跨技术堆栈、跨主体的数据壁垒,实现多源数据的全面汇聚、元数据管理、权限管理以及一站式端到端的汇聚-清洗-加工-标注-合成-评测等,其核心是构建横向贯通的数据网络,支撑传统数据分析、AI 语料加工治理、大模型训推数据集的高质量供给。全链路数据可信:基于“数据可用不可见、可控可计量、训练语料可控、推理安全合规”技术与治理规范,确保数据从采集、加工到模型训练、推理的全生命周期满足准确性、内容可信、一致性、安全性等要求,建立贯穿 Data AI 数据流的价值信任链。全模态 AI 好用:通过数据-语料-知识一站式算子 工具链体系,确保数据接入到 AI 服务输出的全链路高质量输出,整体架构不仅能处理多模态数据,而且系统保障数据质量、语料合规性与知识转换率,从而支撑大模型在动态数据环境中持续稳定、可信的推理能力。华为以“全域数据可见、全链路数据可信、全模态 AI好用”的架构原则为基石,构建“全域入湖、数据可信、AI 好用”新一代 Data AI 创新架构。?图 8 AI 可信数据空间“三可”架构原则示意图212.2“一湖一链一中枢”架构蓝图“一湖一链一中枢”架构通过对传统数据平台的系统性升级,不仅解决了“全域数据可见”的多源异构数据整合难题,更通过数据血缘追溯、统一权限控制、跨域流通策略控制确保“全链路数据可信”,同时依托智能数据工具链赋能供给复杂智能用数场景真正实现全模态 AI 好用。2.2.1 融合数据湖大数据时代数据库、数据仓库、数据湖的建设主要围绕结构化数据、商业智能(BI)而建设,经过多年建设与发展,逐渐形成了多主体数据孤岛、多技术平台烟囱、多模态数据语义割裂无法融合等问题,无法满足 AI 时代对全模态、全时态、全形态数据集成与融合的需求,因此迫切需要通过 AI 数据湖升级,解决传统数据 AI 不可见的问题。为打破现有数据壁垒,满足企业全量数据让 AI 可见的关键需求,AI 数据湖架构升级必须实现“全场景数据全域入湖、全模态数据统一管理”的关键设计,实现对上层不同智能用数场景的高质量供数。?图 9“一湖一链一中枢”体系架构图 10 融合数据湖功能架构22关键设计一:全场景数据,全域入湖跨云全网数据集成:主要解决云内、云边、云间系统数据集成问题关键设计二:全模态数据,统一管理统一管理元数据、权限、标准与监控1)统一元数据管理:通过统一元数据管理技术,实现对结构化、半结构化和非结构化数据元数据的采集、存储、查询和维护。例如,对于非结构化的文本数据,元数据可以包括数据的来源、创建时间、作者等信息;对于图像数据,元数据可以包含图像的分辨率、格式、拍摄设备等信息。2)统一权限管理:基于角色的访问控制(RBAC)模型,结合数据分级分类,实现对不同用户和角色的数据访问权限管理,有效防止数据泄露和滥用,保障企业的数据安全。例如,对于敏感的客户个人信息数据,只有授权的客服人员和管理人员能够访问;对于公开数据,企业内的所有员工均可进行查询。3)统一标准管理:通过建立统一的数据标准体系,涵跨域业务数据集成:主要解决 IT与 OT 数据融合集成问题IT 数据通常以结构化形式存储于数据库中,主要用于企业的管理决策和业务流程;OT 数据则来源于工业生产、设备监控等领域,多为实时性较强的时序数据。采用数据抽取、转换和加载(ETL)工具,结合流式计算技术,实现对不同类型跨域数据的统一集成。盖数据格式、编码规则、数据质量等方面的标准,实现全模态数据的共享和交换。4)统一监控管理:对数据的采集、存储、处理和使用过程进行实时监控。通过设置监控指标和预警机制,及时发现数据异常情况,如数据丢失、数据错误、数据访问异常等,并采取相应的措施进行处理。统一数据目录与数据地图1)统一数据目录:构建统一的数据目录,将结构化、半结构化和非结构化数据按照业务主题、数据类型、数据来源等维度进行分类,每个数据条目包含数据的名称、描述、格式、存储位置、更新时间等信息。2)统一数据地图:数据地图以可视化的方式展示数据之间的关系和流向,帮助数据使用者更好地理解数据的整体架构和数据资产分布。通过数据血缘分析和数据拓扑建模,生成直观数据地图。?表 2 跨云全网数据集成面临的关键问题232.2.2 智能数据工具链一、数据工程当前各行业面向结构化数据的治理方法和工具相对比较成熟,但是面向 AI 语料对非结构化、多模态数据的清洗、标注、自动合成、质量评价等一系列工具的相对匮乏现状,需围绕高质量语料自动化加工建立新的数据/语料/知识加工生产线,满足 AI 时代的高质量、高效率、自动化加工的诉求。数据工程平台聚焦构建高效、精准的数据加工链路,为大模型提供源源不断的高质量数据,全方位提升模型训练的效率与效果。它提供数据获取、数据加工、数据标注、数据发布、数据管理、数据安全六大全链路数据工程服务,通过一站式平台,支撑企业高质量用数。数据获取,支持多样化数据来源渠道,支持全模态数据类型,满足大模型训练所需各类数据采集诉求。图 11 数据工程功能架构数据加工,包括数据提取、数据过滤和数据转换&增强等,其中,数据提取,支持各种格式的文本、图像和音视频数据提取,自动化算子提升效率 10 倍;数据过滤,内置丰富数据过滤算子,支持用户自定义规则过滤,拒绝低质和不合规数据影响模型效果;数据转换&增强,提供丰富的数据转换和增强算子,构建高质量数据集支持模型效果更佳。数据标注,支持文本/视频/图像全类型标注,可以辅助预标注提效 10 倍,进一步借助人工审核提升标注准确率。?24数据发布,提供多种发布方式,一键发布到模型训练平台直通训练,同时可借助胶囊封装防止数据泄露。数据管理,提供数据地图实现资产全视角管理,全链路数据血缘支持正向和逆向数据追溯。数据安全,提供数据工程处理全流程安全管理,实现安全高效数据处理。除了要构建全新面向 AI 语料加工的全流程工具链外,面向不同大模型场景的数据链路和工程实践也尤为重要,比如面向预测、NLP、CV、多模态不同类型语料建立完备的工具链与工程基线。预测数据加工链路,致力于处理时间序列等预测相关数据。通过多种数据源,如传感器数据、业务报表数据等,进行数据获取。利用异常值检测、数据平滑等清洗技术,去除噪声和错误数据,确保数据的可靠性。接着依据行业标准和业务规则,对数据进行标准化处理,使不同来源的数据具备统一格式,便于后续分析。运用特征工程方法进行数据转换,提取如滑动窗口特征、趋势特征等,增强数据的表达能力。在数据评估阶段,通过交叉验证等方式评估数据质量和预测模型的初步效果,根据评估结果优化数据处理流程。最后将符合要求的数据发布到模型训练平台,为预测类大模型提供坚实的数据支撑,助力提升预测的准确性和稳定性,例如在金融风险预测、销售趋势预测等场景发挥关键作用。NLP 数据加工链路,是围绕自然语言文本展开的。在数据获取环节,会涵盖网页文本、社交媒体内容、文档资料等多种来源,采用文本去重、停用词过滤等清洗手段,净化文本数据,依据自然语言处理的规范和模型需求,对文本进行词性标注、句法分析等标准化操作。同时,利用词嵌入、文本摘要等技术进行数据转换,将文本转化为适合模型处理的向量表示。除此之外,通过人工标注与自动评估相结合的方式,对 NLP 数据进行质量评估,确保数据的标注准确性和语义完整性。并通过发布高质量的 NLP 数据,为语言生成、文本分类、情感分析等大模型提供优质语料,显著提升大模型在语言处理任务中的表现。CV 数据加工链路,专注于图像和视频数据处理。在数据获取环节,它从摄像头采集、图像库、视频平台等多渠道获取数据。运用图像去噪、图像增强等清洗技术,提升图像质量。按照图像识别、目标检测等任务要求,对数据进行标注和格式标准化。通过图像特征提取、目标检测框生成等方式进行数据转换,提取关键视觉特征。借助标注一致性检查、模型验证等评估手段,保证 CV 数据的质量。将处理后的 CV 数据发布到模型训练环境,为图像识别、目标跟踪、视频分析等大模型提供丰富的训练素材,有效提升大模型在视觉领域的识别精度和泛化能力。多模态数据加工链路,整合 NLP、CV 等多种类型数据。在数据获取时,同步采集文本、图像、音频等多模态数据。通过多模态数据对齐、融合等清洗和转换技术,打破模态间的隔阂,实现数据的有机结合。依据多模态任务的标准,对融合后的数据进行标准化处理。运用多模态特征融合算法进行数据转换,生成综合多模态信息的特征向量。采用多模态评估指标,从多个维度评估数据质量。发布多模态融合数据,为多模态大模型提供全面的数据支持,使模型能够综合理解和处理多种信息,在智能客服、智能安防、智能驾驶等复杂场景中发挥更强大的作用。25统一数据服务门户传统工具在设计时通常只关注各自领域和阶段的数据管理能力,通过相互独立的权限体系进行角色授权,导致管理人员在环境准备、工具权限分配以及开发人员在工具使用过程中存在大量重复操作,难以实现一致的管理和使用体验,最终严重影响数据产品的开发利用效率。二、智能 BI在可信数据空间中,需要借助丰富的数据开发工具,将原始数据加工成为具备流通价值的数据资产和数据产品。然而,由于数据来源、类型、规模以及流通和展现形式的多样性,要求提供多样化的数据开发工具进行支撑,包括统一的数据服务门户和智能化数据分析工具。智能数据分析在公共数据分析处理中,原始数据包括征信数据、企业信息、统计报表等结构化数据,以及政策文本、新闻报道、公众意见等非结构化数据。这些数据经过清洗与标注后,转化为可分析的结构化数据,并通过知识图谱构建非结构化知识的潜在关联。AI 可分析结构化数据与非结构化数据的关联,生成政策解读报告,提升决策的科学性。智能数据分析技术(如NL2SQL)将自然语言转化为 SQL 查询,帮助工作人员快速获取所需数据,AI 可直接从结构化数据中获取结果,并结合非结构化数据生成全面分析报告。这种智能化方式提升了数据分析效率,助力政府更精准地制定政策,满足公众需求。?图 12 智能 BI 体系架构26开展智能数据分析时,将数据可视化与 AI 问答相结合,实现智能化的数据分析与洞察。在企业运营中,能够实时分析销售数据与市场趋势,生成动态的可视化报告,并通过自然语言交互提供业务建议。这种技术不仅提升了数据分析的效率,还为企业决策提供了更加直观的支持。智能数据洞察提供可视、实时、易用、安全的企业智能分析数据服务,以最自然高效的方式获取业务见解,支撑业务实时高效决策。适配云上云下多种数据源,提供丰富多样的可视化组件,采用拖拽式自由布局,轻松实现数据分析和报表搭建,快速定制专属数据大屏。三、智能用数Data Agent 通过生成式 AI 将自然语言转换为可智能化执行的端到端数据自助分析与决策呈现,成为“智能用数”的核心载体,其本质是以 AI 为引擎,大幅降低数据使用门槛,使业务人员直接驱动数据从资源转化为行动依据。用户只需提出分析需求,agent 智能化完成数据到洞察报告的端到端流程,将传统“提需求-等开发”的天级周期压缩至分钟级,真正实现了“所思即所得”。Data Agent 是指用户可以通过生成式 AI 技术,灵活构建自己的对话式数据助手,通过自然语言交互的方式获取对应数据,并生成各类可视化报表和洞察报告。实现从原始数据到生成洞察报告的端到端智能化处理,加速数据价值释放。?图 13 智能数据分析功能架构27数据源发现:首先,对用户问题进行理解,明确所需数据源,其次,根据用户权限访问数据源,确保系统可获取的数据及数据结构符合合规要求,再根据可用的数据源及 agent 指令确定最相关数据源。数据查询:确定最相关数据源后,通过大模型将用户问题进行改写,使其更加清晰和结构化,同时自动生成 SQL、DAX 公式、实时日志/时序数据查询语言等,结合上下文进行数据查询。数据分析:基于查询的结果进行多维度的深度数据挖掘,自动识别数据分布、异常值、相关性特征;定位关键波动因素(如销售额骤降),构建归因模型;追踪核心指标趋势,进行同环比、阈值预警、聚类归因等自动化诊断。数据可视化:根据已分析出的特征数据与分析目标,智能选择图表类型,例如:柱状图(对比分析)、折线图(趋势追踪)、饼图(构成占比),以及热力图(相关性矩阵)、散点图(聚类分布)、地理地图(空间分析)等高级图表。洞察报告生成:基于已有的分析结果及可视化报表,生成完整的业务洞察。例如:指标分析报告,包含关键指标健康度诊断与归因摘要;业务通报,自动生成周报/月报/季报,并能包含多图表整合与执行报告;区域洞察,包含地理维度业绩对比、市场渗透率热区识别等。综上所述,Data Agent 致力于降低数据使用门槛,利用生成式 AI 高效驱动业务分析与流程闭环,辅助业务人员提升运作效率,高效决策。四、知识搜索知识搜索引擎是实现数据与AI 协同创新的核心工具。它通过结合大模型与知识库,构建高效、智能的检索增强生成(RAG)能力,帮助用户快速获取精准的知识内容,提升决策效率与业务洞察力。知识搜索引擎的核心目标是解决大模型在知识准确性、专业性、时效性等方面的不足,通过引入结构化知识库和向量检索技术,实现对海量数据的高效检索与智能生成。例如,在政府政策解读场景中,知识搜索引擎能够快速检索相关政策条款,并结合历史案例生成个性化的解读报告,显著提升 AI 的推理能力与响应效率。?图 14 Data Agent 功能架构28基于上述知识库搜索面临的问题与挑战,在可信数据空间中的知识搜索引擎需要提供如下核心能力:智能文档解析与知识构建知识搜索引擎支持多种文档格式(如 PDF、Word、PPT、图片等)的解析与知识提取,将非结构化数据转化为 AI 可理解的知识图谱或向量数据。例如,政策文件中的条款会被转化为知识图谱,清晰展示政策间的关联关系;图片和表格则会被转录并标注,生成结构化的数据格式。这种能力使得 AI 能够快速理解复杂业务场景,为用户提供精准的知识服务。智能检索与生成图 15 知识搜索引擎功能架构通过向量数据库和知识图谱的结合,知识搜索引擎能够实现高效的知识检索与生成。例如,在企业市场分析中,AI 可以快速检索历史销售数据与市场趋势,生成动态的可视化报告,并通过自然语言交互提供业务建议。这种智能化方式不仅提升了数据分析的效率,还为企业决策提供了直观的支持。灵活部署与安全管控知识搜索引擎支持多种部署形态(如物理机、云上云下),满足不同行业对数据安全的要求。同时,平台提供统一的数据服务门户,实现工具的统一管控与数据的全生命周期管理,确保数据的可信、可用与安全。但是,知识库的构建与搜索需要处理海量的多模态数据,包括文本、图片、视频等,数据清洗、标注与结构化处理的复杂性较高。其次,大模型在知识准确性、专业性、时效性等方面的不足,可能导致检索结果与用户需求不完全匹配。此外,非结构化数据的处理难度较大,AI 在理解与转化过程中容易出现偏差,难以生成高价值的内容。最后,数据安全与隐私保护问题也对知识搜索引擎提出了更高的要求,如何在提升检索效率的同时确保数据的合规性与安全性,仍是亟待解决的难题。?292.2.3 数据空间中枢随着数据价值增长和数据隐私保护意识的提高,用户越来越关注在 AI 时代下对于数据安全的新要求。对于数据加工的安全,应该在存储、加工、发布端到端业务流程中能保证数据不被泄露、不被盗取、不被恶意篡改或销毁;对于数据内容的安全,应该做到无敏感数据、无黄暴政数据,确保数据供给到模型的价值观正确。可信数据空间中枢为实现数据合规高效流通,推动数字经济高质量发展,华为依托自身可控数据交换、隐私计算、区块链等技术积累,针对数据要素产业发展面临的信任缺失、确权困难等痛点,打造数据空间中枢平台,构建“数据可用不可见”的可信数据基础设施。数据空间中枢作为可信数据空间关键内核,通过标准化数据要素加工、流通利用的全生命周期业务流程,实现对数据资源、参与主体、业务活动、工具资源、跨空间互联互通的统一管理调度。?图 16 数据空间中枢体系架构30数据空间中枢由身份认证、数据目录、数字合约、使用控制、存证清算、安全管理六大模块组成。身份认证模块落实全要素接入认证要求,对空间内主体身份、接入连接器及核心组件开展认证以建立互信,通过统一认证实现管理,借助连接器及开发工具认证保障技术组件和工具适配标准协议,确保安全可靠。数据目录模块负责数据产品统一发布,包含数据资源目录与数据产品目录,接入数据和开发形成的产品分别按对应编目要求编目、审核后上架数据市场。数据市场提供数据语义发现和元数据智能识别能力,方便数据使用方快速找到数据资源。数字合约和数据使用控制模块落实全过程动态管控,对数据共享共用全生命周期进行控制,中枢统一管理策略与合约,积累行业场景标准化策略模板构建智能推荐能力。数据提供方可分配权限和指定控制策略,智能控制中枢编排访问与使用策略并生成可机读策可信计算流通通过多方计算、联邦学习和机密计算等技术,实现数据可用不可见,满足高密级数据流通使用的要求。可信交换流通主要由策略控制中心、数据连接器、审计清算中心、认证中心等核心部分组成,定位为提供数据空间能力,通过提供合法性认证、数据使用安全策略控制、审计追溯等能力,实现数据在提供方与消略,封装于连接器;使用方在连接器内按合约消费数据,通过合约管理优化履约,建立合作规范。存证清算模块践行全链路存证溯源,构建行为和数据存证体系,依托审计日志对数据开发利用全过程溯源存证。同时提供详细的计量监测数据等使用消耗情况,支撑运营平台按定价策略计费,完成支付指令交换,在相关方之间清算费用。安全管理模块实现全链路风险统一感知,构筑端到端安全防护体系,覆盖数据全流程安全以确保严进严出、过程可控;基于云原生保障数据资产可控,根据分级分类识别风险并实现策略自动化推荐、日志上报和策略下发;构建多层多级授权体系实现权限隔离,通过“租户 云服务 存算平台”三级授权拉通权限模型,提供细粒度权限隔离能力,满足最小化授权等原则。可信数据流通安全费方数据空间交换过程中,端到端的安全保护。区块链服务管理平台为可信存证管理系统提供区块链技术支撑,包括区块联盟管理、存证溯源、智能合约引擎、共识机制、共享账本、密码算法、运维监测等服务支撑。各相关参与方包括数据运营公司、大数据中心、管理机构等可通过区块链平台快速方便地创建和部署自身的区块链节点,并共同组成可信存证管理联盟链。?图 17 可信数据流通安全功能架构312.3 创新技术方向2.3.1 数字护照数字护照(Digital Passport)是基于数字身份(Digital Identity,DID)和相关技术构建的一种新型身份凭证,旨在以安全、隐私保护且可验证的方式,将个人或实体的身份信息数字化,并支持跨平台、跨国家的可信交互。数字护照的关键特性用户主权(Self-Sovereign Identity,SSI)用户完全控制自己的数字护照,自主决定何时、向谁披露哪些信息,避免数据被第三方垄断。跨域互操作性基于国际标准(如 W3C DID/VC),数字护照可在不同国家、平台间通用,例如用于国际旅行、跨境金融等场景。防欺诈与安全加密签名和分布式验证机制防止伪造。生物识别(如面部识别)可绑定数字护照,进一步确保“人证合一”。最小化披露支持选择性披露(如仅展示护照有效期,而非全部信息),减少隐私泄露风险。数字护照的价值及应用场景在日益数字化的世界中,数字护照正从概念走向现实,其核心价值在于为个体在虚拟空间构建一个安全、可信、便捷且用户自主可控的数字身份凭证。它的意义远不止于替代实体证件,而是重塑数字交互方式、赋能个体权利、提升社会效率的关键基础设施。跨境旅行:机场安检时,旅客通过数字护照出示加密签名的签证和健康证明,海关通过扫描二维码即时验证真伪,无需纸质文件。Web3.0&稳定币:用户使用数字护照登录去中心化应用(DApp),证明真实身份的同时保护匿名性。数字服务接入:银行或医疗平台要求用户提供“已成年”证明,用户仅需发送一个ZKP 驱动的 VC,无需上传身份证照片。数字护照是 DID 技术在身份领域的落地实践,通过密码学和分布式系统将现实身份转化为可编程、高隐私的数字凭证。其核心价值在于平衡便利性与安全?表 3 数字护照与传统电子护照对比32性,重塑个人与机构之间的信任关系,其以用户为中心,在保障安全隐私的前提下,通过便捷高效的身份管理,重塑信任建立的方式,释放个体潜能,提升社会整体运行效率,为构建一个更包容、更繁荣、更可信的数字未来奠定坚实基础。2.3.2 轻量 AI 机密计算随着大语言模型的广泛应用,一系列新旧交织的安全威胁接踵而至,给 AI 产业生态的健康发展带来严峻的挑战。当代的大型语言模型是海量算力、宝贵的训练数据与创新算法的汇聚的精华,是数字时代的高价值资产,自然成为攻击者觊觎的目标。用户提交给模型进行训练和推理处理的数据中,常常包含个人隐私、商业机密等敏感信息,一旦泄露,后果不堪设想。在缺乏有效防护的应用环境里,无论是心怀不轨的系统运维人员,还是利用漏洞、恶意软件非法获取访问权限的黑客,都可能对模型安全构成威胁。正因如此,随着大模型应用规模的不断扩大,对其高价值资产的安全保护已刻不容缓。在可用于大模型及推理数据安全防护的技术中,同态密码、多方计算等密码学技术虽凭借其严密的密码学根基具有很高的安全性,但在实际应用中却面临严重的性能瓶颈。相比之下,基于硬件隔离的机密计算技术更贴合大模型应用的现实需求。机密计算通过在硬件层面构建可信执行环境(TEE),将大模型与推理数据置于受硬件保护的安全区域内,即使操作系统、虚拟机管理程序被恶意攻击,该区域内的数据与计算过程依然能保持机密性与完整性。在实际应用中,机密计算既能够保障模型与数据的安全,又能在性能损耗相对可控的前提下,满足大模型实时推理的效率要求,为大模型的安全应用提供了一条兼具安全性与性能的现实路径。因此,华为鲲鹏推出了virtCCA 方案,创新性地突破了传统 TEE 仅能运行小型可信应用与需要应用改造的难题。同时,为了确保 virtCCA 机密虚机与昇腾 NPU 的安全高效交互,华为昇腾提出了基于 NPU 硬件可信 执 行 环 境 TEE 的 PMCC(Privacy and Model Confidential Computing)轻量级 AI 机密计算方案。借助于 virtCCA PMCC 方案,华为实现了从数据到模型的端到端硬件级安全保护,为 AI 机密推理与微调等高价值场景提供了坚实的可信根基。图 18 virtCCA PMCC 轻量级 AI 机密计算方案示意图?333、新生态:数智共生3.1 培育多元数据生态主体数据生态是指数据空间参与各方依据既定规则,围绕数据资源的流通、共享、开发、利用开展价值共创的生态系统,包括数据提供方、数据使用方、数据服务方、可信数据空间运营者等生态主体。针对本地优势产业和典型场景,制定生态主体培育政策,形成“政府引导、企业参与、科研支撑、行业协同”的生态体系。通过数据互通、资源共享、协同创新,推动数据空间可持续发展。各个生态主体定义和培育措施如下:数据提供方:在可信数据空间中提供数据资源的主体,有权决定其他参与方对其数据的访问、共享和使用权限,并有权在数据创造价值后,根据约定分享相应权益。支持企业依法依规对其合法获取的数据进行开发利用,培育一批贴近业务需求的行业性数据资源企业。鼓励企业间按照市场化方式授权使用数据、共同分享收益,推动企业跨行业发展。数据使用方:在可信数据空间中使用数据资源的主体,依据与可信数据空间运营者、数据提供方等签订的协议,按约加工使用数据资源、数据产品和服务。支持企业面向数据要素 X 典型应用、AI 场景、新兴产业和全域数字化转型需要,创新应用模式,更好发挥数据要素价值,赋能产业发展,培育一批深刻理解行业特征、高度匹配产业需求的数据应用企业。数据服务方:在可信数据空间中提供各类服务的主体,包括数据开发、数据中介、数据托管等类型,提供数据开发应用、供需撮合、托管运营等服务。支持企业面向数据流通交易提供专业化服务,重点围绕数据业务咨询、数据供需对接,交易撮合、合规服务、数据资产服务等方面,培育一批数据服务企业,发展数据流通交易新模式新业态。可信数据空间运营方:在可信数据空间中负责日常运营和管理的主体,制定并执行空间运营规则与管理规范,促进参与各方共建、共享、共用可信数据空间,保障可信数据空间的稳定运行与安全合规。可信数据空间运营方可以是独立的第三方,也可以由数据提供方、数据服务方等主体承担。支持企业面向数据接入、数据加工、数据流通、数据运营和数据安全,聚焦数据流通利用基础设施和多元生态主体协同机制,重点培育一批具有公信力、竞争力的数据运营商。由于 PMCC 的混淆变换是在昇腾 NPU TEE 的高安环境中执行的,因此可以实现变换因子与硬件的绑定,避免传统软件安全方案可被拷贝到其他硬件上执行的缺陷。同时,由于在 PMCC 方案中,昇腾 NPU上运行的模型与数据都经过了混淆变换,所以即便通过未受保护的 H2D 信道和 D2D 信道传输,也不会影响方案的机密性保护效果。当前,ARM V9 推出了CCA(Confidential Computing Architecture)方案,通过硬件级内存加密与指令集扩展,提供更高效的安全执行空间 Realm。其核心在于构建跨处理器、缓存及总线的全链路机密计算体系。未来华为将通过鲲鹏 CPU 总线 昇腾 NPU 的协同设计,进一步实现 CCA 方案在华为计算的落地,借助于 ARM V9 CCA 的安全特性,通过软硬协同进一步降低 AI 机密推理(及微调)的性能损耗,为大模型机密推理与微调提供兼顾安全与效率的机密计算解决方案。34可信数据空间监管方:指履行可信数据空间监管责任的政府主管部门或授权监管的第三方主体,负责对可信数据空间的各项活动进行指导、监督和规范,确保可信数据空间运营的合规性。3.2 制定多元生态主体协同标准和机制当前各个生态主体间存在信任顾虑,担心数据安全等问题,导致跨主体数据“不敢共享、不会共享、不愿共享”。通过制定统一的数据资源管理标准、认证与信任机制、数据共享规则、技术标准体系、利益分配机制等,以破除当前数据流通难题。数据资源管理标准:建立统一的数据目录和数据标识,确保数据资源可被高效查询和跨主体互认。认证与信任机制:建立统一身份管理,通过第三方认证机构,对参与可信数据空间的实体进行安全评估和认证,确保其合法合规,并符合标准。建立审计与追溯机制,确保数据操作的可追溯性,记录数据的访问、修改、传输等行为,以便审计和取证。数据共享规则:明确数据共享的范围、方式和权限,以及数字合约协商机制、清算审计、纠纷解决等业务流程进行标准化,确保数据在合法合规的前提下,按照合同约定进行流通使用。技术标准体系:保障不同主体之间的系统和数据能够互联互通。利益分配机制:明确数据共享带来的经济利益或其他收益的分配方式,激励各方参与合作。根据各主体的贡献程度合理分配收益,可按照数据提供量、技术研发投入、市场推广效果等因素进行分配。依托全国数据标准化技术委员会技术文件和可信数据空间发展联盟团体标准,加强标准引领,促进规范化管理。地方政府或行业组织,应鼓励数据空间建设单位、运营机构、科研院校等积极参与可信数据空间相关国家标准、行业标准和地方标准制定。3.3 搭建数据生态服务中心建立可信数据空间的数据市场,应用市场,需求大厅等,以需求导向进行场景挖掘,供需对接,数据供给;同时通过“揭榜挂帅”机制吸引多方参与场景开发,定期发布行业白皮书及优秀场景案例;定期举办数据生态研讨会、项目对接会等活动,加强各主体之间的面对面交流与合作。每季度举办一次数据生态研讨会,邀请各主体代表分享经验、探讨合作机会。激发多方主体参与,增强数据空间生态活力。3.4 探索数据生态运营模式构建可信数据空间推广策略,第一探索商业模式,包括免费试用、先用后付、应用分成、会员制、供需撮合佣金等多元商业模式,提升各个生态主体的参与积极性,形成可持续发展的路径。第二分层培育行业主体,引导龙头企业牵头,要求链主企业开发核心数据接口,带动上下游中小企业接入;扶持中小企业,提供普惠性工具和服务补贴,降低参与门槛和成本,激发创新活力;设立专项基金孵化第三方服务机构,包括数据开发、数据经纪、数据托管、审计清算、合规审查等机构接入数据空间,形成数据全生命周期的服务体系。第三定期举办产业沙龙活动,行业数据空间峰会,创新场景大赛等活动,牵引产学研协同发展。3503最佳实践案例1.1 项目背景在全球数字文明演进与数据成为关键生产要素的时代背景下,贵州作为全国首个国家级大数据综合试验区,承担着为国家探索数据要素市场化改革路径的战略使命。以建设国家数据要素综合试验区为抓手,贵州着力构建可信数据空间体系,破解数据“不敢流通、不愿流通、不会流通”的难题,为全国推动数据资源转化为现实生产力提供实践样本。作为“东数西算”核心枢纽,贵州不仅是全国一体化算力网的关键节点,更在探索数据跨区域流通与优化配置方面发挥引领作用。可信数据空间作为关键基础设施,有力支撑“东数西存、东数西算、东数西用”国家格局的形成。贵州数字经济占 GDP 比重达 42%、连续9 年增速全国领先,正是数据要素驱动发展的生动体现。依托十年数博会积淀与大数据交易实践,贵州构建了“立法保障 算力支撑 场景应用”的生态闭环,在全国率先建立数据要素法规制度体系,形成可信流通的“规则高地”。通过推动 24 个行业领域建设高质量数据集与大模型应用,贵州积极响应“数据要素”战略,探索数据赋能实体经济新路径,为全国产业数字化转型提供可复制的“融合范式”,成为中国在全球数字竞争中的重要试验田。1.2 解决方案作为贵州省首个公共数据授权运营空间,是一级授权运营机构承接公共数据授权运营工作的重要载体,以“1 7 2 N”为总体框架,打造授权运营体系,该体系以贵州省公共数据授权运营实施方案 为核心指导,围绕七大体系机制与两项规范制度展开建设,最终落地 N 个主题应用。“7”具体包括数据归集治理体系、数据产品体系、AI 数据集体系、数据流通体系、数据运营体系、数据安全体系以及数据工具体系;“2”是指运营生态制度和技术标准规范。通过多层级、全流程的机制设计与技术保障,该体系构建了安全可信、高效协同的数据运营环境,全面促进公共数据要素的有序流通、深度融合与创新应用,为贵州省数字经济发展提供坚实支撑。1、贵州大数据集团公共数据授权运营空间实践37图 18 贵州一体化公共数据授权运营空间?图 19 贵州省公共数据授权运营空间“1 7 2 N”体系技术侧围绕可信空间技术系统要求,空间具备以下四大重点能力。一是一体化协同能力,实现与省公共数据服务平台的数据目录同步、资源接入和业务协同,支持场景申请、产品出域等审批流程,并提供智能化的审批辅助;二是全链路开发能力:提供数据清洗加工、产品建模、出域审核等功能,支持多源数据接入、低代码工作流编排、自定义算法开发与模型上架;三是多租户运营能力,支持多级机构按角色权限认证使用空间资源、工具与数据,可提供授权运营域内跨区域跨层级的业务拓展;四是价值运营能力,具备产品审核、计量计费、运营指标分析等功能,实现数据价值的共创共享。在业务侧,该空间以区块链、隐私计算及使用控制等技术为底层支撑,采用“开发工具库 业务管控台”的双轮驱动模式,并结合“采、治、开、运、流、安”六项流程开展数据业务工作。其中,数据治理工具库涵盖多模态语料标注、数据清洗等功能;数据建模工具库则集成了多方安全计算、联邦学习、原子模型开发等先进工具,可支持数据产品与应用的快速构建;安全工具库配备数据沙箱、数据保险箱等工具,确保数据的安全可信;业务管控台方面,其提供租户空间管理、工具整合及运营支撑服务,同时搭载授权管理、计量计费等功能,能够有效破解数据定价与计量的难题。运营侧,创新“政府 授权运营机构 市场主体”协同模式:政府负责政策引导与合规监管,授权运营机构承担数据治理与产品开发,企业用户通过空间获取标准化数据服务,形成“数据供给-开发-流通-应用”的闭环生态。38图 20 贵州省公共数据授权运营空间安全能力安全侧在安全防护方面,平台侧构建了“双闭环”数据安全体系,通过技术实现数据“出域不离域”,管理上做到审批、预警与溯源闭环。平台安全采用“三位一体”架构,符合国家三级等保,部署零信任与密码服务,强化基础安全;在数据流程中实行分级管控,借助安全网关、云桌面、API 监测等手段,确保各级数据合规使用;并通过安全监管平台和行为分析,实现全流程可追溯。线下场地实行分区管理,按安全等级设置权限,并配备视频监控与防偷拍设备,保障物理环境安全。?1.3 项目成果基于贵州省公共数据服务平台已经归集的 14.7 亿条公共数据资源,通过授权运营空间已形成 80 个公共数据产品。贵州将持续探索“政府 授权运营机构 开发利用机构”的公共数据授权运营协同机制,加大力度开展大模型与空间融合等技术攻关,培育带动一批数据技术和产品服务商,将平台打造成支撑构建全国一体化数据市场的重要载体。392.1 项目背景2024 年,贵州省提出打造世界级旅游目的地,大力推动智慧旅游发展。2025 政府工作报告指出,持续提升旅游业发展质效,大力发展智慧旅游,加快“省旅游数智互联平台”等项目建设。同时,贵州省推动人工智能高质量发展行动方案(20252027 年)提出:1)实施数据资源建设行动,保障高质量数据供给。2)实施行业大模型发展行动,促进产业转型升级。3)实施数字生态优化行动,激发改革创新活力。在文旅数据极度分散的情况下,围绕游客的核心体验作为大模型构建的切入点,打造游客端服务智能体。同时聚焦智能行程规划等复杂场景,解决游客在旅游攻略耗时耗力的痛点,通过构建智能体去集成相关信息、旅游的资源和服务,实现贵州特色资源与游客需求的匹配,构建以用户意图为核心的智能交互,推动传统依赖于平台为中心的模式从“人找服务”的模式向“服务找人”模式进行转变。2.2 解决方案贵州旅游可信数据空间建设实践,可总结为以下六大关键步骤:(1)从用户的视角设计主要数据维护:基于多年实践,和对旅游产业生态、群众服务的深度研究,结合国家文旅行业数据分类方法,以用户视角设计了一套新型数据标准。从四项核心维度完成数据汇聚,以景区为例包括:位置与设施、门票、主要景点与项目,综合评价等,同时将数据进行精细化标签管理。(2)建立“四维一体”的数据采集体系:通过融合政府公共数据确保数据可信性、互联网公开数据确保场景丰富性、经营系统的运营数据确保动态准确性、人工填报数据确保细节完备性,形成一套全面、可信、精准可用的贵州文旅数据体系,加快推动构建以数据为关键要素的数字经济,发挥数据的基础资源作用和创新引擎作用。(3)形成一批文旅行业数字化转型工具、标准化接口,让数据“供得出”:通过搭建酒店智能体、景区智能体等数智化工具,解决文旅行业中很多中小企业数据供不出的难题。同时,开发多类标准化的接口,以支撑供应商的系统连接。(4)构建省市两级联动的互联平台,建立数据高效供给体系:由市州运营平台负责联通本地各类旅游服务企业和商品,组织做好本地交易结算和落地服务;省级枢纽平台负责聚合全省旅游服务资源数据,建成充分开放的省级本地网,运用旅游服务智能体,拓展全网和市场渠道,为实体企业降本增效,驱动交易、资金、数据的本地归集。(5)打造数据可信的流通体系:依托省旅游数智互联平台,逐步构建数据要素平台与可信数据空间管理平台,推动数据要素价值释放。以场景需求为牵引,基于各方共识规则,完善“采-治-算-流-用”全生命周期的数据安全与合规管理,赋能行业大模型提供更精准的游客画像和更好的产业服务。2、贵州省旅游可信数据空间及大模型实践40图 21 贵州省旅游数智互联平台暨旅游行业大模型总体架构2.3 项目成果依托旅游大模型,打造了“黄小西”旅游智能体生态,形成一套完整的开发和销售体系,通过“自主创新与开放合作并重”的技术路线,围绕“游客服务个性化、企业运营智能化、行业治理精准化”领域形成智能体产品矩阵。一是 C 端智能体产品,为游客提供行程规划、快捷订购、AI 伴游、游记生成等应用场景,实现行程规划到一键下单的完整闭环体验;并支持轻量化嵌入各类旅游服务平台,链接各类旅游企业并提供线下服务,随时随地为游客的贵州之旅提供便利。二是B 端智能体产品体系,为酒店提供智能客房服务、智能问答、周边地图、旅行安排等功能,帮助酒店实现“经营自己”与“经营周边”的双向提升。同时景区智能体正在开发中,打造以 AI 为核心的游客体验系统,覆盖智能导览、智能讲解、景区购票、景区活动等领域。(6)建立开放共享的数智化生态,推动旅游产业转型升级。加强和各市州文旅部门以及各类涉旅主体以及行业协会的沟通对接,加强横向沟通、纵向贯通,横向上积极探索与携程、同程、美团、高德、一码游贵州、贵客荟等本地旅游平台和 OTA 平台合作,纵向上加强与市(州)、县(区)以及各涉旅市场主体的沟通,创新合作模式,共建旅游生态,共同推动平台的建设和发展,共享平台建设成果。?413.1 项目背景作为全球数据汇聚流通的重要节点,上海在探索数据要素市场化的过程中,提出了自己的“上海方案”。为此,上海率先于 2022 年成立数据集团,打造数据要素市场化配置的核心载体,加速公共数据和国企数据的要素化。上海数据集团是以数据为核心业务的具有功能保障属性的市场竞争类市属一级国企。作为上海市公共数据授权运营主体和城市一体化大数据资源基础治理的支撑主体,以推进数据要素市场建设、激发数据要素潜能、保障数据安全为战略使命,以促进3、上海数据集团城市数据空间实践公共数据、社会数据、个人数据融合开发利用为主责主业,聚焦数字产业化、产业数字化和推动数据产业生态发展,践行“数据治理体系共建者、数据资源体系开拓者、数字经济发展引领者、数字政府建设推动者、国际数据合作先行者”的责任担当,致力于成为世界一流的数据要素型企业。通过整合公共数据空间、企业数据空间和个人数据空间,利用创新的技术寻找数据要素的价值场景,释放数据要素的生产力,帮助上海各政府机构、本地企业、民众挖掘和赋能数据要素的价值,为此联合华为云 Stack 打造“城市数据空间”新范式。3.2 解决方案?图 22 上海城市数据空间解决方案体系架构42上海城市数据空间体系架构由四个部分组成(2 1 1):首先是 2 个保障体系(制度体系和组织体系),其中,制度体系从立法和法规角度,发布城市数据空间相关政策制度,构建从地方数据条例、管理办法、实施细则到地方标准的四位一体式法规体系,提供全方位保障。组织体系,从地方数据局到协同各级责任主体及标准委员会,形成清晰的组织架构保障。其次是1 个基础设施,包括基础硬件和基础软件,是支撑上层数据生态进行数据共享、开发、上市和流通的大平台。最后是1 个数据生态,包括参与到数据要素全生命周期流通里面的所有参与方,以及为这些参与方构建起来的生态培育环境。城市数据空间体系架构的四个组成部分,相互依赖又有机协同。制度和组织体系是空气和水分,基础设施是肥沃的黑土地,数据生态是繁荣的枝叶,数据要素高效合规流通是经脉主干道。图 23“天机智信”平台“1 2 4 X”整体架构2023 年,上海数据集团以公共数据为牵引,构建城市数据空间的关键基础设施“天机智信”平台。采用技术领先的湖仓一体、存算分离架构,满足以公共数据为牵引,融合企业数据、行业数据等多源数据汇聚、治理和开发利用,提供面向数据治理、数据产品、数据服务、数据应用的开发工具。围绕数据全生命周期,提供信任安全和授权运营的管理能力,以促进数据的社会化利用。“天机智信”平台深度融合区块链、隐私计算等关键技术,依托“浦江数链”、“数字信任”体系提供身份可认证、访问可控制、授权可管理、安全可审计、过程可追溯的关键技术能力,打造城市级数据空间基础设施的标杆和示范。“天机智信”平台打造“1 2 4 X”整体架构,如下图所示:?43 1 个数据底座:采用自主创新、安全可信的技术路线,构建统一的数据汇聚、存储、治理加工、运维管理能力的数据底座;2 套生命周期管理:建设数字信任和数据安全体系,实现数据全流程汇聚、采集、存储、加工、服务、使用的安全保障能力,并在对外数据要素流通中通过可信计算系统实现数据不动、算法和模型可动,避免数据外泄,充分保障了数据隐私安全。通过可信存系统实现数据授权、数据使用、数据目录、数据服务等全流程的存证留痕不可抵赖第三方审计,为数据社会化利用提供安全和运营支撑;4 类数据开发服务:提供数据治理、数据产品、数据服务、数据应用 4 类工具,为数据标的提供开发支持;提供对主数据、元数据、数据模型、数据标准、数据质量进行管理能力,形成整体多类数据的元数据管理、模型管理、数据质量管理等数据管控体系,打造数据资产管理能力;X个数据价值场景:面向上海城市数字化转型,重点面向数字治理、数字经济及数字生活,支持 X个数据价值场景的对外服务和发布。3.3 项目成果当前,以普惠金融场景为例,上海数据集团已经成功开放超过 3000 项公共数据,向 33 家金融机构提供数据标准化服务,帮助金融机构优化信贷评估模型,提升评估效率,为中小微企业完成了超过 6800 亿元的信贷评估发放,缓解中小微企业融资难,融资慢的问题。对于政府来说,也改善了区域营商环境,为社会经济长效发展注入动力。面向未来,上海数据集团将持续推进城市数据空间创新,以驱动城市数字经济高速增长。以全上海的城市数据授权运营为目标,实现公共数据、企业数据及其他数据的汇聚、供给、授权、运营及市场化开发利用,服务更多城市应用场景。444.1 项目背景南山区积极推进数据要素可信流通服务平台建设,通过建设数据云底座、公共数据授权运营平台、数据可信加工域、应用场景、运营机制等,有效提升了公共数据开发效率,促进了数据流通利用,探索形成了一批数智融合开发应用实践成果,包括医疗健康、科技创新等场景,有效赋能区域数据产业的发展。在案例可研和实施的过程中,需破解以下关键难题与瓶颈问题。一是公共数据授权运营制度流程待完善。开展公共数据授权运营需要解决以下难题,一是确定区域授权运营模式,依据南山区实际情况,建立可发挥数商主观能动性、激发数据开发活力的运营模式;二是建立场景需求审批的跨部门协同机制,高效开展供需对接,三是建立合规审核机制,完善对开发主体资质审核、场景的合规性审核、数据产品的出域审核机制等;四是建立全流程的安全防护机制,包括开发方管理、安全要求、监督机制、应急预案等。二是数据应用场景待拓展。公共数据应用主要集中于政务、金融信贷等少数领域,跨行业数据融合场景匮乏,行业间的数据壁垒仍存在;场景开发在广度与深度上均显不足,缺乏创新性、可复制的成熟应用场景,数据价值释放不充分。4、深圳南山数据可信流通服务探索实践三是数据可信流通技术待突破。在公共数据和行业数据开发利用及流通过程中,数据泄露、二次散播、本地存留等自身权益不能保障的问题,使数据提供方不愿、不敢或不能提供数据,阻碍了数据要素流通产业发展。需加强数据安全技术能力建设,灵活运用于数据流通应用场景,保障数据主权,使跨域、跨体系、跨行业数据“可用不可见,可见不可得”,促进数据要素市场繁荣。4.2 解决方案南山区通过建立数据要素可信流通服务平台,完善公共数据授权运营体系,统筹规划建设数据基础设施,探索试点行业数据要素创新应用,最终实现数据资源的优化配置和高效利用。45图 24 南山区数据要素可信流通服务平台总体架构南山区政务服务和数据管理局牵头制定了 关于数据要素赋能南山区高质量发展的实施意见,系统提出南山区数据要素生态发展的整体规划,确定了南山区数据基础设施建设思路。包括对数据要素业务运营环境的构建,依托数据湖、数据仓库,一体化数据开发平台等数据底座,应用区块链、隐私计算、数据空间等关键技术,持续构筑数据开发利用和可信流通能力。以上共同形成南山区坚实的数据基础设施底座。具体措施主要有以下几点:1)建设南山区数据要素可信流通服务平台:南山区数据要素可信流通服务平台作为南山区公共数据开发利用和行业数据空间的战略载体,通过“1 4 N”的架构规划,推动南山区数据要素产业的发展。“1”是指一套区公共数据授权运营系统,基于区数据要素可信流通服务中心,开启数据要素价值释放的新篇章。主要建设方案内容包括:夯实统一数据底座:进一步完善数据底座能力,通过补充高性能数据湖存算能力、完善分布式数据仓库环境、引入通用关系型数据库、区块链等,为数据的存储和管理提供坚实基础。构筑数据开发平台:引入一站式数据开发利用平台,集数据采集、汇聚、加工、流通、安全等能力于一体,实现端到端数据开发处理,高效支撑数据产品的开发和流通利用。远期规划语料加工、数据标注、AI算法开发与场景化建模等 AI 相关开发能力。建设流通利用能力:补充数据 API 服务网关、多方安全计算及联邦学习模型开发等隐私计算能力,以及可信数据空间连接器能力等,满足多种场景下高价值数据产品的跨域安全流通需求,实现“数据可用不可见”,“数据可见不可得”,“数据不动价值动”。“4”是指对 4 类数据服务的信息检索,分别是“找数据”“找算力”“找服务”和“找政策”;4 个找满足了对南?46山数据要素相关资源或服务一站式便捷查找和供需撮合,推动数据产业信息共享,促进各主体围绕流通服务平台高效开展作业,有利于数据生态汇聚和产业培育及发展。“N”是指 N 个行业数据空间的特色专区。专区充分结合南山区的发展规划和产业分析,以成熟一个规划一个的方式,逐步推动南山区特色产业专区的建设,现阶段规划的是人工智能、低空经济、医疗健康、具身智能等专区。2)探索可信数据流通创新场景:南山区切实推动数据要素 千行百业行动。协同发改、工信、科创、卫健等业务主管部门,打造第一批40 “数据要素”应用场景,推动数据要素深度融入重点领域。结合南山区丰富的医疗科研资源、医疗产业基础,南山区先行先试规划医疗健康领域数据空间专区,构建医疗数据合规、安全的统一供给渠道,通过隐私计算、可控数据交换等数据流通技术,帮助科研团队等机构在数据“可用不可见、可见不可得”的前提下,使用医疗数据完成科研分析,提升医疗科研创新能力。3)完善一套合规高效的运营机制:出台实施 深圳市南山区公共数据授权运营管理暂行办法,明确由区数据主管部门建设公共数据授权运营统一通道,实现授权运营工作集约化管理;全面落实“首席数据官”,明确专人负责本机构公共数据资源管理;编制包括公共数据授权运营平台用户管理、公共数据资源处理、开发利用、授权运营安全管理、应急预案等共 18 个运营配套制度文件,保障公共数据合规、高效流通。4.3 项目成果南山区数据要素可信流通服务平台利用大数据、数据仓库、隐私计算、区块链等技术,提升平台能力。采用先进湖仓技术支持对海量公共数据进行高效挖掘分析,加工成高价值的数据产品;规划数据工程能力,为大模型训练提供高质量语料集;利用区块链技术保障数据的安全性和可追溯性,确保数据在授权运营过程中的可信度,并结合隐私计算、可控交换等数据流通技术,为数据“供得出”“流得动”“用得好”“保安全”提供技术保障。在“数据要素 医疗”场景中,打造“数据 平台 场景”一体化的医疗数据安全流通解决方案,当前可信流通服务平台已连接南山医院等各方主体,实现了医疗健康领域的数据可信互联互通。通过医疗行业数据高质量供给,支撑重点应用场景创新,如:在医疗科研场景,医疗影像数据经过数据开发方的标注之后,形成高质量数据集,并基于可信数据空间实现数据集在医疗机构和科研机构间可控交换,辅助诊断模型训练效率大幅提升。在医疗健康场景,基于医院的诊疗记录、住院结算费用等数据,在病人离院结算时,实现商业保险公司的直接赔付,借助合规开放就医数据,实现商保快赔平均 30 分钟内、商保直赔最快 3 秒内免材料赔付,降低保险公司理赔调查成本 50%以上。医疗数据空间专区激活了医疗健康行业数据,形成可开发利用、可流通的高价值数据资产,逐步赋能健康数字经济产业的应用落地,支撑建立健康数字经济生态圈。未来南山区将继续规划人工智能、具身智能、低空经济等产业专区,促进各新兴产业的数据流通利用,促进产业的茁壮发展。475、华为企业数据空间探索实践5.1 项目背景随着数字化转型的推进,以数据为核心 的理念正在重塑企业的能力,其效果正逐步显现。在这一过程中,企业内部的数据流通和消费模式也在发生变化。过去,数据主要沿着企业内部的一条或多条业务流程进行集成和共享。而现在,这种模式正在向跨主体、跨边界的数据流通和交换转变。数据在企业中的角色也经历了转变,从仅仅是 IT 系统的一部分,逐渐演变为一种战略资产,最终成为企业生产的关键要素。然而,数据的非排他性和无损复制性等固有特性,也为企业的数据流通带来了新的挑战。这些特性要求企业在数据管理上采取更加灵活和创新的方法,以确保数据的安全、合规和有效利用。为应对数据作为生产要素流通的挑战,华为提出了创新的数据空间解决方案。该方案的关键在于通过技术手段确保数据交换协议得到有效执行,以解决数据的非排他性和可复制性问题,并保障数据流通过程中合约的遵守。数据空间整合了数据连接器、注册认证服务、使用控制服务和清算服务等核心功能模块,并建立了一套完善的“可信、可控、可证”的技术体系。华为的鲲鹏/昇腾生态链覆盖了从底层硬件到基础软件,再到上层行业应用的全产业链。这一生态系统具有参与方众多、业务覆盖面广、数据商业价值高和协同需求强等特点。其中,数据在生态链中的自由流通是关键需求,它有助于促进数据价值的释放和支撑技术创新。基于数据空间的理念,项目针对生态业务中的特定问题和需求,构建了鲲鹏/昇腾数据空间,并在联合研发、供应链协同、质量管理追溯等场景中实现了有效应用,充分发挥了数据要素的价值。5.2 解决方案针对鲲鹏/昇腾生态业务中的问题和诉求,华为构建了 EDS(Enterprise Data Space,企业数据交换空间),实现了数据流通的“可信、可控、可证”。1)构建跨主体数据流通的信任机制:生态业务各参与方的身份认证。CA(Certificate Authority,认证中心)经过评估认证,向参与方颁发数字证书,该数字证书是唯一的身份标识。访问鉴权与可信通信。数据提供方与数据使用方技术部件之间的通信,基于 PKI(public key infrastructure,公共密钥基础设施)完成鉴权、数字签名,从而保证数据传输的安全性、完整性和实名性。安全、平等、可信的执行环境。这个环境基于容器管理技术和基础安全能力打造而成。2)构建数据使用控制机制,实现全流程的精细管控:数据使用控制策略:基于“4W2H”(Who、When、Where、Do What、How To、How Many)设计原子策略,灵活组合,实现精准的数据使用控制。全流程精细管控:全流程操作通过日志记录 区块链存证 全链路血缘,实现数据提供方可查证追溯、数据使用方可自证清白、数据监管方可监管审计。3)建跨主体的数据交换合约,并通过技术手段保证合约的有效履行:跨主体的数据交换生成智能合约,基于契约化的合约,实现双方要求与承诺的 IT 化,并通过区块链进行存证,防止篡改。合约中包含的数据使用控制策略,通过技术手段被IT 强制遵守,避免人工执行带来的不可控风险。485.3 项目成果鲲鹏/昇腾产业生态数据空间于 2021 年 9月上线使用,目前已包含 15 个参与方(华为 2 个,生态伙伴 13 个),上架 25 数据交换资源,应用 21 使用控制策略,累计数据交换量 14000 次。图 25 鲲鹏/昇腾生态数据空间业务概况鲲鹏/昇腾产业生态数据空间的使用,有效支撑了华为与生态伙伴在研发、生产制造、产品服务等领域的业务深度协同,并积累了4 类典型应用场景:(1)高密的资料文档交换。主要应用于研发、销售等领域,如涉及芯片/部件相关的技术文件、研发路标规划等,为非结构化数据文件,如 Word、PPT、Excel、PDF 等文件,从华为向生态伙伴单向传递。属于华为高密数据,需要严格控制使用范围(仅具体合作项目成员),只允许查看。(2)敏感业务信息共享查询。主要应用于制造、物流、服务等领域,如华为向整机厂商供货的物流计划与状态数据,为结构化数据,从华为向生态伙伴单向传递。属于华为受控数据,需要控制数据使用范围(伙伴采购相关岗位人员),按需即席查询。(3)多方数据联合分析。主要应用于质量追溯、运营分析等场景,如汇聚各环节产品质量问题数据,进行质量联合追溯,为结构化、非结构化数据,需要华为与生态伙伴互相交换,并支撑端到端的质量追溯及运营分析。属于机密数据,需要严格控制数据使用范围(双方质量运营团队),允许数据整合分析。(4)重要项目的互动协同。主要应用于能力评估协同、伙伴能力提升等场景。如华为帮助生态伙伴进行能力评估,华为向生态伙伴提供评估项,生态伙伴反馈举证数据,基于评估结果制定提升计划,为半结构化、非结构化数据,双向多次交互。属于高度机密数据,需要严格控制数据使用范围(评估项目专家团队),允许查看和编辑。?4904参考引用1 MoonFox&中欧 AI 与管理创新研究中心,AI 产业全景洞察报 2025,20252 Stanford HAI,2025 年人工智能指数报告,20253 深圳市工业和信息化局,深圳市加快推进人工智能终端产业发展行动计划(20252026 年),20254 华为公司,AI 大模型技术和趋势洞察 2.0,20245 上海数据集团有限公司,华为云计算技术有限公司,城市数据空间 CDS 白皮书,20236 中国国际问题研究院,国际问题研究,20247 华为云开发者联盟,分布式身份:重新定义你的“身份”管理,20218 https:/ Think 主页,2024.5.319 数据要素白皮书,中国信息通信研究院,2023.910“用基础制度破解基础难题,开启数据要素价值释放新时代”,政策解读,中华人民共和国国家发展和改革委员会,2022.12.2011 当贝 AI 生态扩容:通义Qwen3-235B 多模态能力开放:https:/ 2025 年 AI 语料行业现状及未来发展趋势预测:https:/ 上海量子城市突破:专项语料库助力 AI 治理,精准“锁”住幻觉:http:/ 每日互动发布 GAI Station 智能工作站,破解企业 AI 应用私有化部署难题:http:/ Lakehouse:A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics,Michael Armbrust,Ali Ghodsi,Reynold Xin,Matei Zaharia51
2025-09-08
52页




5星级
1/282025 年年 9 月月 5 日日行业行业|深度深度|研究报告研究报告行业研究报告慧博智能投研物理物理AI行业深度:市场现状、发展展望、受行业深度:市场现状、发展展望、受益环节及相关公司深度梳.
2025-09-08
28页




5星级
AI来了销售 会被取代吗?AI来了,销售会被取代吗?Copyright Richardson.All rights reserved.|2 随着生成式人工智能在销售领域的存在感越来越强,一个问题被反复.
2025-09-03
11页




5星级
十五五规划建议全文(25页).pdf
三个皮匠报告:2025银发经济生态:中国与全球实践白皮书(150页).pdf
三个皮匠报告:2025中国情绪消费市场洞察报告(24页).pdf
2025刘润年度演讲PPT:进化的力量.pdf
三个皮匠报告:2025中国AI芯片市场洞察报告(24页).pdf
清华大学:2025年AIGC发展研究报告4.0版(152页).pdf
深圳人工智能协会:2025人工智能发展白皮书(144页).pdf
三个皮匠报告:2025银发经济生态:中国与全球实践白皮书(PPT版)(55页).pdf
三个皮匠报告:2025中国稀土产业市场洞察报告-从资源到战略武器,中美博弈的稀土战场(25页).pdf
三个皮匠报告:2025年 i 人经济洞察报告:社恐如何重塑新消费市场(23页).pdf