1、金融场景中的多智能体应用探索陈鸿 蚂蚁集团资深算法专家从大模型到多智能体金融场景中的多智能体AgentUniverse实际案例大纲状态设计协同模式严谨性专业性从大模型到多智能体大模型智能体/多智能体金融场景问答、摘要、Copilot(建议)分析、归因、决策语言模型自然语言界面的智能机器对齐训练快思考慢思考状态机助手模型协同模式智能体多智能体简单推理和工具调用无状态、问答参数化的知识容器复杂要求不胜任感知记忆规划行动需要规划的复杂任务理解环境、自主互动有状态、任务解决分布/集中多环节、多分支合作/竞争信息交换和分工更鲁棒?更脆弱?12基于大模型的智能体:超级状态机 规划感知行动定义执行步骤智能体
2、定义环境上下文理解环境=识别环境环境的不同状态专业Knowhow的引入和识别,专家不成文知识的形式化How to senseHow to plan规划任务=识别任务任务的不同状态记忆定义自省空间How to reflect整理记忆=识别行动的结果结果状态专业knowhow定义智能体的能力How to act执行动作=识别行动行动的可选状态LLM规则多智能体协同模式不同的专业任务需要不一样的协同方式上下级协同上下级协同Hierarchical Collaboration竞争式协同竞争式协同Competitive Collaboration师生式协同师生式协同Master-Disciple Col
3、laboration Sub-L1智能体1Sub-L1智能体中控智能体Sub-L1智能体2Sub-L2智能体1Sub-L2智能体 专家/专家智能体 传递Knowhow 新手智能体策划思路信息收集表达格式评价标准智能体1智能体2智能体3最终决策/裁决决策1决策2决策3适合拆解的复杂任务难以拆解的复杂任务开放性的复杂任务金融场景中的多智能体信息密集知识密集决策密集更新密集知识冲突多智能体预处理+RAG+自省知识边界不确定性 不对称性噪声密集Retrieval Augmented大模型Knowledge GraphChain of Thought严谨性专业性大模型Alignment推理+Tool-C
4、alling知识/能力Knowhow专家框架+职能分工12金融场景通用方案效果不及预期金融场景专用方案严谨性:完成不可能的任务严谨性安全驾驶vs.LLM 的内在缺陷知识引用知识边界知识冲突人类司机的内在缺陷注意力自控力预判力+驾驶培训+交通系统+汽车安全+细分培训场景老司机经验主动安全被动安全信号系统车道系统交警监控对齐训练+产品系统智能体机制+SFTDPO工具调用自我评价RAG图谱在线攻防专业性:源自分工、回到分工慢思考快思考多任务单任务金融数学计算宏观分析行情归因市场舆情研报摘要多智能体协同单智能体单模型端到端多模型并发1,专业来自分工、是面向经济效率的优化选择 协同分工是面临多任务难问题
5、的高ROI 方案2,知识易补、能力难建3,专业性建设的核心是定义并实现差异化能力超级AGI单打独斗所有任务ROI 团队合作领域知识注入成本(RAG)能力注入成本 优秀模型多人设(起步)vs.差异化精调的不同基座(迭代)效果反思Agent的专业能力定制驱动记忆驱动记忆驱动规划驱动规划驱动工具驱动工具检索复用ICL效果反思Good casebad caseDynamic Memory与常识背离的专业判断例:经济数据偏弱,利多债市由LLM 推理驱动的Agent机制(记忆、规划、工具)比常识有更多细节的专业方案PEER框架比LLM更加可靠的专业动作产出任务规划例:财报分析中分析师关注的典型维度计划执行
6、汇总评价思路要求标准专家框架例:财报解读中校对金融数据关系挖掘信息抽取工具单位变换工具收益计算工具生成财务观点开源项目:AgentUniverse完整开源部分开源AgentServeAgentServe 智能体服务化机制SolutionSolution SetSet 行业解决方案集数据集数据集评测集评测集(Fin-Eva)(Fin-Eva)TrainingTraining DataData&Fin-ToolFin-Tool2000亿+token优质语料60万+金融对齐指令5大类金融能力评估(认知、生成、知识、服务、合规)工具集工具集300+金融工具接口(理财、保险、信贷)机构针对性机构针对性部