《InfoQ研究中心:中国AI Agent应用研究报告2024(49页).pdf》由会员分享,可在线阅读,更多相关《InfoQ研究中心:中国AI Agent应用研究报告2024(49页).pdf(49页珍藏版)》请在三个皮匠报告上搜索。
1、目录CONTENTAI Agent 市场发展背景和特征分析01AI Agent 市场特征和案例分析02AI Agent 市场未来趋势03AI Agent 市场发展背景和特征分析2024年中国人工智能成熟度模型前沿技术航天航空、航海和特种汽车无人驾驶合成数据生成类脑芯片脑机接口人型机器人视频生成通用人工智能(AGI)早期推广技术AI安全可解释AI大模型工程化检索增强生成(RAG)通用大模型行业大模型端侧AI(IOT、Edge、Mobile)基于大模型的对话机器人多模态模型AI智能体(Agent)图像生成3D生成三维视觉LLMOps准成熟技术半定制芯片(FPGA)全定制芯片(ASIC)强化学习分布
2、式深度学习机器/深度学习平台提示工程文本分析文本生成音频生成语义分析知识图谱代码生成智能视频编码汽车自动驾驶数字人/虚拟人RPAAIOps成熟技术通用芯片(GPU)传统对话机器人机器学习OCR识别人脸识别生物识别数据挖掘推荐系统物体识别语音识别专家系统MLOps2024年中国人工智能成熟度模型研究说明2023年,InfoQ研究中心第一次发布人工智能成熟度模型。在这一年中,人工智能领域发生了诸多变化,因此InfoQ研究中心再次基于技术专利数量、技术发展时间、技术舆论指数等核心指标,结合市场规模与融资事件等公开资料,以及技术和市场专家的验证,绘制了中国人工智能成熟度模型。Agent 衔接模型层与应
3、用层,是现阶段大模型应用落地的重要补充随着中间层能力的不断实践和积累,相对通用和标准化的能力将从中间层中提炼集成在模型层中基于应用的需要,中间层通过技术形式帮助应用层实现通用模型不具备的一些能力中间层是连接应用层和模型层的桥梁,在现阶段是作为大模型应用落地能力补充的重要层级。随着底层模型技术的持续进步与演化,未来可能会出现模型层逐渐内化并泛化出原本由中间层提供的部分能力。与此同时新的应用需求还会持续出现。智能体,在众多中间层中,处于中心位置,可以封装模型微调、提示工程、检索增强生成。微调用于解决预训练模型在特定任务上性能不足的问题。智能体(Agent)用于解决模型在实际应用中的交互和决策问题。
4、成本高适应性高检索增强生成用于幻觉和知识更新的问题。成本低适应性低提示工程用于解决模型对于不同任务的泛化能力不足的问题。调用模型层应用层中间层Agent 框架持续发布,单/多智能体协同发展2023年6月2023年9月2023年12月2024年3月2024年6月单智能体多智能体BabyAGIAutoGPTHuggingGPTCAMELGenerativeAgentsGPTeamAgentGPTGPT-EngineerMetaGPTChatDEVShortGPTCrewAIAutoGenAgentVerseAutoAgentsTranslationAgentTalkWeaverAPP AgentU
5、FODS-AgentOS CopilotScreenAgentJATSWE-AgentDevikaSIMACradleAgentUniverseAgentHospitalSimClassTransAgent通用类环境模拟类软件开发类多模态类翻译类终端交互类数据分析类自2023年3月,以AutoGPT为代表的一系列技术框架的发布,AI Agent以其自主性和解决问题的能力,迅速获得科技圈各方讨论。并在之后一年多的时间中,陆续发布多项不同种类的技术框架。除了使用领域的探索之外,单智能体和多智能体协同的两种智能体框架,也在同步发展。2023年3月-2024年6月期间发布的典型 Agent 框架Age
6、nt 是集大模型、数据、工具多维一体的系统化工程在技术框架的不断探索中,Agent的技术框架认知逐渐统一,大模型作为大脑,驱动规划、工具使用、记忆三大基本能力模块指导行动,智能体逐渐通过与环境、智能体和人类交互的反馈中不断进化。在T-Eval大模型智能体基准测试中,步骤推理(REASON)能力得分明显落后于测试均分,这意味着推理仍是能力短板。环境感知反馈大模型记忆工具使用规划行动智能体智能体长期记忆短期记忆任务拆解反思改进COTPlan-and-SolveTOTGOTReActReflexionCRITICSelf-Refine插件外部APIAgent 通用技术框架020406080100GP
7、T-4Yi-Chat-34BClaude2.1Qwen-72BDeepSeek-LLaMA2-70BBaichuan2-13BMistral-7BChatGLM-6B-InternLM-T-Eval均分指令规划得分步骤推理得分T-Eval大模型智能体基准测试分数数据来源:T-Eval大模型智能体基准测试,是专门针对智能体工具使用的全过程设计的基准测试,包含:规划(Plan)、推理(REASON)、检索(RETRIEVE)、理解(UNDERSTAND)、指令跟随(INSTRUCT)和审查(REVIEW)。测评结果仪表盘链接:https:/open-compass.github.io/T-Eval
8、/leaderboard_zh.html、https:/ 2.0-4.0模型家族Gemini 1.0GLM1-3大模型家族GPT-1到4共计5个大模型混元大模型InternMLLLaMA开源模型家族Mistral开源模型家族Moonshot v1Skywork书生浦语模型家族天工模型家族Qwen开源模型系列讯飞星火模型V1.0-3.0XVERSE1.0-2.0Yi开源模型家族2024年以前发布的大模型/大模型家族国内外大模型厂商第一轮交卷完成宣传重点经历了从单纯的模型参数到能力提升Yi-VL-34BBaichuan3讯飞星火V3.5MiniCPM-V-2Gemini 1.5Mistral La
9、rgeClaude 3DeepSeek VLGrok-1Grok-1.5MobileVLM V2视觉语言模型Open-Sora 1.0MAGnetDBRXQwen1.5-MoE-A2.7BJamba2024Q1多模态模型以Sora拉开序幕语言模型MOE成果积累Zamba-7Babab6.5Llama3OpenELMPhi-3 MiniQwen1.5DeepSeek-V2Yi-1.5GPT-4oYi-large豆包大模型Baichuan4GLM-4Qwen2Claude3.5 Sonnet讯飞星火V4.0InternLM2.5Vidu可灵视界一粟 YiSuVeo天工 3.0源2.0-M32202
10、4Q2语言模型长文本竞争拉开序幕模型竞争转向性价比与响应速度作为智能体大脑的大模型,在短短2年时间内,经历了3轮主要更新和竞争重点的转变。2024年第二季度,模型竞争逐渐转向在性能不打折的情况下,具备更强的成本效应和快速响应。2023-2024年主要大模型发布/更新及竞争阶段现阶段的智能体应用,仍未长出足够的自主思考能力以应对复杂场景自主思考:理想中的智能体应具有较强的自主决策能力和环境适应性。规划与工具调用:只需设立目标,理想中的智能体即可自主思考和规划路径,选择合适的工具达成目标。记忆:在逐渐的使用过程中,理想中的智能体可以实现持久的记忆和学习能力,能够积累并保留知识经验。多模态:理想中的
11、智能体应具备对现实世界的理解、模拟、反馈持续学习能力。理想中的智能体自主思考:现阶段的Agent大多仍处在RPA的思路中,依赖人为干预和预设规则。规划与工具调用:现阶段的智能体在复杂场景下的推理能力差,只有在清晰、详细的指令下才可以稳定发挥。记忆:现阶段的智能体大多局限于通过Prompt构建短期记忆,事实性记忆多通过RAG来构建。虽然大模型的上下文长度上限一直在提升,但仍然缺乏在对话之外持久保存和累积知识的机制。多模态理解:现阶段的智能体大脑仍以大语言模型为主,缺乏对多模态的理解。现阶段的智能体在Agent的理论框架中,自主思考和规划能力是其核心特征,这也是Agent与ChatBot和Copi
12、lot等应用的关键区别。然而,当前阶段的智能体实际构建与这一理想状态仍有显著差距。AI Agent 市场特征和案例分析场景容错性情感陪伴虚拟顾问(塔罗、星盘、八字等)世界观体验(游戏、影视、小说关键角色)理财顾问医疗顾问订票助手AI Agent 应用探索程度口语教学保险规划陪伴助教社交媒体运营个人法律顾问智能导购AI游戏队友旅行规划应用场景分析:生活类情感陪伴场景先行,专业类场景开始试点生活专业类场景生活陪伴类场景高低低高AI Agent现阶段典型应用场景分析在生活陪伴类场景中,AI Agent通过对话交互形式,结合记忆模块的能力,能够提供更加丰富和深入的情感体验,这使得生活陪伴成为AI Ag
13、ent应用探索程度较高的一个领域。AI Agent 应用探索程度场景容错性数据分析智能客服话术专家开票专家企业法律顾问私域运营商家助手智能编码企业财务助手营销助手招聘助手内容制作研报分析企业知识顾问智能NPC智能纪要应用场景分析:企业场景与大模型应用保持一致高低低高AI Agent现阶段典型应用场景分析企业专业类场景应用探索程度,与其大模型大脑保持相对一致,在办公、编码、财税、数据分析、营销等场景优先起步。对于生活专业类场景而言,受限于早期的工具生态、服务监管和尚未清晰的盈利模型,AI Agent应用探索程度普遍较低。企业专业类场景产品发展早期阶段,四大类厂商各显神通厂商类型升级路径产品形态厂
14、商优势代表厂商InfoQ研究中心在对市面上对外服务的 AI Agent 产品进行研究后,发现其背景主要分为大模型创业厂商、互联网科技厂商、RPA/流程自动化厂商和数字化企业服务商。数字化企业服务商依托自身长期积累的垂类领域或行业的Know-how,实现企业内数字化系统的功能升级Agent 作为一个功能组件,内置进数字化系统与原有数字化系统深度集成,API联动生态完善用友、金蝶、标普云、数势科技等RPA/流程自动化厂商依托自身长期积累的企业内流程自动化落地经验,为客户提供更智能化的产品和服务Agent 技术思路集成进原有RPA产品在流程自动化领域积累的大量成功落地经验来也科技、实在智能等互联网科
15、技厂商借助自身大模型以及 AI 云服务,为客户提供完整的 AI 技术解决方案AI Agent 应用市场&开发平台AI 生态建设完整;用户基础好,产品迭代快速百度、火山引擎、腾讯等大模型创业厂商借助自身大模型技术基础,满足企业大模型技术实际应用需求AI Agent 应用市场&开发平台对大模型具有技术前瞻视角Dify、澜码科技、面壁智能等多种Agent构建方式满足不同技术水平、不同场景的用户需求基础构建方式构建方式场景复杂度进阶构建方式用户技术要求代码构建开发平台通常也提供通过sdk等纯代码形式,进行智能体开发自然语言一键构建用户通过简短的自然语言输入,开发平台自动解析生成智能体相关配置百度Age
16、ntBuilder模拟学习构建用户在软件中演示操作,开发平台自动学习生成页面示意直接使用/通过内置模版构建用户使用内置预设好的模版进行构建标普云-Bpai智能财税法咨询复杂智能体构建用户自行设置智能体名称,提示词、组件、知识库等能力模块构建,也可通过可视化工作流拖拽构建虽然产品形态各异,但在构建和使用方式上,AI Agent 产品均支持根据内置模版构建、复杂智能体构建和代码构建三种基础构建方式,以满足不同技术水平的用户需求。此外,虽然大多数产品支持自然语言一键构建方式,但受限于现有大脑的任务拆解和规划能力,仍可以视为一种“面向未来”的构建方式。钉钉-AI助理百度智能云-千帆AppBuilder
17、火山引擎-扣子COZE有自研模型的平台类Agent产品更倾向于不接入第三方大模型根据InfoQ研究中心不完全统计,在19款具有自研模型的Agent产品中:接近70%不支持第三方大模型垂直类Agent产品更倾向于只支持自研模型垂直类Agent产品多会在自研模型的基础上构建。这可能是因为:1)能更好地进行模型微调,更好地适应特定行业和领域的任务需求2)提高对核心技术的掌控力3)数据安全和隐私保护的要求但近期存在小范围的转变倾向2024年5月起,扣子除了自研云雀(后改名豆包)大模型外,陆续开放支持通义千问、Minimax-abab系列模型、月之暗面Moonshot、智谱GLM-4、百川智能Baich
18、uan4等多家国内大语言模型。2024年5月,百度智能云旗下千帆AppBuilder在问答模型中引入多款开源模型。2024年6月,钉钉宣布对所有大模型厂商开放。开发者在钉钉上创建AI助理时,除了默认的通义大模型外,还可以依据自身需求,选择不同厂商的大模型。Agent产品是否支持第三方大模型逐渐出现分化68.4%对于Agent产品来说,有自研模型更倾向于不接入第三方模型,但近期有小范围的转变倾向。平台类Agent:涵盖智能体创建、发布使用到管理的全过程平台类Agent一般以智能体为核心以智能体开发和应用平台,提供围绕智能体各个环节的服务(创建、调试、发布、使用和数据分析等关键流程和功能点)。平台
19、类Agent的构建厂商多为大模型大模型创业厂商和互联网科技厂商,例如百度、火山引擎、有腾讯、Dify等,也有部分数字化企业服务商涉足,例如彩讯股份。智能体名称设定提示词模型选择工具选择知识输入记忆设置工作流设置预览调试形象设置对话设置超市/商店网页端API调用微信公众号、小程序等微信生态抖音、飞书等其他生态关键数据看板数据分析(用户、对话、行为)权限管理以智能体为核心平台型Agent典型功能AgentBuilder已经有 60 万开发者、10 万企业AppBuilder已有15万+客户通过千帆AppBuilder开发AI原生应用(截至2024年6月)扣子COZE估算约有2万+Bot腾讯元器围绕
20、腾讯内容生态,构建1000+智能体应用平台类Agent:工具数量和类型不足,工具生态正在构建初期技术框架中的工具在平台类Agent产品存在多种叫法:插件、组件等,但其本质都是将大模型大脑的思考转化为具体行动和执行的重要桥梁。目前支持的工具类型包含信息检索、文件读取等,数量和类型覆盖范围不够广,仍处在工具生态建设初期。人类创造工具及其使用规则Agent通过工作流按既定规则适用工具01人类创造足够多的工具生态Agent根据情况选择可使用的工具搭配02Agent自行创造工具人类提供反馈和最终决策03人类参与度Agent参与度使用工具工具构建工具生态构建反馈决策选择工具创造工具当前阶段由平台开发者直接
21、提供,通常与核心功能深度集成,稳定性和兼容性较高,更新和维护也更有保障。由其他开发者自行上传,平台通常会对其商用性、安全性进行审查,但第三方工具是工具生态的重要组成部分。目前绝大多数平台类Agent提供官方工具直接使用,第三方工具生态正在搭建中。例:截至2024年8月扣子提供700+插件Agentbuilder插件数量超过500+千帆AppBuilder提供70+个官方组件元器内置120+插件平台类Agent:盈利模式早期,订阅和按量计费模式先行设置不同的模式,或设置个人/企业版本,对模型选择范围、可创建智能体数量、知识库容量设置不同的使用量和限制,用户可以按照不同的使用周期进行付费。订阅模式
22、按照智能体的调用次数或者底层模型的Token使用量计费,或者对两者均按量计费。平台根据计费项对应的实际资源用量出具账单,开发者在收到账单后支付费用。按量计费模式少量平台类Agent正在探索该模式,根据智能体带来的实际效果或收益来支付费用,例如带来的销售线索等。也有部分开始探索广告模式,但仍在早期。收入分成模式由于产品类型仍处在快速转变期,盈利模式也仍然在早期探索中。现阶段,平台类Agent通常会为新用户设置一定的免费额度,以供新用户在平台进行基础功能的探索和智能体的创建使用。在免费额度之外,通常会按照订阅模式或按量计费模式进行付费。拓展用户池深化用户池正在探索线索转化商品转化广告转化垂直类Ag
23、ent:数据、工作流和工具生态构建竞争优势离领域数据更近通过长期服务同一领域的客户,积累了大量包括行业术语、流程、法规和最佳实践在内的行业数据和知识,为后续的微调、RAG提供更优质的输入。01对实际场景工作流理解更深入领域类Agent厂商自身多深耕领域多年,深入了解客户的业务流程和痛点,更精准地进行指令遵循和任务拆解。02为智能体解决复杂应用提供数据、工作流和工具的迭代飞轮数字化系统内置各类工具和组件,为智能体提供良好的工具生态,和流畅的客户体验。03离数字化系统更近相较于平台类Agent,垂直类Agent通常具有三类特点:离领域数据更近、对实际场景工作流理解更深入、离数字化系统更近。这也是垂
24、直类Agent的竞争优势所在。BPai智能财税法咨询垂直类Agent产品图谱办公财税数据分析编码教育文娱游戏消费光语金帆-AI财报点评金融其他营销垂直类Agent路线一:解决方案型垂直类Agent路线二:功能型对于垂直类Agent产品,InfoQ研究中心将其分为两条路径,一是构建数据、模型等企业级的解决方案型,二是构建专家智能体的功能型。腾讯元宝游戏Copilot队友容犀大模型应用Copilot&Agent垂直类Agent路线一:不仅是Agent,更是 AI 解决方案供应链办公-运小沓数据分析-SwiftAgent可以以对话插件形式内置在数字化系统中,也可以作为外置窗口通过屏幕感知进行相关操作
25、财税-BPAI财税智能体AI Agent载体解决方案型Agent更专注于解决特定职能的问题,聚焦于具体任务,例如数据分析、财税中的开票、供应链当中的报价等。本质是通过提供涵盖数据管理、模型管理、提示词管理、流程管理到Agent应用的更全面的工具和服务(解决方案)。数据准备内置工作流模型管理数据源业务系统外部系统数据类型结构化数据非结构化知识提示词工程多模型管理模型微调RAG数据分析指标分析画像拆解财税 开票/票据自动处理财税咨询编码代码生成测试/评估/部署营销营销话术营销策略小模型垂直类Agent路径一:收费模式延续解决方案,尚未发生巨变包括前期项目规划、需求分析、成本效益分析、风险评估、系统
26、配置、用户培训、测试和上线等环节等相关服务咨询和实施服务定制服务可能涉及到特定数据集的处理、模型的优化以适应特定场景、以及与现有系统的集成定制服务预开发的、相对标准化的应用/功能模块的部署,能够满足大多数客户的基本需求。标准化应用/功能模块部署服务从数据、模型到应用构建的标准平台建设平台建设服务对于领域类Agent来说,AI Agent是解决客户核心诉求的一种手段,所以新技术的迭代暂未对常规的收费和盈利模式带来冲击,仍然以解决方案整体报价为主。办公:智能体变身办公搭子,造就超级员工雏形办公场景中,一方面的应用是归纳总结能以与网页、对话解析工具叠加记忆模块,用以提升企业内部沟通协同效率;另一方面
27、是基于RPA与智能体任务规划能力相结合的RPA Agent。用户请求用户确认意图用户反馈提取用户岗位、目标信息OA系统、办公软件通过反问、追问明确目标和相应工作流根据分析目标,选择合适的数据库/知识库智能体反思与沉淀,便于快速分析和流程改进消息总结、智能问答等沟通整合任务数据分析工具数据可视化工具语义、意图分析小模型等数据分析智能体后端数据/工具根据知识库和工作流,进行流程相关操作最终态的办公类智能体现阶段的办公类智能体RPA固定固定流程灵活性最终态的办公类智能体薄弱现阶段的办公类智能体办公软件深入知识整合能力自动化程度办公类Agent的工作流程办公类Agent的典型应用场景知识总结流程执行办
28、公:面向知识整合和流程执行,与客户系统紧密结合者为先AI助理钉钉AI助理市场工作搭子 专家助理冲破软件边界 跨应用操作覆盖企业的核心工作场景,和用户的工作深度结合成熟的产品能力智能沟通01 消息总结:让你和爬楼说拜拜 智能问答:高效节省答疑人力 快速阅读:快速了解海量知识 工作概览:一键生成工作总结智能协同01 智慧文档:多种花样玩转文档 智能纪要:会议重点一目了然 智能日程:工作安排井井有条 一键待办:各司其职一目了然 智能填报:数据填报如此简单智能管理01 数据分析:轻松掌握业务情况 人事管理:考勤关怀一手拿下 差旅管理:订票报销不再难 流程管理:填报审批一条龙明确的用户需求丰富的企业知识
29、积累数字员工AI AgentAI Agents for Everyone知识管理和问答助手文档审核与风控助手知识文档规章制度操作规程产品文档文档汇集与更新大模型 RAG IDP等自动化理解和知识生成广泛的对话渠道提示词工程RPA业务规则即时更新流程即时更新变动、风险即时通知文档处理合同订单凭证票据AI Agent 反思进化大模型 RAG RPA等无论是知识整合还是流程执行场景,距离客户系统近都是重要的竞争优势。这种紧密的系统连接不仅有助于积累和运用企业专属知识,还能够提升流程执行的准确性和效率,确保任务的自动化和智能化处理更加贴合企业需求。数据分析:面向业务初级数据分析需求、理解分析目标、懂得
30、反思沉淀用户请求用户确认意图报告确认提取用户岗位、目标信息OA系统通过反问、追问和工具调用明确分析目标根据分析目标,选择合适的数据库/知识库数据分析知识库沉淀,便于类似需求快速分析数据质量检查,初步分析结果反馈数据可视化呈现、报告生成业务系统、数据库数据分析工具数据可视化工具语义、意图分析小模型等数据分析智能体后端数据/工具数据分析类Agent主要解决的是用户数据分析团队的少量人力与业务多发的数据分析需求之间的矛盾。在这种情况下,部分简易或内部沉淀较多的数据分析需求可交由Agent完成。一方面减轻数据分析团队的工作负载,另一方面快速满足部分业务团队的需求。数据分析类Agent的工作流程查数/取
31、数针对日报、周报和业务提出的偶发数据需求,包括SQL生成根因分析对业务运营过程中的关键因素进行分析,例如门店销售额下降的原因数据可视化将复杂的数据通过可通过可视化的方式呈现,便于理解数据分析结果数据预测基于已知信息,对某一趋势进行数据分析,例如某次活动的GMV预估数据分析类Agent的典型应用场景数据分析:核心在于智能体对数据含义、用户意图和数据结果的理解SwiftAgent多模数据输入多元数据融合让大模型精准理解自然语言的业务含义国产基座大模型更懂用户意图可通过追问、反问等方式引导用户,准确明晰分析目标,减少认知负担贴合用户问题,自动匹配多种分析图表分析过程可解释反馈反思沉淀完整呈现思考过程
32、,自然语言帮助业务人员理解分析过程,提高思考过程的可解释性和可信度用户的问答分析和反馈沉淀到知识库,在类似分析时快速完成分析工作,快速提供结论结构化非结构化业务系统外部数据TableAgentStep1Step2Step3自迭代引擎 Alaya-ZeroX自我迭代所需即所得对话式数据分析完成分析任务的同时,满足生成质量和推理性能的要求多模型组合利用统计科学、因果推断等从数据中挖掘价值数据洞察写代码、调试代码、运行代码,理解数据结果数据分析代码生成理解数据、理解用户的分析需求用户意图理解Alaya-ZeroX数据分析微调模型组T+系统完成专业化微调数据分析智能体对于数据分析智能体而言,智能体首先
33、要能理解数据含义,知道分析的目标。在此基础上,叠加对于用户意图的理解,更好地设定分析目标和规划分析过程。最后,对于数据结果的理解,则是对于数据解读和洞察的考验。Agent指标语义标签语义复杂、多任务的自动理解和规划财税:财税流程自动化升级,领域知识构建财税咨询助手财税类Agent主要解决的是企业内财务与税务流程的自动化、风险识别与防控、以及智能化财税咨询和决策支持等问题。对于监管机构而言,探索财税智能体应用,可以提供更精细化的纳税服务和更便捷的报税体验。财税类Agent的工作流程自然语言交互叠加屏幕感知,实现快速开票的同时,进行发票合规检查开票专家基于海量财税政策和专家数据,结合最新的政策和税
34、法规定,为用户解答财税疑问疑问解答根据纳税人的需求、行为和历史数据快速生成相应的内容建议,帮助各级税务机关提供精细化纳税服务纳税报税大模型结合传统风控模型工具,深度挖掘异常数据,归因分析和趋势分析,进行实时风险监控风险监控智能开票财税咨询风险识别智能办税用户请求用户用户反馈提取历史合同等相关信息财务系统用户意图识别屏幕感知,获取开票信息,实时开票智能体根据反馈进行反思,便于类似优化类似需求回答分析异常数据,实时风险提醒意图分析小模型企业财务知识库企业财务知识库、开票软件、财务系统等财税类智能体后端数据/工具检索最新税法规定,实时解答财税疑问确认意图财税类Agent的典型应用场景财税:数据壁垒、
35、行业Know-how、用户体验三者不可或缺BPai智能财税法咨询 产品形态带来的良好用户体验业务系统接口对接、移动端微信号小程序、PC网页端,多种形态帮助用户快速完成开票、咨询等财税支持 完整技术栈带来的闭环优势通过搭建完整的技术栈,覆盖模型的研发、训练、数据、应用整条价值链,模型的迭代更迅速,同时在用户侧也能形成更好的反馈数据 立足国产化的财税大模型底座基于自有算力、百亿级参数Transformer架构和高质量垂直行业数据,通过专业的预训练、监督微调、奖励模型和强化学习,构建财税大模型底座,实现算力、模型、训练以及工程开发的国产化我的智能助理智友面向实际业务场景,做衔接技术到应用的桥梁降低财
36、税AI使用门槛,做财税工作者的AI好帮手AI开票智能财税法咨询 智能增强识别、识别提取开票信息准确率高达90%高准确度回答 智能学习与自我进化YonGPT大模型平台我的智能助理智友财税实际应用报销流程开票规范智能开票智慧报表审批决策数据分析智友还可以:智能化业务运营:人才发现、经营分析.自然化人机交互:打开应用、知识问答.智慧化知识生成:生成绩效、营销素材语义式应用生成:表单生成、代码生成.营销:深入话术、物料和投放场景,开启产出比竞争用户请求用户用户确认潜在需求查找,提取客户信息等历史信息客户管理用户意图挖掘,营销环境匹配风格化营销物料生成、营销策略推荐话术/物料投放效果评估,投放策略优化私
37、域营销话术挖掘/流程模拟练习企业知识库渠道管理企业物料/话术库营销类智能体后端数据/工具营销类Agent的工作流程营销类Agent主要解决的是在营销场景的潜在需求挖掘、用户画像分析、精准推送、个性化营销策略制定等问题。通过分析用户的历史行为和偏好,营销类Agent能够实时挖掘潜在需求,生成符合用户需求的个性化营销物料,并评估营销策略的效果。借助数据驱动和智能算法,Agent能够动态优化营销投放策略,帮助企业提高营销效率和效果。在这种情况下,智能体可以针对不同平台属性,进行个性化的话术、物料文案生成,同时进行投放环境的模拟和效果评估,以实现该类智能体目前大多设立了话术或物料投放效率面板和分析展示
38、,以更好地展现产出比方面的竞争。1潜在需求挖掘通过同客户管理系统的关联,识别和挖掘潜在需求,并匹配相应话术2用户画像分析通过同后台系统的关联,借助数据分析工具,帮助营销人员更好地了解客户群体和目标市场。3个性化营销物料/文案生成针对不同营销平台,进行风格化营销物料和营销策略生成4营销策略评估对现有营销策略的效果进行评估和分析,识别优化机会营销类Agent的典型应用场景营销:价值在于延长私域和广告的营销链条,提升营销效率应用平台智能平台模型底座大模型自主洞察潜在需求提取营销策略推荐InsightAgent大模型生成对练话术挖掘题库生成CoachAgent大模型运营知识企业级专业知识复杂业务场景K
39、nowledge Copilot大模型自助对话任务流程挖掘流程投产比衡量Virtual Agent容犀大模型应用 Copilot&Agent 系统化的企业解决方案 垂直领域的服务优势 贴近业务的企业级流程体系现阶段的营销类智能体,分别针对私域营销和广告营销。其中私域营销针对客服、私域、销售话术进行了打通。广告营销场景主要针对创意生成、发布和投放进行了联动,提升创意生成效率,简化发布流程和优化投放策略。个性化页面创意生成智能拓词产品目录品牌数据行业数据消费者行为数据历史投放数据广告营销平台一键发布基于企业推广诉求,快速生成符合产品调性和用户需求的创意,并根据历史有效创意进行构思优化可结合企业产品
40、特点和营销目标,帮助企业找到更具性价比的关键词,用更低的出价,锁定企业目标客户,提升页面打开率打开页面呈现内容,精准匹配用户的搜索需求,挖掘隐藏需求,促成更高比例用户留资利欧归一营销领域大模型归一妙计模型管理提示工程模型微调RAG大模型辅助坐席话术推荐流程导航Agent Copilot大模型语义质检会话流程质检质检洞察分析QM Agent垂直类Agent路径二:基于自身业务构建功能型专家智能体行业类Agent多为行业头部企业基于自身业务属性自行构建,以专家智能体的形式,直接为终端用户提供服务。目前,金融、教育、文娱游戏、消费四大行业已率先展开探索,法律和医疗领域也开始初步尝试。专家智能体用户提
41、供服务业务场景业务数据业务知识业务工具业务流程构建行业类Agent服务路径教育文娱游戏消费光语金帆-AI财报点评金融其他行业类Agent图谱腾讯元宝游戏Copilot队友垂直类Agent路径二:多在产品内测和打磨阶段,收费模式尚不清晰由于新技术到实际应用存在一定的周期,行业类Agent目前多在内测打磨或服务备案阶段。产品设计企业进行技术研究,厘清技术能力边界,并根据自身业务属性,选择合适的业务场景构建智能体。内测打磨选择合适的方式和合作机构,进行小范围邀测,根据内测反馈进行进一步的产品打磨。服务备案产品上线前,按照监管规定,完成相应的服务备案。企业内部也涉及安全协议的检查和风险排查。产品上线产
42、品上线是指企业将经过内测打磨的智能体正式推向市场的过程。教育:立足个性化教学和作业辅导,实践“因材施教”教育观念短期AI Agent应用发力点应用探索期产品测试期市场投放期应用成熟期市场应用程度智慧教研个性化学习个性化教学规划情感支撑英语口语辅导作文批改智慧教辅陪伴式助教教学内容推荐学校教育硬件消费级教育硬件编程教学长期AI Agent应用发力点时间知识智能总结教育行业AGI应用成熟度曲线根据5月发布的中国AGI市场发展研究报告 2024,InfoQ研究中心根据AI Agent的介入周期,对成熟度曲线做了分类呈现。目前来看,学习辅导和教学仍然是短期内的重点。长期下,软件层面的演进将会辐射到各类
43、教育硬件的改造。AI Agent 典型探索场景根据学生的学习能力、兴趣、学习进度以及个人目标(长期记忆),定制个性化的学习路径和课程内容个性化教学规划AI Agent作为学生的虚拟学习伴侣,提供情感支持、学习鼓励、知识答疑和互动陪伴,增强学生的学习体验和动机虚拟陪伴助教教育:智能体构建互动式、陪伴式的学习体验智能体群体作战 将教师输入的指令进行拆解和执行,并根据需要分发至学伴智能体。接收学伴智能体上交的习题作业,进行批改、讲评、反馈、并记录下学习数据作学情评估。助教智能体 学伴智能体接收助教智能体下发的学习任务,主动根据学生的学习习惯制定个性化学习计划,并主动跟踪学生的学习进度和质量,还能将习
44、题作业情况及时反馈至助教Agent。学伴智能体以正教育大模型 Agent猿编程AI-Agent基于现状,企业多构建助教或学伴智能体,推进陪伴式学习,或借助教师和多个智能体之间的团队作战,更好地支撑个性化教学和学习辅导。学生猿编程AI-Agent网 络安 全教 育引 导文本对话、语音交流和图像/屏幕交互场景教学,帮助学生高效掌握编程实践启发式教学,疑问实时解答,加深知识理解根据教学进度,推荐学习资源和练习题目应用探索期产品测试期市场投放期应用成熟期市场应用程度智能营销智能客服智能编码智能助手知识库时间行为决策金融行业AGI应用成熟度曲线金融研究报告生成金融分析:如投资研究、数据分析、风险评估等金
45、融:场景集中研报分析、数据分析和营销当前金融智能体应用多以场景提效和业务重塑为主内部场景提效 用户画像与数据分析 财报解读与投研分析 交易策略、市场走势、风险管理等模拟智能分析助手外部业务重塑 营销物料生成 营销话术挖掘 智能电话客服智能营销助手当前金融智能体,多用于研报分析解读、投资组合优化等场景,个性化分析和营销等场景。也有部分厂商正在探索保险核保、高频交易模拟、金融风险管理等其他场景。短期AI Agent应用发力点长期AI Agent应用发力点AI Agent 典型探索场景金融:基于专家智能体载体,推动内部专家工作效率提升智汇、智读、弘小助智汇根据市场上的最新研报,和用户过往关注的行业、
46、市场策略、宏观解读等内容,快速进行核心观点总结智读针对用户选定的特定研报,进行研报信息的解读和观点的验证弘小助整合解读过的关键数据、信息和观点逻辑,结合第三方公开数据源,形成报告输出目前金融行业,受限于行业监管,AI Agent应用多用于内部提效,重点探索场景集中在投研分析和保险部分环节。面从广阔的信息面抽取关键信息线从关键信息中深挖底层逻辑面提炼底层逻辑进行报告输出支小助金融从业专家AI助手财经稿/分析报告撰写量化代码生成公告/研报/财报解读新闻/政策/事件解读资产/市场/行业分析金融知识挖掘(汇集各类金融资讯、财务报告以及上市公司公告等资料)专家分析框架(将专家的方法论、研究思路、工作方法
47、等转化为大模型可理解的形式)多智能体协同机制(模拟人类专家分工合作,对复杂分析任务进行多层拆解、分工协作、综合生成、自我反馈)金融知识库目前,文娱游戏行业对智能体的探索路径有两条。一是通过游戏智能NPC,提供个性化剧情推动或者实时游戏互动,提升娱乐性与参与感;二是立足虚拟世界观(小说、影视剧),借助角色扮演内核满足用户沉浸式体验需求。文娱游戏:立足角色扮演和个性化互动,满足用户沉浸式娱乐需求01给予NPC以一定的自主性,或生成AI队友,都是提升游戏玩家的交互体验,打造更具沉浸式的游戏环境的重要探索。游戏智能NPC,提供沉浸感02将小说、影视剧中的核心角色进行智能体塑造,内化背景、剧情,使得读者
48、/观众在场景外也能同角色交流。自带世界观的角色扮演,延长IP价值链短期AI Agent应用发力点应用探索期产品测试期市场投放期应用成熟期市场应用程度智能NPC行为模拟长期AI Agent应用发力点时间文娱游戏行业AGI应用成熟度曲线虚拟世界生成AI队友个性化剧情引导场景数据分析虚拟主播/虚拟偶像AI辅助创作AI主导的虚拟演出与影视制作沉浸式硬件个性化内容推荐情感陪伴AI Agent 典型探索场景无论是路径一还是路径二,核心都是要为用户提供足够的情绪价值和情感链接。文娱游戏:提供情绪价值和情感链接是核心价值角色体验剧情互动角色COS长相思角色AI一个月内达到3亿互动热度相柳智能体对话热度突破2亿
49、多种创新玩法听指挥会配合能闲聊上线永劫无间情绪价值满格游戏Copilot队友新手教学引导:让呆板的人机化身新手教学大师,引导玩家更快速地熟悉游戏操作自由游戏操作:自主跑图、战斗、听指令、报战况、自由语音对话,成为配合度高的队友队友人设建立:可根据不同的游戏情境展现出独特的性格特点,进一步增强游戏的沉浸感和互动体验角色模型台本对话剧情摘要关系图谱对话形象音色影视剧IP角色智能体挖掘角色内心世界承接观众对影视剧、角色、演员的情感智能体专区消费:商家和消费者两端并行,智能体全面优化服务链路在消费行业,消费者端和商家端的探索正在并行发展。对于消费者端,购物助手和智能客服已成为AI持续进化的典型应用,而
50、智能体的加入使基于长期记忆的个性化服务成为现实。商家端,通过多Agent组建的专业商家团队,智能体能够协同完成数据分析、用户调研、运营管理等多项复杂任务,大幅提升商家的运营效率与决策能力。基于用户意图的智能导购:通过自然语言/语音进行意图识别,对话交互减少菜单操作For 消费者端即时响应、灵活解答的智能客服:查询产品说明、初步故障排查等疑问均可即时响应伴随长期记忆的个性化服务:智能体将用户的历史行为和偏好内化,提供个性化的服务商家知识助理:为商家提供最新的进驻商城的规则条款、营销活动的内容和规则等For 商家端商家经营助手:将数据分析师、用户调研专家等角色抽象成为智能体,完成日常经营团队组建多
51、Agent团队协作:通过商家经营智能体团队组建,让智能体也能专体做专事应用探索期产品测试期市场投放期应用成熟期市场应用程度智能客服零售消费行业AGI应用成熟度曲线门店数据分析营销物料生成私域营销基于Agent的智能投放数字人导购/主播智能推荐个性化营销AI商拍供应链管理基于Agent的平台商家助手短期AI Agent应用发力点长期AI Agent应用发力点AI Agent 典型探索场景消费:电商平台先行,智能体组建专业商家团队,优化用户消费决策商家智能助手商家Master Agent数据分析专家用户研究专家广告营销专家产品专家技能工具技能工具技能工具技能工具技能工具技能工具技能工具技能工具自然
52、语言下达指令业务系统知识库数据平台用户意图理解任务规划与分配结果整合,用户反馈多Agent组建专业商家团队小值用户消费决策的私人助理用户营业额分析活动运营产品上架订单管理小值自然 语言下达 指令判断用户使用意图口碑总结优选值得买内容库中超2.5亿条实时有效的优质消费内容,总结商品的真实优缺点商品对比基于值得买内容库,通过参数及评价等比对,帮助消费者挑选更适合的产品商品推荐内置自研意图识别模型,引入多轮对话系统,帮助“选择困难症”梳理需求、精准推荐全网比价基于商品库中覆盖全平台的优质高销商品,进行实时价格比对,找到全网最“值”好价AI Agent 市场未来趋势趋势一:以大语言模型为大脑构建的智能
53、体,逐渐深入复杂任务大脑的智能水平仍需要提升,才能更好且独立地承担任务拆解和规划的工作,同时也具备更好的上下文理解能力大模型逻辑推理能力的提升工具生态的完善,决定了智能体能够向外拓展的边界,一个成熟的工具生态系统可以提供必要的接口和功能,使智能体能够访问和操作外部资源工具生态的完善多智能体协作完成复杂任务的能力,同时利用多智能体协同,更好地优化自身的表现,逐步提升其执行复杂任务的能力多智能体协同通过多模态输入,智能体可以实现业务系统、复杂任务,乃至物理世界更深入、更全面的理解,并提供更智能化的服务和支持复杂环境的理解力AI Agent仍需再进化大模型大脑工具生态多智能体协同复杂场景伴随着AI
54、Agent各能力板块的进一步提升,在可以预见的未来,AI智能体将能够承担更加复杂和多样化的任务,从简单的工具逐渐演变为具备决策能力的智能助手,深入各行各业的核心业务流程。趋势二:手机、电脑智能体初现端倪,带来流量和应用生态的变革家居IOT设备AI智能手机电脑汽车人型机器人交互层框架层APP AgentUFOOS CopilotScreen AgentCradleMobile AgentAPP及其生态的解构部分APP可能会解构成更小的颗粒度的服务,通过智能体编排调度。在这种情况下App开发商可能从应用开发者转变为服务提供商,为智能体开发服务接口。02流量入口的变革用户下达指令后,智能体将决定调用
55、哪些APP,并帮助用户执行App间的复杂交互,减少用户在不同App间切换的需要。01短期内,以手机和电脑智能体为代表的终端智能体,将从操作系统层面开始探索,逐步整合现有的应用程序和服务,提供更加无缝和直观的用户交互体验。最终,终端智能体会带来APP及其生态的解构,届时APP将不再是用户获取服务的唯一入口。智能体将使得服务更加模块化和个性化,用户可以直接通过语音或文本命令,让智能体在后台调用和协调不同的服务组件,实现复杂的任务。除了手机、电脑外,家居IOT设备、汽车智能座舱等也将开始探索智能体模式。使用习惯应用调用智能搜索多模交互智能控制45专家致谢(按姓氏首字母排序)感谢各位专家为报告编制工作
56、提供的宝贵建议!董 大 祥千帆AppBuilder总架构师,百度 主任研发架构师方 高 林用友网络 助理总裁兼iuap智能平台部 总经理辜 斯 缪百度 搜索策略首席架构师韩艾京东集团 算法总监孔淼容联云 产业云VP及诸葛智能创始人李飞数势科技 AI 负责人刘 红 杰腾讯元器 产品专家杨蜀深圳标普云科技 创始人&董事长邹 盼 湘彩讯股份 AI产研中心总经理46报告预告InfoQ 研究中心也将继续关注大模型及AIGC领域的应用和产品进展,也欢迎各位行业内的专家就本报告的内容进行交流和讨论,共同助力中国大模型和AIGC领域的发展。中国软件技术发展洞察和趋势预测报告l 2024年技术领域发生了哪些大事
57、件?l 资金都流向了哪些领域?l 热门技术领域在2024年发展情况如何?l 2025年十大技术趋势是什么2025内容咨询:商务合作:InfoQ 研究中心隶属于极客邦科技双数研究院,秉承客观、深度的内容原则,追求研究扎实、观点鲜明、生态互动的目标,聚焦创新技术与科技行业,围绕数字经济观察、数字人才发展进行研究。InfoQ 研究中心主要聚焦在前沿科技领域、数字化产业应用和数字人才三方面,旨在加速创新技术的孵化、落地与传播,服务相关产业与更广阔的市场、投资机构,C-level 人士、架构师/高阶工程师等行业观察者,为全行业架设沟通与理解的桥梁,跨越从认知到决策的信息鸿沟。p 市场份额追踪p 细分市场
58、分析p 市场规模预测p 市场分析模型输出p 用户规模评估p 用户认知分析p 用户决策分析p 用户行为分析p 技术需求洞察p 技术实践分析p 应用规划建议p 发展趋势研判技术市场趋势洞察技术市场用户分析数字化实践趋势分析极客邦科技,以“推动数字人才全面发展”为己任,致力于为技术从业者提供全面的、高质量的资讯、课程、会议、培训等服务。极客邦科技的核心是独特的专家网络和优质内容生产体系,为企业、个人提供其成功所必需的技能和思想。极客邦科技自 2007 年开展业务至今,已建设线上全球软件开发知识与创新社区 InfoQ,发起并成立技术领导者社区 TGO 鲲鹏会,连续多年举办业界知名技术峰会(如 QCon
59、、ArchSummit 等),自主研发数字人才在线学习产品极客时间 App,以及企业级一站式数字技术学习 SaaS 平台,在技术人群、科技驱动型企业、数字化产业当中具有广泛的影响力。2022年成立双数研究院,专注于数字经济观察与数字人才发展研究,原创发布了数字人才粮仓模型,以此核心整合极客邦科技专业的优质资源,通过 KaaS模式助力数字人才系统化学习进阶,以及企业数字人才体系搭建。公司业务遍布中国大陆主要城市、港澳台地区,以及美国硅谷等。十余年间已经为全球千万技术人,数万家企业提供服务。洞察技术创新趋势,推动数字化商业升级内容咨询:商务合作:InfoQ 公众号AI前线 公众号InfoQ 视频号