《2025年AI Agent模型层、中间层、应用层发展现状及商业化进程分析报告(35页).pdf》由会员分享,可在线阅读,更多相关《2025年AI Agent模型层、中间层、应用层发展现状及商业化进程分析报告(35页).pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、2 0 2 5 年深度行业分析研究报告 一、AI发展阶段:从推理者转向智能体,开始学会调用工具 目 录 二、Agent模型层:底座智能水平提升,推理能力成为核心 三、Agent中间层:中间工具厚积薄发,开发者生态积极构建 四、Agent应用层:初代产品创收加速,商业化应用曙光乍现 五、相关标的及风险提示 2 模型多维能力持续提升,AI从推理者转向智能体。根据OpenAI对AI发展的理解和定义,AI水平可分为五大等级:一是聊天机器人(Chatbot),能够用自然语言进行对话;二是推理者,基于推理模型,解决人类级别的智力问题;三是智能体(Agent),能够代表用户采取行动;四是创新者;五是组织。过
2、去,在ChatGPT等聊天机器人产品推出时,大模型通常采取一次性推理,用户与聊天机器人的交互形式呈现为简单的一问一答。而在推理模型的不断发展之下,AI模型逐渐能够与自己对话,实现内部思考,具备推理能力。当前,随着大模型在交互/认知/泛化/自主等多维度能力持续提升,AI正从推理者转向智能体,逐步具备采取行动及处理任务的能力,智能体产品加速推进。1.1 AI等级:AI发展水平划为五大等级,当前正从推理者转向智能体 AI发展水平划分为五大等级 资料来源:Bloomberg reporting,OpenAI,西南证券整理 聊天机器人 聊天机器人 推理者 推理者 智能体 智能体 创新者 创新者 组织 组
3、织 具备语言对话能力的人工智能具备语言对话能力的人工智能 具备解决人类水平问题的能力具备解决人类水平问题的能力 能够采取行动的系统能够采取行动的系统 能够帮助发明创新的人工智能能够帮助发明创新的人工智能 能够完成组织工作的人工智能能够完成组织工作的人工智能AI等级 AI等级 交互能力 交互能力 认知能力 认知能力 泛化能力 泛化能力 多领域泛化 多领域泛化 处理事实 处理事实 简单式一问一答 简单式一问一答 自主能力 自主能力 依赖人类指令按步骤执行命令 依赖人类指令按步骤执行命令 3 系统中协同运作 系统中协同运作 上下文深入交流 上下文深入交流 环境中动态交互 环境中动态交互 创新性思考
4、创新性思考 链式推理 链式推理 局限于特定领域任务 局限于特定领域任务 跨领域整合 跨领域整合 设定目标自主完成复杂任务 设定目标自主完成复杂任务 定义 定义 用户:给出任务目标用户:给出任务目标 AI:通过使用工具并进行规划,直接完成任务,甚至具备修正能力AI:通过使用工具并进行规划,直接完成任务,甚至具备修正能力 用户:给出明显指令用户:给出明显指令 AI:具备一定的理解力和工具使用能力,但仍需用户逐步确认AI:具备一定的理解力和工具使用能力,但仍需用户逐步确认 用户:给出明确且具体的每一步指令用户:给出明确且具体的每一步指令 AI:根据一个指令产生一个动作AI:根据一个指令产生一个动作4
5、 AI产品目前处于中间过渡形态,智能体有望革新交互效率。过去,传统聊天机器人只能执行明确指令,用户需要逐次下达任务指令,AI模型根据一个指令进行一个动作;当前,中间形态的AI产品已初步具备目标理解和推理能力,可以根据用户的模糊需求主动采取一部分行动,但仍然需要依赖用户反馈进行下一步操作;未来,真正的AI智能体将能够根据最终目标自主规划任务步骤、调用多种工具、识别错误并给出修正策略,具备完成任务的能力。用户与不同AI产品形态的互动以及第一轮交互结果示例 我上传了一份 Excel,我上传了一份 Excel,帮我分析一下里面的数据有什么趋势或异常?帮我分析一下里面的数据有什么趋势或异常?你想分析哪一
6、列数据?你想分析哪一列数据?趋势是指增长吗?异常趋势是指增长吗?异常是指什么?是指什么?资料来源:西南证券 我上传了一份 Excel,我上传了一份 Excel,帮我分析一下里面的数据有什么趋势或异常?帮我分析一下里面的数据有什么趋势或异常?我上传了一份 Excel,我上传了一份 Excel,帮我分析一下里面的数据有什么趋势或异常?帮我分析一下里面的数据有什么趋势或异常?我已做出基础统计和可我已做出基础统计和可视化图表,你需要继续视化图表,你需要继续深入哪个部分吗?深入哪个部分吗?我已检查和分析数据、生成多种图表和文字总我已检查和分析数据、生成多种图表和文字总结。但是可能异常值过多,需要帮你进一
7、步清结。但是可能异常值过多,需要帮你进一步清洗数据吗?洗数据吗?用户与传统聊天机器人的交互结果 用户与传统聊天机器人的交互结果 用户与推理者产品的交互结果 用户与推理者产品的交互结果 用户与智能体产品的交互结果 用户与智能体产品的交互结果 1.1 AI等级:AI发展水平划为五大等级,当前正从推理者转向智能体 1.2 Agent等级:初阶能够使用工具,高阶可自主完成长时任务 智能体(Agent)=大模型(LLM)+记忆(Memory)+主动规划(Planning)+工具使用(Tool use)。大模型:在基于LLM的智能体中,LLM充当智能体的大脑。主动规划:可以将大型任务分解为子任务,并规划执
8、行任务的流程,同时能够对任务执行的过程进行思考和反思,从而决定是继续执行任务,或判断任务完结并终止运行。记忆:短期记忆指在执行任务的过程中的上下文,会在子任务的执行过程产生和暂存,在任务完结后被清空;长期记忆即可以长时间保留的信息,一般指外部知识库,可用向量数据库存储或检索。工具使用:为智能体配备工具API,如计算器/搜索工具/代码执行器/数据库查询工具等,从而与物理世界实现交互,解决实际问题。智能体公式:Agent=LLM+Memory+Planning+Tool use 资料来源:OpenAI官网,西南证券整理 5 自主决策能力是基础,解决长时任务是关键。根据智能体“推理+记忆+使用工具+
9、规划”的四大核心能力来看,截至目前,聊天机器人产品逐步具备推理能力,副驾驶和工具型助手可以建立外部记忆,但仍然不具备使用工具和自主规划的能力,只能根据用户指令按步骤执行,不属于能够自主决策的智能体。根据CBInsights研究,具备一定自主决策能力的智能体可分为两大等级。1)初级Agent:AI模型可以通过编排组合,把重复性高、需要一定灵活性的任务从人替换成数字员工,实现任务的自动化,在该阶段,Agent尚不具备完全开放的决策空间,自主决策范围主要局限于任务流程和有限选项之中,决策行为将受到安全条件、访问权限等限制,是有限决策的智能体。2)高级Agent:智能体不只是LLM calling的组
10、合,而是能够更自主、更主动地规划,完成多步骤、长时任务,可以在多个选项之间做出自主选择,不需要人工指示,实现高度自治。根据自主化程度划分AI Agent等级 聊天机器人 聊天机器人 副驾驶助手 副驾驶助手 受限制的智能体 受限制的智能体 完全自主代理 完全自主代理 自主性扩展 自主性扩展 Chatbots Copilots&Asssistants Agents with guardrails Fully autonomous agents Chatbots Copilots&Asssistants Agents with guardrails Fully autonomous agents 推
11、理能力推理能力 外部记忆外部记忆 使用工具使用工具 自主规划自主规划 推理能力推理能力 外部记忆外部记忆 使用工具使用工具 自主规划自主规划 推理能力推理能力 外部记忆外部记忆 使用工具使用工具 自主规划自主规划 推理能力推理能力 外部记忆外部记忆 使用工具使用工具 自主规划Agent四大自主规划Agent四大核心能力 核心能力 资料来源:CBInsights,西南证券整理 拥有一定程度的自主决策能力的AI Agents 拥有一定程度的自主决策能力的AI Agents 6 1.2 Agent等级:初阶能够使用工具,高阶可自主完成长时任务 资料来源:西南证券 1.3 AI产业链:AI Infra
12、奏响主旋律,AI Agent拉开新画布 7 AI Infra:核心算力、半导体产业链、硬件设备、电力能源为AI大模型的训练与推理奠定硬件基础。AI Agent:B端软件、C端应用、端侧AI及具身智能等环节在Agent应用上蓄势待发。AI产业链示意图 8 1.3 Agent产业链:智能体基建厚积薄发,商业化应用曙光乍现 资料来源:Z Research,西南证券整理 AI Agent产业链示意图 模型层 模型层 预训练 预训练(Pre-Train)(Pre-Train)Transformer架构下的scaling law 算力 算力 算法 算法 数据 数据 微调 微调(Fine-Tuning)(F
13、ine-Tuning)参数高效微调PEFT监督微调SFT等强化学习 强化学习(Reinforce Learning)(Reinforce Learning)奖励建模偏好优化算法等推理增强 推理增强(inference enhancement)(inference enhancement)思维连CoT优化检索增强生成RAG等 模型层:Agent本质是大模型能力的工程化载体,大模型智能水平仍是打造Agent的底层支撑,未来依旧需要通过预训练、后训练和测试时计算进行扩展。中间层:Agent产业链的中间层工具正加速构建,数据库、身份治理、通信协作等成为重要议题。应用层:Agent应用形态随着以上底层大
14、模型和中间原生基础设施的发展逐步从构想更加贴近现实。中间层中间层 数据层 数据层(Data Layer)(Data Layer)数据治理:数据治理:管理结构化/非结构化数据,提供高精度标注服务数据分析:数据分析:通过AI工具强化数据分析,表现为LLM驱动下更强的BI能力,数据分析门槛与难度降低模型工具链 模型工具链(MLOps)(MLOps)模型管理:模型管理:提供模型全生命周期管理,支持从训练到监控的自动化流水线自动化工具:自动化工具:超参数调优工具、托管成百上千个预训练模型平台等应用层应用层 副驾驶 副驾驶 (AI Copilot)(AI Copilot)增强人类能力的智能辅助系统 媒体应
15、用 媒体应用(AI Media)(AI Media)通过AI技术实现内容生产、传播优化、互动增强的下一代媒体形态,覆盖游戏/社交/广告等 智能体 智能体 (AI Agent)(AI Agent)自主决策+环境交互+目标驱动 1.3 Agent产业链:智能体基建厚积薄发,商业化应用曙光乍现 基础设施加速发展推动新应用诞生,新应用积极引导基础设施下一步健全方向。智能体生态正在经历波浪式发展进程,每一波创新应用的诞生,都会带动基础设施的迭代升级,底层技术的进步又会进一步催生出更智能的应用,如OpenAI的GPT系列(从GPT-1到GPT-4)和o系列(从o1到o3)模型、Anthropic的Clau
16、de模型(Sonnet-3迭代至3.7)、谷歌Gemini模型(从1.5Pro迭代至2.5Pro)。智能体中间层则陆续出现LangChain、Tool Calling、MCP和A2A等工具;应用层相继出现Cursor、Claude Desktop、OpenAI Operator等。新应用对基础设施提出更复杂的需求,基础设施的进步又将反哺新的智能体应用,两者相互塑造、共同演进,加速AI的商业化落地。应用层应用层 2021年2月 Glean2021年2月 Glean2022年11月 ChatGPT2022年11月 ChatGPT2023年1月 Cursor2023年1月 Cursor2023年2月
17、 RunwayML 2023年2月 RunwayML 中间层中间层 2022年10月 LangChain2022年10月 LangChain2022年11月 Llamalndex2022年11月 Llamalndex2023年6月 LLM Tool Calling2023年6月 LLM Tool Calling2023年10月 Modal Labs2023年10月 Modal Labs模型层模型层 2023年3月 GPT-4 2023年3月 GPT-4 2024年2月 Gemini 1.5 Pro2024年2月 Gemini 1.5 Pro2024年3月 Claude Sonnet 32024
18、年3月 Claude Sonnet 3应用层应用层 2024年1月 Custom GPTs2024年1月 Custom GPTs2024年10月 Claude Desktop2024年10月 Claude Desktop2024年10月 Bolt.new2024年10月 Bolt.new应用层应用层 2024年10月 Claude Computer Use2024年10月 Claude Computer Use2024年11月 Cline2024年11月 Cline2025年1月 OpenAl Operator2025年1月 OpenAl Operator2025年3月 Manus.Al202
19、5年3月 Manus.Al应用层应用层未来关注:未来关注:电商电商旅行规划旅行规划生产力生产力营销等营销等中间层中间层 2024年1月 LangGraph2024年1月 LangGraph2024年6月 BrowserBase2024年6月 BrowserBase2024年11月 MCP(Model2024年11月 MCP(ModelContext Protocol)Context Protocol)模型层模型层 2024年4月 Llama 32024年4月 Llama 32024年6月 Claude Sonnet 3.5 2024年6月 Claude Sonnet 3.5 2024年9月 O
20、penAI o12024年9月 OpenAI o1中间层中间层 2025年3月 Cisco ACP2025年3月 Cisco ACP2025年4月 Google A2A2025年4月 Google A2A2024年11月-2025年3月2024年11月-2025年3月MCP Server大量涌现MCP Server大量涌现模型层模型层 2025年1月 DeepSeek-R12025年1月 DeepSeek-R12025年2月 Claude Sonnet 3.72025年2月 Claude Sonnet 3.72025年3月 Gemini 2.5 Pro2025年3月 Gemini 2.5 Pr
21、o2025年4月 Llama 42025年4月 Llama 42025年4月 OpenAI o32025年4月 OpenAI o3中间层中间层未来关注:未来关注:安全集成安全集成MCP发现与信任MCP发现与信任模型层模型层未来关注:未来关注:OpenAI GPT 5 OpenAI GPT 5 Llama 4 BehemothLlama 4 Behemoth资料来源:Madrona,西南证券整理 Agent基础设施建设与应用协同演进 9 本报告来源于三个皮匠报告站(),由用户Id:879635下载,文档Id:630730,下载日期:2025-04-27 一、AI发展阶段:从推理者转向智能体,开始
22、学会调用工具 目 录 二、Agent模型层:底座智能水平提升,推理能力成为核心 三、Agent中间层:中间工具厚积薄发,开发者生态积极构建 四、Agent应用层:初代产品加速创收,商业化应用曙光乍现 五、相关标的及风险提示 10 11 GPT-1:1.17亿参数;有一定的泛化能力 GPT-2:15亿参数;生成能力提升 GPT-3:1750亿参数;可完成大多数NLP任务GPT-3.5(Chat GPT):约1750亿参数,强大的理解能力GPT-4:万亿参数;数据源扩充;增加训练后处理和行为预测 GPT-4V:具备视觉能力 GPT-4-Turbo:多模态能力提升;上下文更长、价格更低、性能更高 预
23、训练扩展阶段 预训练扩展阶段 后训练扩展阶段 后训练扩展阶段 测试时扩展阶段 测试时扩展阶段 2018.062018.06 2019.02 2019.02 2020.05 2020.05 2022.11 2022.11 2023.03 2023.03 2023.09 2023.09 2023.11 2023.11 2024.05 2024.05 2024.09 2024.09 2024.12 2024.12 2025.01 2025.01 2025.02 2025.02 2025.04 2025.04 GPT-4o:能够同时处理多种输入类型,提升响应速度和性能 OpenAI-o1模型完整版向用
24、户开放;下一代推理模型OpenAI-o3预览 OpenAI-o1推理模型预览版亮相OpenAI-o3-mini模型发布GPT4.5:截至目前最大LLM模型,世界知识丰富,情商更高 GPT-4.1:能够处理复杂任务的模型 资料来源:OpenAI官网,西南证券整理 OpenAI旗下模型迭代进程梳理 扩展法则迎来范式转变,推理模型迭代节奏加速。从OpenAI旗下AI模型迭代进程来看:2018年6月至2023年3月预训练扩展阶段:OpenAI大模型预训练快速推进,在五年内从GPT-1迭代至GPT-4模型,模型基础能力2023年3月之后,预训练扩展进程逐渐放缓,截至目前仍未推出下一代预训练大模型GPT-
25、5。2023年下半年至2024年5月后训练扩展阶段:基于微调技术开始打磨多模态、上下文等能力,提升特定指标性能。2024年9月至今测试时扩展阶段:2024年9月OpenAI-o1模型预览版亮相,标志正式进入推理模型时代;2025年4月17日,OpenAI推出完整版o3模型和o4-mini模型,截至目前,半年内已迭代多次,测试时扩展正加速发展。OpenAI-o3&o4mini模型发布 2.1 AI模型扩展法则:扩展法则迎来范式转变,主次扩展曲线逐步切换 AI三大扩展法则对比 资料来源:英伟达CES大会,西南证券整理 规模法则从训练阶段延伸至推理阶段,推动计算需求持续提升。预训练法则和后训练法则均
26、与模型的训练阶段有关,而测试时扩展法则与推理阶段有关,深度推理有望对算力需求进一步增加。预训练扩展法则(Pre-training Scaling Law):关注计算资源、模型大小和训练数据三大要素,当三要素同时增加时,模型性能将同步提升,打造优质基座模型。后训练扩展法则(Post-training Scaling Law):关注在预训练完成后对模型的进一步优化和微调,可以针对特定任务进行改进,从而提升模型在特定领域的性能,有助于打造垂类模型。测试时扩展法则(Test-time Scaling Law):针对在模型的实际推理或应用中,根据问题的复杂程度实时分配计算资源,面对复杂问题能够进行分步骤
27、、多阶段推理,在多个解法中寻求最优解。定义指在训练过程中,通过增加训练数据、模型参数和计算资源来提升模型能力。模型在预训练阶段需要通过大量数据进行训练、学习基础知识。指在预训练之后,利用强化学习、人工反馈等技术对模型进行进一步优化,后训练通常涉及对模型的精细化调整,提高在特定任务上的表现。指在模型的实际应用中,模型根据需要动态分配计算资源来提升推理效率,更加关注模型如何在实时推理时优化自身的计算策略。特点 主要依赖大量的数据(多模态数据,如文本、图像、视频等)和计算资源。模型通过大规模数据集进行自我学习,获取广泛的知识。是训练过程中的初步阶段,主要帮助模型建立基座能力。在模型初步训练完成后,使
28、用人类反馈或强化学习的方式帮助模型在特定任务上改进。强调通过模拟“自我提升”的方式逐步提升模型能力(如通过解决复杂的数学问题等)。可以看作是“训练后的进步”或“微调”过程,帮助模型在特定领域变得更精通。重点是在实际使用中,通过调整计算资源的分配来提升决策过程的质量。模型可以在推理时进行“深度思考”,将问题拆解成多个步骤,逐步推理或产生多个解法,评估最优解。强调推理过程中的灵活性和高效性,目的是在实时环境中产生高质量的结果。模型OpenAI GPT系列模型:GPT-1至GPT-4GPT-4 turboOpenAI-o1至o3系列模型名称预训练扩展法则(Pre-training Scaling L
29、aw)后训练扩展法则(Post-training Scaling Law)测试时扩展法则(Test-time Scaling Law)阶段训练(training)阶段的scaling law训练(training)阶段的scaling law推理(reasoning)阶段的scaling law2.1 AI模型扩展法则:扩展法则迎来范式转变,主次扩展曲线逐步切换 12 模型性能提升路径持续探索,主次增长曲线发生转变。2020年1月和2022年3月,OpenAI和谷歌先后发布论文Scaling Laws for Neural Language Models和Training Compute-Op
30、timalLarge Language Models,两者认为预训练阶段的扩展法则是提升大语言模型性能的有效路径。2024年8月谷歌发表论文Scaling LLM Test-Time Compute Optimally can be More Effectivethan Scaling Model Parameters,提出在测试时对大语言模型的计算进行最优扩展,可能比扩展模型参数来提升模型性能更有效。根据英伟达CES大会信息,除预训练和后训练扩展法则之外,测试时扩展法则同样推动算力需求持续增长,以OpenAI-o系列模型为代表的推理模型通过测试时计算,带动推理算力高增,Scaling Law
31、持续有效。随着模型性能提升曲线从训练扩展转向推理扩展,投资方向也随之向推理侧转变。资料来源:英伟达CES大会,西南证券整理 资料来源:英伟达CES大会,西南证券整理 英伟达:扩展法则从一个扩展至三个 英伟达:扩展法则推动算力需求提升 2.1 AI模型扩展法则:扩展法则迎来范式转变,主次扩展曲线逐步切换 13 资料来源:OpenAI Scaling Laws for Neural Language Models,西南证券整理 算力决定Transformer模型性能上限,模型参数与训练数据比例影响模型最佳性能。根据OpenAI和Google相关研究,模型性能随着模型参数大小、训练数据集大小、计算量
32、的增加而提高。对于基于Transformer架构的大语言模型,模型性能三要素的关系为C6N*D,其中,N代表模型参数规模,D代表预训练数据集大小;C代表预训练算力资源。大语言模型若要获得最佳性能,需同时扩展三大要素。当其中一个因素受限时,模型的智能表现可以随着另外两个因素的增加而变好,但边际效应会逐步递减。在给定预训练计算量的情况下,可以确定最佳的参数量和数据集之比,从而确定模型的最佳能力。因此,在总计算量越多的情况下,模型能力的上限会越高。然而当前模型参数量与数据量的扩展比例尚存争议,OpenAI在论文中指出模型参数规模比数据集大小更重要,两者比例在0.73:0.27时计算效率最优;谷歌论文
33、则认为模型参数和数据大小同等重要,随着预训练计算资源的增加,模型参数量和训练数据量应该等比例增长。预训练扩展法则“算力+数据+模型”三要素 2.2 预训练扩展:三要素影响模型性能,高质量数据成为瓶颈 14 15 GPT-1 GPT-2 GPT-3 GPT-4 相相似的似的模模型架型架构 构 亿级:1.17 亿参数十亿级:15亿参数 千亿级:1750亿参数 万亿级:17600亿参数 模型模型参参数量数量不断不断增增加 加 OpenAI GPT系列模型参数规模持续增长 GPT-1 GPT-2 GPT-3 GPT-4 相相似的似的模型模型架架构 构 4.8 GB(unfiltered)data 40
34、 GB human-filtered data 570 GB data filtered from 45TB raw data Human demonstrations and annotations 数数据规据规模、模、质质量不量不断增断增长 长 OpenAI GPT系列模型训练数据持续增长 OpenAI GPT系列模型持续扩展,高质量语料成为瓶颈。近年来,OpenAI GPT系列模型实现快速扩展,从2018年的GPT-1到2020年的GPT-3,模型参数量从1.17亿增长至1750亿,数据量从4.8GB增加至570GB,数据质量从原始数据提升至过滤后的高质量数据。2023年3月,GPT-4
35、模型再次实现扩展,参数量达到万亿级别,数据规模和质量进一步提升,模型性能实现再次跃升。然而GPT-4发布至今,已将近两年,OpenAI仍未发布下一代GPT模型。由于模型能力的指数级增长离不开算力和数据资源的同步增加,目前OpenAI可能遇到数据增长跟不上模型性能提升诉求的问题,因此OpenAI在寻求更多预训练数据的同时,逐步转向结合Re-train、Post-train和Test-timecompute,或研究更高效的模型架构等方式,以解决数据瓶颈导致模型性能提升放缓的挑战。资料来源:OpenAI官网,西南证券整理 资料来源:OpenAI官网,西南证券整理 2.2 预训练扩展:三要素影响模型性
36、能,高质量数据成为瓶颈 16 2.3 后训练扩展:微调技术持续创新,打造模型特定性格 资料来源:OpenAI官网,西南证券整理 后训练扩展:在后训练期间不断自我改进,强化特定任务能力。后训练是在预训练之后,通过使用人工反馈、强化学习等方法来进一步提升模型响应能力。在后训练阶段,模型通常会根据反馈机制进行微调,相较于预训练阶段的全数据集训练,后训练的计算需求较低,不需要在庞大的训练样本上迭代,而是基于模型已经学习到的知识进行微调,根据反馈在后训练期间不断进行自我改进,选择性地对某些任务或场景实现强化。微调技术持续创新:OpenAI于2024年12月发布会推出o1强化微调、偏好微调等技术。1)强化
37、微调(Reinforcement Fine-Tuning):通过结合强化学习和监督微调,针对特定领域打造专家模型。在强化微调技术下,开发人员只需利用少量训练数据即可创建特定领域的专家模型,通过使用几十到几千个高质量数据,模型能够通过强化学习自行探索和学习如何推理复杂任务。2)偏好微调(Preference Fine-Tuning):通过使用直接偏好优化(DPO)来比较模型响应对,教会模型区分偏好和非偏好输出,有助于在语气、风格和创造性等主观任务上尤为有效。监督微调/强化微调/偏好微调方法对比 特点监督微调强化微调偏好微调定义在已经预训练的模型基础上,使用标注好的数据集进行进一步的训练。模型通过
38、输入-输出对的方式学习,从而调整权重和参数。通过强化学习方法对预训练模型进行进一步训练。在强化微调中,模型与环境互动,基于执行的动作获得奖励或惩罚。在预训练的基础上,通过用户反馈、偏好评分、针对性的主观反馈来优化模型,使其符合特定的偏好或需求。训练数据标注数据(输入-输出对)环境交互和人类反馈(奖励信号)人类偏好反馈(选择/评分/建议等)优化技术监督学习,通过最小化预测误差优化强化学习,通过奖励优化行为基于人类反馈/选择或评分/偏好反馈优化输出,符合用户需求目标提高模型在特定任务上的准确性优化模型行为,便其适应复杂环境优化模型输出,便其符合用户的个性化需求应用场景分类任务、生成任务、回归任务、
39、情题分析、机器翻译等任务对话系统、游戏AI、对话系统个性化对话系统、个性化推荐等 打造模型特定性格,丰富垂类交互体验。在预训练环节,模型主要针对基础能力进行提升;而在后训练环节,模型专注打造自身特点和性格。根据OpenAI Day-2发布会,OpenAI通过演示生物医学微调模型案例,微调出o1-mini finetune模型,用于分析发病症状、鉴定基因,最终微调后的o1-mini模型得分提高80%,超越o1正式版,在生物医学方面专业性能提升明显,垂类模型应用前景广阔,B端科研领域有望受益。目前,OpenAI的强化微调技术已对企业、大学和研究院开放申请测试通道,并将于2025年春季作为产品发布并
40、向用户开放。在OpenAI内部测试中,强化微调技术已在生物化学、安全、法律、医疗保健领域取得成功,未来有望助力泛科研实现突破性进展。此外,随着后训练技术的持续发展,垂类模型的打造有望更加专业和精细,也将要求产品经理能够更准确地理解AI产品特性,提升模型的后训练效率,实现用户与垂类模型的交互体验升级。17 资料来源:OpenAI官网,西南证券整理 资料来源:OpenAI官网,西南证券整理 OpenAI o1强化微调后专业性能提升 OpenAI利用强化微调技术创建模型 2.3 后训练扩展:微调技术持续创新,打造模型特定性格 OpenAI-o1模型性能随测试时计算实现性能提升 资料来源:OpenAI
41、官网,西南证券整理 2.4 测试时扩展:模型实现深度推理,Agent落地未来可期 大模型推理能力持续提升,奠定智能体规划能力基础。在数据瓶颈挑战下,大模型厂商从训练扩展转向测试时计算,打造AI新扩展曲线。在此背景下,OpenAI推出推理模型,于2024年9月公开介绍OpenAI-o1模型;2025年12月向用户开放完整版o1模型,并预告下一代OpenAI-o3模型;2025年4月推出完整版o3模型。在o系列推理模型中,OpenAI引入测试时计算(Test-timecompute),使模型能够根据用户提问调节思考行为、分配计算资源、优化输出结果、提升模型性能。2024年9月,OpenAI-o1推
42、理模型的推出标志着测试时Scaling Law开启;2025年4月,OpenAI-o3模型公开信息表示Scaling Law持续,AI模型仍在继续扩展Train-time和Test-time,o3模型的训练计算量是o1的10倍,其中,RL范式中的算法优化进一步推动模型性能提升。资料来源:OpenAI官网,西南证券整理 OpenAI-o3模型随强化学习扩展实现性能提升 测试时计算 测试时计算 训练时间计算 训练时间计算 18 19 2.5 AI模型扩展循环:智能水平仍需提升,大模型扩展持续进行 预训练奠定模型内部智能上限,后训练及测试时扩展释放智能潜力。未来值得关注的大模型:Meta Llama
43、-4模型:2025年4月5日,Meta推出Llama-4系列模型,其中,小模型Scout和中模型Maverick目前已对外发布,大模型Behemoth仍在训练中。根据Meta公布,大模型Llama-4-Behemoth总参数接近2万亿,将成为Meta最大预训练扩展模型,预计于未来数月内发布。OpenAI GPT-5模型:2025年2月28日,OpenAI推出GPT-4.5语言模型,并表示将于数月内发布GPT-5模型,GPT-5模型将成为下一代大模型,并有望整合o系列模型测试时扩展能力。AI Agent产业链三大环节核心玩家 模型层 模型层 应用 应用 中间层 中间层 初创企业 初创企业 科技大
44、厂主导 科技大厂主导 模型厂商主导 模型厂商主导 预训练扩展 后训练扩展 测试时扩展 大模型循环扩展提升智能水平 资料来源:Z Research,西南证券整理 资料来源:西南证券 GPT-4模型 GPT-4模型 GPT-4-turbo模型 GPT-4-turbo模型 ChatGPT-o1/o3模型 ChatGPT-o1/o3模型 GPT-4o模型 GPT-4o模型 GPT-5模型 GPT-5模型 一、AI发展阶段:从推理者转向智能体,开始学会调用工具 目 录 二、Agent模型层:底座智能水平提升,推理能力成为核心 三、Agent中间层:中间工具厚积薄发,开发者生态积极构建 四、Agent应用
45、层:初代产品加速创收,商业化应用曙光乍现 五、相关标的及风险提示 20 21 3.1 MCP:定义工具接口标准,打造新一代上下文通信协议 资料来源:Z Research,西南证券整理 Anthropic MCP技术路线示意图 传统API技术路线示意图 资料来源:Z Research,西南证券整理 MCP:链接模型上下文信息与智能工具,建立上下文协议行业标准。2024年11月,Anthropic发布Model Context Protocol(MCP),MCP是一种用于在AI系统中管理和交换模型上下文信息的协议,旨在不同的AI模块、系统或模型之间共享环境、状态和上下文数据。自推出以来,MCP迅速
46、成为AI原生应用的重要基础设施,从结构框架层面来看,传统API与MCP之间存在显著差异:1)传统API:基于经典的“客户端服务端”架构,客户端发起请求,服务器处理并返回响应,传统API充当二者之间的中介,开发者通常需要分别集成多个服务接口,单独处理认证、数据格式和通信协议,带来较高的集成与维护成本,易出现响应机制不一致等问题。2)MCP:遵循“客户端-服务器”架构,由MCP主机/MCP客户端/MCP服务器三个核心组件组成,专为AI系统设计,通过标准化协议传递模型所需的上下文数据,使模型能够高效调用工具,提升AI模型的理解与执行能力。MCP 服务器端 MCP 客户端 22 资料来源:Madron
47、a,西南证券整理 MCP Server供给快速增加,开发者生态加速繁荣。根据Madrona信息,截至2025年3月28日,MCP Server发现平台Smithery的服务器创建数量较2月同期实现3倍增长;截至2025年4月初,MCP Server的GitHub star数已突破2.5万,曲线呈现加速上升趋势;同时,MCP TypeScriptSDK也在快速增长,每周在npm上的下载量已接近70万次,SDK下载量远超服务器包,表明更多的人选择自己搭建MCP服务器或者在自己的应用中支持MCP,开发者更倾向于为未来的使用场景做准备,而非为现有用户需求去部署MCP工具。从原始数据来看,受益于新服务器
48、和开发工具的不断涌现,MCP呈现爆炸式增长,供给侧生态逐步繁荣。MCP协议自发布以来,海内外众多企业陆续采用,应用场景不断拓宽,MCP向AI工具集成行业标准加速迈进。资料来源:Madrona,西南证券整理 MCP Server的GitHub star数量 Smithery平台上MCP服务器创建数量 3.1 MCP:定义工具接口标准,打造新一代上下文通信协议 2月14日 2月14日 MCP的Java MCP的Java SDK发布 1月27日 SDK发布 1月27日 MCP Python MCP Python SDK 1.2.1版SDK 1.2.1版本发布 本发布 3月27日 3月27日 Open
49、AI宣布其Agents OpenAI宣布其Agents SDK正式支持MCP SDK正式支持MCP 3月16日 3月16日 Microsoft Azure OpenAI服务整合MCP,发布企业级MCP解决方案 Microsoft Azure OpenAI服务整合MCP,发布企业级MCP解决方案 2月14日 2月14日 MCP的Java MCP的Java SDK发布 SDK发布 1月27日 1月27日 MCP Python MCP Python SDK 1.2.1版SDK 1.2.1版本发布 3月27日 本发布 3月27日 OpenAI宣布其Agents OpenAI宣布其Agents SDK正
50、式支持MCP SDK正式支持MCP 3月16日 3月16日 Microsoft Azure OpenAIMicrosoft Azure OpenAI服务整合MCP,发布企服务整合MCP,发布企业级MCP解决方案 业级MCP解决方案 23 3.2 A2A:开放智能体互联通信,优化新一代智能体网络协议 资料来源:谷歌官网,西南证券整理 谷歌A2A与MCP协同工作 谷歌A2A开放协议工作原理 资料来源:谷歌官网,西南证券整理 A2A:链接客户端与远程智能体通信,加速企业内部系统协同工作。2025年4月9日,谷歌推出全新开放协议Agent2Agent(A2A),允许AI代理跨生态系统协作。A2A协议旨
51、在让不同来源、不同技术的AI智能体能够安全高效地交换信息,并协同执行跨企业平台或应用的复杂任务。A2A协议是对Anthropic上下文协议MCP的补充,MCP为智能体提供链接工具与上下文的标准,A2A则侧重于智能体之间的交互与协作,帮助智能体之间的高效沟通。工作原理方面,A2A用于促进客户端智能体和远程智能体之间的通信,其中,用户存在于协议中,主要的作用是用于认证和授权;客户端智能体负责制定和传达任务;远程智能体则负责执行任务或采取行动。24 3.2 A2A:开放智能体互联通信,优化新一代智能体网络协议 资料来源:谷歌官网,西南证券整理 资料来源:谷歌官网,西南证券整理 谷歌A2A合作伙伴生态
52、 谷歌A2A招聘应用示例 A2A:合作伙伴阵营日益壮大,专业知识强化企业内部智能体。根据谷歌官网展示的招聘软件工程师案例,A2A协作能够大幅简化流程:在统一界面Agentspace中,HR可以指派客户端智能体根据职位描述、地点和技能要求,寻找匹配候选人;客户端智能体随后会与其他远程智能体进行交互,以获取潜在候选人;HR收到推荐结果后,可以进一步指示客户端智能体安排面试,从而简化人才筛选流程;面试流程结束后,可以再启用其他远程智能体进行背调等行动,从而实现智能体的跨系统合作,帮助寻找合适的候选人。根据谷歌披露信息,A2A的发布已得到包括Atlassian、Box、Cohere、Intuit、La
53、ngchain、埃森哲、BCG、Capgemini、Cognizant等在内的50多家技术合作伙伴和服务提供商的支持,生态系统日益壮多样,合作伙伴的专业知识对塑造智能体的相互协作创造更大,企业内部智能体有望跨系统工作,释放工作效率和创新潜力。HR指派客户端智能体寻找匹配候选人 HR指派客户端智能体寻找匹配候选人 远程智能体获取潜在候选人 远程智能体获取潜在候选人 HR指派客户端智能体对候选人背调;另一远程智能体实施背调并反馈结果 HR指派客户端智能体对候选人背调;另一远程智能体实施背调并反馈结果 技术&平台合作伙伴:提供构建和运行A2A智能体系统的技术与平台。技术&平台合作伙伴:提供构建和运行
54、A2A智能体系统的技术与平台。服务合作伙伴:将技术应用到具体的业务场景中。服务合作伙伴:将技术应用到具体的业务场景中。一、AI发展阶段:从推理者转向智能体,开始学会调用工具 目 录 二、Agent模型层:底座智能水平提升,推理能力成为核心 三、Agent中间层:中间工具厚积薄发,开发者生态积极构建 四、Agent应用层:初代产品加速创收,商业化应用曙光乍现 五、相关标的及风险提示 25 4.1 Agent类别:把握“通用”与“垂类”两大应用方向 资料来源:西南证券 资料来源:西南证券 横向跨行业通用AI代理(Horizontal AI Agent)垂类行业专业AI代理(Vertical AI
55、Agent)同步打磨通用与专业能力,交叉渗透横向与垂直市场。1)跨行业AI代理(Horizontal AI Agent):随着AI技术的发展、以及基于过去通用SaaS产品的历史经验,当前已有众多初创企业针对多种行业或领域打造AI通用智能体,如Sierra(客服代理)、Cursor(软件开发智能体),可提供跨行业智能服务。2)垂类AI代理(Vertical AI Agent):针对某个具体行业或垂直市场提供专业智能体,如AI金融研究创企Boosted.ai、工业控制创企Composabl等,为特定客户类别制定个性化解决方案。当前,以上两类智能体正加速发展,有望向各市场横纵渗透。零售零售Agent
56、金融金融Agent 医疗医疗Agent 工业工业Agent 零售&电商金融&保险 医疗&健康 工业&制造 Agent 其他行业 商家1 商家.机构1 机构.企业1 企业.厂家1 厂家.公司1 公司.S&M Agent Service Agent HR Agent Finance Agent Agent 零售电商金融保险 医疗健康 工业制造 其他行业 营销销售工作流 客户服务工作流 HR管理工作流 财务管理工作流 企业内部工作流 26 资料来源:CBInsights,西南证券整理 资料来源:CBInsights,西南证券整理 4%6%24%14%40%31%20%40%13%9%0%20%40%
57、60%80%100%针对横向跨行业的 通用AI Agent 针对垂类行业的 专业AI Agent 已成熟 规模化 部署中 验证中 新兴期 149 65 35 13 0306090120150针对横向跨行业的 通用AI Agent 针对垂类行业的 专业AI Agent 融资额(亿美元)交易笔数(笔)2020-2025年2月AI Agent创企融资额及交易数 截至2025年2月通用和专业AI Agent成熟度份额 跨行业通用智能体发展相对成熟,垂类行业智能体逐渐兴起。近年来,跨行业通用智能云引领创企风投活动,根据CBInsights统计数据,2020年至2025年2月,该领域的AI Agent创企
58、融资额及交易数均远超垂类行业领域,融资额实现35亿美元,交易达成149笔,垂类行业的创企融资额仅为13亿美元,达成交易65起。在商业成熟度方面,跨行业通用应用在商业上更为成熟,超过2/3的市场正在部署或扩展AI解决方案,其中,客户支持、软件开发、销售和通用企业工作流程等赛道较为活跃;而垂类智能体仍处于新兴和验证阶段,预计未来垂直行业智能体将向部署阶段推进。27 4.1 Agent类别:把握“通用”与“垂类”两大应用方向 资料来源:CBInsights,西南证券整理 垂类行业 降低成本 提高效率 增强体验 垂类行业 降低成本 提高效率 增强体验 零售&电扇零售&电扇自动化产品目录,合成虚拟人节省
59、模特费用 基于LLM搜索提高转化率 更智能、更相关的搜索,个性化头像 金融&保险金融&保险 合成训练数据提高金融模型准确性并确保合规,在非结构化索赔文件中识别模式以最小化损失 AI助手能够大规模分析和合成财务数据,实现自动化承保决策 AI聊天机器人简化日常财务任务,保险销售过程中进行个性化互动 医疗&健康医疗&健康 AI药物发现与设计缩短上市时间,自然语言处理支持临床决策 自动化繁琐任务,改善电子健康记录文档,去噪放射扫描 AI伴侣关注健康和心理健康,合成患者数据保护患者隐私 工业&制造工业&制造 自动化质检、预测性维护 智能调度系统提高生产效率,AI监控质量标准提升良品率 生产流程优化,实时
60、故障预测与提醒 Vertical Agent赋能垂直业务 28 4.2 Agent赋能:把握“降低成本+提高效率+增强体验”三项赋能 从AI智能体赋能作用来看,主要集中于“降低成本+提高效率+增强体验”三大方向。其中,“降低成本”可以帮助企业提升盈利能力,“提高效率”有望加强企业经营竞争力,“增强体验”则将提升用户留存、扩大潜在市场规模,从而构建Agent的商业价值闭环。赋能垂直业务:深入行业场景,扮演专业助手。垂类行业智能体主要用于处理专业复杂任务,垂类行业涵盖电商、金融、医疗、工业等领域,扮演行业专家角色。在降低成本方面,Agent可以替代部分专业岗位中的重复性或规则明确的劳动,例如保单文
61、件初审、医学影像识别等,节省人力开销;在提高效率方面,能够帮助流程节点的自动执行、加速专业信息流转;在增强体验方面,聚焦提升客户互动体验,例如问诊智能引导、客户服务个性化推荐。相较于跨行业通用智能体,垂类行业智能体的部署门槛相对更高,但赋能程度更深,是企业实现数智化转型的核心抓手。资料来源:CBInsights,西南证券整理 企业内部工作流企业内部工作流 降低成本 提高效率 增强体验 降低成本 提高效率 增强体验 营销&销售 营销&销售 自动化销售流程,降低销售人员成本 实时客户洞察,提高转化率 提供个性化推荐与互动,提升客户满意度 客户服务 客户服务 减少人工客服数量和培训成本 快速响应,多
62、轮对话处理能力强 24/7在线,支持多语言,提升响应体验 人力资源管理 人力资源管理 节省简历筛选和入职流程的人力资源 自动化招聘、自动化绩效管理流程 提供个性化职业发展建议,提升员工满意度 财务管理 财务管理 自动报账、对账,减少财务人员投入 实时报表生成,预测与预算更高效 更直观的财务仪表板与智能分析,便于决策 软件开发 软件开发 自动生成代码、测试用例,降低开发与测试成本 智能体辅助调试、代码审查,加快交付周期 开发者获得实时建议和代码提示,优化开发体验 网络安全 网络安全 自动监控与响应降低安全团队人力成本 实时检测威胁并自动响应,降低入侵风险 安全团队可通过智能助手快速定位并理解威胁
63、来源 Horizontal Agent赋能企业工作流 29 赋能企业工作流:提升员工生产力,办公提效是核心。跨行业智能体主要面向企业内部工作流场景,要求普遍适用于各类岗位和部门,具备覆盖面广、上手快、易部署等特点,本质在于打造办公提效工具、甚至形成AI办公操作系统。在降低成本方面,Agent通过自动化通用事务,减少基础人力资源投入;在提高效率方面,能压缩日常事务所耗费的时间;在增强体验上,为员工提供更高效、更流畅的协作环境,使工作节奏更轻盈,工作体验更智能。4.2 Agent赋能:把握“降低成本+提高效率+增强体验”三项赋能 30 芯片领域的摩尔定律:每18-24个月,芯片中的晶体管数量翻倍,
64、芯片算力性能增长、成本下降。Agent的“摩尔定律”:每7个月,AI能够处理的任务长度翻倍,模型性能提升、成本下降。根据机构METR的研究Measuring AI Ability to Complete Long Tasks,2019年至2025年,AI在50%的可靠性标准下,完成的任务长度(以人类专业人士完成任务所需时间衡量)大约每7个月翻一番,若以该“摩尔定律”线性外推,到2029年AI或许能处理需1个月的复杂任务。2025年4月17日,OpenAI发布o3&o4-mini模型,且初步具备主动调用外部工具的能力,在其官网演示的科研海报应用案例中,从耗时角度,o3模型可以在20s内完成人类研
65、究员可能需数天完成的任务。4.3 Agent摩尔定律:处理任务长度每7月翻一倍,性能增长且成本下降 芯片中的晶体管数每18-24个月翻一倍 AI能够处理的任务长度每7个月翻一倍 大模型发布时间 大模型发布时间 模型模型以以5050%的的可可靠靠性性完完成成的的任任务务长长度 度 资料来源:集成芯片与芯粒技术白皮书,西南证券整理 资料来源:Measuring AI Ability to Complete Long Tasks,西南证券整理 31 智能体处理任务长度正大幅提升,完成简单任务已具性价比。根据机构METR的研究MeasuringAI Ability to Complete Long T
66、asks,目前超过80%由智能体成功完成的任务中,AI的推理成本仅为人类专家的10%,其中,对于人类专家在30秒内完成的任务,使用AI的经济优势显著,目前已可完成16个小时的软件任务,但在完成长时序现实世界任务方面,人类在整个工作循环中仍然需要发挥较大作用和价值。在2025年4月17日OpenAI发布的o3和o4-mini模型中,o3和o4-mini在很多情况下比各自的前代o1与o3-mini更高效、更节省成本,在AME2025基准测试中,性价比远超过前代模型。未来随着AI技术持续发展,AI在复杂任务面前有望同样具备性价比,从而推动AI智能体进一步应用与渗透。AI完成简单任务已具备经济优势 O
67、penAI-o系列模型性价比持续提升 资料来源:Measuring AI Ability to Complete Long Tasks,西南证券整理 资料来源:OpenAI官网,西南证券整理 4.3 Agent摩尔定律:处理任务长度每7月翻一倍,性能增长且成本下降 32 资料来源:Sacra,Tullopy,西南证券整理 4.4 Agent初代产品:产品ARR迅速增长,爆发潜力可期 智能体打造交互式应用,未来爆发潜力可期。智能体作为可交互的应用产品,能够快速触达用户,付费渗透空间较大。根据Sacra数据,Agent初代产品Cursor已成为年经常性收入(ARR)从0增长至1亿美元最快的初创企业
68、之一,耗时约12个月、于2024年底达成1亿美元ARR里程碑,并于2025年3月ARR迅速达到2亿美金。根据当前AI智能体创企公司及产品来看,布局领域主要集中于编码、法律、招聘、客服、医疗等行业领域,商业模式持续探索,已出现基于结果(AI交付实际成果、任务完成率等指标)定价的AI应用产品,或根据资源消耗量收费,也可采用常见的SaaS产品订阅方式对商业模式进行补充。基于智能体产品爆发快、轻资产、强用户触达等特点,未来有望凭借更快的成长速度成为AI应用黑马,建议后续关注ARR实现快速提升的AI公司及产品。AI创企ARR增速及2024年估值情况 AI初创企业产品定位ARR增长速度2024年ARR($
69、亿)2024年估值2024年估值倍数CursorAI编程助手12个月内从0做到1亿美元12525Lovable非程序员的AI软件开发平台2个月内从0做到1000万美元0.07/Glean企业级AI搜索平台21个月内从0做到1亿美元1.14642CodeiumAI编程助手/0.1212.5104HarveyAI法律助手26个月内从0做到5000万美元0.53060HebbiaAI驱动的金融/法律助手/0.13754Bolt.newAI驱动的网页构建平台2个月内从0做到2000万美元0.25/MercorAI驱动的招聘平台2年内从0做到5000万美元0.52.55DecagonAI驱动的客服代理/
70、0.066.5108SierraAI驱动的客服软件/0.245225CommureAI驱动的医疗软件/0.4123033 4.5 Agent流量入口:AI入口尚处于早期阶段,或将呈现中心化特点 互联网 1.0 互联网 1.0 互联网 2.0 互联网 2.0 互联网3.0 互联网3.0 产品入口产品入口互联网时代 互联网时代 技术逻辑 技术逻辑 商业模式 商业模式 权力结构 权力结构 门户网站形成入口,入口中心化门户网站形成入口,入口中心化特点明显 特点明显 1)初代流量逻辑,点击率吸引1)初代流量逻辑,点击率吸引广告;2)用户作为数据源被商广告;2)用户作为数据源被商品化,不参与价值分配 品化
71、,不参与价值分配 基于HTML静态网页,用户仅能基于HTML静态网页,用户仅能通过浏览器被动获取信息,内容通过浏览器被动获取信息,内容由专业开发者单向灌输 由专业开发者单向灌输 资料来源:Z Research,西南证券整理 搜索引擎形成入口,入口中心化特点明显 搜索引擎形成入口,入口中心化特点明显 1)搜索引擎竞价排名;2)PC在家庭和个人用户中广泛普及1)搜索引擎竞价排名;2)PC在家庭和个人用户中广泛普及1)动态网页和数据库驱动,用1)动态网页和数据库驱动,用户既是消费者也是生产者;2)PC在家庭和个人用户中广泛普及户既是消费者也是生产者;2)PC在家庭和个人用户中广泛普及各垂类APP形成
72、场景化生态(微 各垂类APP形成场景化生态(微 信社交/淘宝电商/美团本地生活信社交/淘宝电商/美团本地生活等),入口价值出现分散 等),入口价值出现分散 1)流量经济;2)用户行为数据1)流量经济;2)用户行为数据成为核心生产资料,通过精准推成为核心生产资料,通过精准推荐和增值服务变现 荐和增值服务变现 1)信息找人;2)智能手机渗透1)信息找人;2)智能手机渗透率攀升;3)区块链实现数据确权与跨链互通 率攀升;3)区块链实现数据确权与跨链互通 互联网流量入口由中心化转向多元化 互联网流量入口从中心化转向分散化,AI时代入口可能处于早期收敛阶段。1)互联网1.0时期:门户网站Yahoo、Si
73、na成为信息获取的主要入口,流量入口高度中心化;2)互联网2.0时代:搜索引擎如百度、谷歌成为主流入口;3)互联网3.0阶段:随着移动互联网和智能终端的就是普及,以及各类垂类APP的崛起,逐渐打破过去流量入口的垄断格局,呈现明显多元化趋势,入口价值逐渐向场景和服务转移。类比互联网时代来看,当前AI时代的入口尚处于早期阶段,ChatGPT、DeepSeek等少数大模型产品主导用户心智,呈现出类似于互联网时代早期的门户式中心化状态。1990s 2000s 2014 1990s 2000s 2014 2022 2022 一、AI发展阶段:从推理者转向智能体,开始学会调用工具 目 录 二、Agent模
74、型层:底座智能水平提升,推理能力成为核心 三、Agent中间层:中间工具厚积薄发,开发者生态积极构建 四、Agent应用层:初代产品加速创收,商业化应用曙光乍现 五、相关标的及风险提示 34 35 相关标的 AI发展阶段变化:从“推理者”到“智能体”AI发展阶段变化:从“推理者”到“智能体”模型层 变化 模型层 变化 模型扩展法则从训练转向推理,主次曲线逐步切换 模型扩展法则从训练转向推理,主次曲线逐步切换 推理算力需求提升 推理算力需求提升 英伟达英伟达 博通博通中间层变化 中间层变化 以MCP、A2A工具为代表的智能体中间层厚积薄发 以MCP、A2A工具为代表的智能体中间层厚积薄发 开发工具、数据层日渐丰富 开发工具、数据层日渐丰富 谷歌谷歌 SNOWSNOW应用层变化 应用层变化 初代智能体产品ARR呈现快速增长态势 初代智能体产品ARR呈现快速增长态势 商业化应用曙光乍现 商业化应用曙光乍现 CRMCRM SAPSAP ShopifyShopify云服务厂商 云服务厂商 云端算力/中间工具/应用均需要云厂商支持 云端算力/中间工具/应用均需要云厂商支持 重构云需求结构与增速 重构云需求结构与增速 亚马逊亚马逊 微软微软 谷歌谷歌层面 逻辑 受益方向 相关标的