1、Agentic RAG 的现在与未来原句互动联合创始&CTO从使具到重构知识系统我介绍句互动联合创始&CTO福布斯中国年海归菁英100华为云 HCDETGO 鲲鹏会北京会员Sam Altman 在 Y-Combinator 带的最后届校友奇绩创坛 S23 校友3w+star 开源社区 Wechaty 核 contributor前 Amazon,Expedia 全栈程师 原offline process那些年,我们做过的 RAGRetrieval-Augmented Generation(RAG)是当前 LLM 应中的核技术之。queryLLMembeddingmodelvectorDataba
2、secontextanswerknowledgeembeddingmodelvectorchunks问题上下重写/指代消除对话内容DatabaseLLMcontextanswerLLMqueryAgentic RAG常的 RAG 技术都有什么这个技术是什么意思Agentic RAG 是什么意思混合检索+检索重排queryLLMembeddingmodelvectorDatabasecontextanswervector searchkeyword searchrerank modelnew contexttop-50top-10Context is the Key 上下是关键AI 应的进步就是
3、 上下管理的进步Agentic RAG0102030405录Agentic RAG 的基本范式Agentic RAG 的系统架构Agentic RAG 的进化向案例分享Q&A01从程序化检索到性化认知Agentic RAG 的基本范式从过去 AI 发展得到的经验简单成推理+成次成ReAct COT快思考慢思考作流Agent从过去 AI 发展得到的经验让 AI 模仿类的做事式简单成推理+成次成ReAct COT快思考慢思考作流AgentAgentic RAG 的本质变化让 AI 完成全部任务:决定如何检索让 AI 完成部分任务普通 RAG vs Agentic RAG维度普通 RAGAgenti
4、c RAG架构特点固定流程:预定义的检索+成动态流程:Agent 具备计划与执能检索式固定轮数检索多轮检索策略,可我反思检索效果上下构建固定 top-k 或基于得分排序Agent 可根据任务主动选择相关 chunk灵活性可扩展性较弱,流程刚性度可扩展,可接更多具和策略可维护性可维护性较强,规则清楚,易定位和解决问题可维护性较弱,Agent 计划不可控,调试和定位问题相对困难使成本实现简单,资源开销低落地复杂度,消耗更多 token 和计算资源响应速度响应速度较稳定,相对较快响应速度不稳定,根据不同情况时快时慢场景适配策略与设计考量场景特征使策略问题范围明确、问题类型单、信息集中使 普通 RAG
5、:轻量、响应快问题范围模糊、问题类型不可预测、信息分散使 Agentic RAG:可规划推理、动态检索信息特征使策略单集中化(如内部档、规章制度)普通 RAG 更擅快速定位答案异构+多源(如、报告、图、数据库)Agentic RAG 可使具理解和串联多种内容需求推荐对准确率要求不,成本要求选择 普通 RAG(Fast+Simple)对准确率和理解要求Agentic RAG 更智能,更精细但成本更 1.根据任务复杂度来判断 2.根据信息结构来判断 3.根据准确率/成本要求来判断场景适配策略与设计考量简单 Agentic RAG 可以实现更好的实时性-三段式语通话场景户消息内容LLM 重写问题em
6、bedding 计算搜索向量搜索LLM 成回答(token)返回回复消息1-2s0.5-2s1s200ms0.5-1s户消息内容具调LLM 成回答(token)返回回复消息1-2sLLM 调具0.5-1s0.5-1sLLM 成回答 token 2-6s token 0.5s普通 RAG简单 Agentic RAGLLM 成Agentic RAG&语通话流程检索流程需要检索流程稍等我查下信息输出流流式输出 token输出流流式输出 token0.5s 左右延迟0.5s 左右延迟1-2s 等待queryqueryLLM 成检索参数向量检索搜索LLM 成02从架构搭建到策略调优Agentic RAG