《1李晓鹏.pdf》由会员分享,可在线阅读,更多相关《1李晓鹏.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、演讲嘉宾:李晓鹏 香港城市大学超越超越RAGRAG:迈向智能体时代的:迈向智能体时代的 Agentic RAGAgentic RAG目录目录0 1RAGRAG0 2Reasoning RAGReasoning RAG0 3Agentic RAGAgentic RAG0 4总结总结&未来展望未来展望 RAGRAG扩展语言模型知识边界,提高知识时效性扩展语言模型知识边界,提高知识时效性RAG:通过外部知识解决LLM幻觉和时效性问题预训练语料库LLMsQuery:詹姆斯获取过几次NBA总冠军?詹姆斯获取过 10 次 NBA 总冠军詹姆斯获取过 3 次 NBA 总冠军直接回复+RAG詹姆斯获取过 4
2、次 NBA 总冠军2012、2013、2016、2020幻觉幻觉过时过时RAG:RAG 技术迭代QueryDocumentsRetrievalIndexingPromptLLMsoutputQueryDocumentsRetrievalIndexingPromptLLMsoutputPre-retrievalPost-retrievalRetrievalGenerationRetrievalGenerationRetrieval?RetrievalCritique?GenerationNon-RetrievalSingle-StepMulti-StepIterativeactiveadapti
3、veNaiveAdvancedModularGao Y,Xiong Y,Gao X,et al.Retrieval-augmented generation for large language models:A surveyRAG:Pipeline AdaptionCritique-basedAdaptive-basedRefection tokens:Retrieve,IsRel,IsSup,IsUseInference:-预测:是否检索,是否相关(d-q),是否支持(d-y),是否有用(y-x)-排序:Adaptive retrieval with threshold,Tree-deco
4、ding with critique tokensTraining:-Critic model:基于GPT-4标注 reflection token 数据,蒸馏到 in-house model -Generator:基于Critic model 和检索器标注 reflection token,训练生成器Asai A,Wu Z,Wang Y,et al.Self-rag:Learning to retrieve,generate,and critique through self-reflection训练分类器,根据问题复杂程度,动态选择检索策略(None,Single,Multi)提供 QA
5、系统整体效率和准确率RepE表征分解:诚实度/置信度诚实度:内部认知置信度:回答信心诚实引导:内部知识与输出对齐信心监控:动态决定是否进行检索Jeong S,et al.Adaptive-rag:Learning to adapt retrieval-augmented large language models through question complexityLiu H,et al.Ctrla:Adaptive retrieval-augmented generation via probe-guided controlRAG:Modules AlignmentRetriever Al
6、ignmentRe-ranker AlignmentMotivation:检索的文档和原始查询存在语义代沟Retriever:查询编码器+文档编码器向量召回(仅看到当前查询)Re-ranker:深度度量文档和查询的相关性(可以看到前序输出)Distillation:将 re-ranker 参数蒸馏到 retriever 中查询编码器Shao Z,et al.Enhancing Retrieval-Augmented Large Language Models with Iterative Retrieval-Generation Synergy基于 ground truth 和 query 引