当前位置:首页 > 报告详情

姜勇-RAG关键技术及未来趋势发展.pdf

上传人: 哆哆 编号:630922 2025-04-19 44页 9.75MB

1、姜勇 Dify首席架构师负责 Dify.AI 最佳实践探索及架构设计。一个 90%的 E 人,却喜欢前沿技术折腾,并认为 Code 是最纯粹的事情。在软件工程、服务高可用和数据处理领域有较为丰富的经验,曾独立搭建类 Notion 的笔记型知识库后端服务,超百万用户量;对 RAG 领域有着深刻的理解与实践,曾多次在向量数据库大会、A2M大会、人工智能峰会中进行过相关领域的知识分享。演讲主题:RAG关键技术及未来趋势发展RAG 关键技术及未来趋势发展姜勇Dify.AI 架构师建设 RAG 目前的困境RAG 发展史E En nt te er rp pr ri is se e R RA AG GRAG

2、 的展望RAG 难点from:https:/arxiv.org/html/2401.05856v1R RA AG G 难难点点FP1 Missing ContentFP2 Missed the Top Ranked DocumentsFP3 Not in Context-Consolidation strategy Limitations FP4 Not Extracted FP5 Wrong FormatFP6 Incorrect SpecificityFP7 IncompleteRAG 发展史第第一一阶阶段段:B Ba as si ic c R RA AG GRetrieveAnswerb

3、ased on vector searchBasic RAGRAG 发展史based on vector search第二阶段:Advanced RAGHybrid RetrieveAnswerResult ProcessA Ad dv va an nc ce ed d R RA AG GAdvanced RAGQuery typeKeywordNDCG3VectorNDCG3HybridNDCG3Hybrid+Semantic RankerNDCG3Concept seeking queries39.045.846.359.6Fact seeking queries37.849.049.16

4、3.4Exact snippet search51.141.551.060.8Web search-like queries41.846.350.058.9Keyword queries79.211.761.066.9Low query term overlap23.036.135.949.1Queries with misspellings28.839.140.654.6Long queries42.741.648.159.4Medium queries38.144.746.759.9Short queries53.138.853.063.9Advanced RAGAdvanced RAG“

5、G Ga ar rb ba ag ge e I In n G Ga ar rb ba ag ge e O Ou ut t.”Advanced RAG类类型型示示例例问题与语料不相关询问产品配置库关于货物运输的问题问题模糊“这篇文章的作者是谁?不是关于事实召回“总结一下这篇文章的主要内容”包含多个子问题今年的欧洲杯在哪里举办,什么时候开始?需要多跳逻辑“Who won the 2023 super bowl and where was their head coach from?”包含非语义组成(结构化)“What are movies about aliens in 1980”-should

6、filter by year=1980问题包含比较“江苏省房贷利率政策从2022年至2023年有哪些调整?”Advanced RAGbased on vector searchHybird RetrieveAnswerResult ProcessQuery TransformAdvanced RAGAdvanced RAG类类型型解解决决方方案案问题与语料不相关检索前增加问题分类或检查步骤,如查询路由(Query routing)问题模糊基于历史的问题重写(Rewrite)不是关于事实召回(总结)索引过程中实现摘要(Summary Index)长文本窗口

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了姜勇Dify.AI首席架构师及其团队在RAG(Retrieval-augmented Generation)领域的探索与实践。姜勇具有丰富的软件工程、服务高可用和数据处理经验,独立搭建了超百万用户量的类Notion笔记型知识库后端服务。文章详细阐述了RAG的关键技术及未来发展趋势,包括RAG的发展史、面临的困境、以及不同阶段的解决方案。 RAG发展史分为三个阶段:基本RAG、高级RAG和多模态长文本RAG。基本RAG是基于向量搜索的,而高级RAG采用了混合检索和结果处理方法,提高了在不同类型查询下的性能。多模态长文本RAG则提供了更灵活的分块算法,使得文档级别的分析和比较更容易,同时减少了幻觉现象。 文章还提到了RAG面临的七个困境,如缺失内容、未提取、不在上下文中等,并给出了相应的解决方案。最后,文章展望了RAG系统的未来,强调了在设计RAG系统时需要考虑用户需求和应用场景,没有最好的策略,只有最适合场景的策略。
"RAG技术如何解决信息检索难题?" "混合检索和重排序如何改进RAG系统效果?" "Dify.AI如何利用RAG技术为用户提供优质服务?"
客服
商务合作
小程序
服务号
折叠