《王琦智下一代 RAG - DA数智大会 .pdf》由会员分享,可在线阅读,更多相关《王琦智下一代 RAG - DA数智大会 .pdf(45页珍藏版)》请在三个皮匠报告上搜索。
1、演讲嘉宾:王琦智王琦智7 年编程与架构经验。曾在腾讯音乐、锦江等公司担任重要职务,始终致力于代码的开发与精进,并专注于开发者生态建设,研发效率及体验提升,开发者赋能。目前,在 PingCAP 负责 TiDB 生态系统架构及开发者 Advocate。实现 TiDB 与 AWS、GORM、MySQL Connector、Hibernate、DBeaver及 vscode-sqltools 等平台集成。并撰写了 TiDB 的开发者文档,使得开发者获得更流畅的 TiDB 开发体验。同时作为业务开发者代表,保障 TiDB 在开发者间的持续竞争力。1tidb.ai 是什么2简单 RAG 的实现方案3为什么
2、需要 Rerank?4知识图谱助力 RAG5Vector type within TiDB TiDB+Vector Database6All in one 数据库帮助开发者减负7EndingPart 01社区用户提出的技术问题,将会由技术支持工程师在看到之后,再逐一解决,这个过程很可能会很久,如果有多轮沟通,那就会更久TiDB 社区过去一直使用技术支持小组轮班回答一些社区成员提出的问题。但我们一直都缺乏相应的人力TiDB 的文档丰富,但反过来看,过多的文档导致用户不知道选择哪些去看。可能会导致用户没办法得到 TiDB 的全盘认知缺乏技术支持人力技术回答间隔较长文档太多没时间看帮用户看文档写代码
3、,回答问题0 延迟回答多轮对话也无需等待解放技术支持工程师人力Part 02RRetrieval检索AAugmented增强GGeneration生成降低幻觉给予额外知识突破上下文窗口限制Part 03Jina.ai CO.Reranker,Jina AI-Reranker.Available at:https:/jina.ai/reranker(Accessed:22 May 2024).专注于语言关系 余弦相似性会忽略语言之间的关系 查询与文档之间的意图的交互 这种排序更重,但是也能让我们进一步知道文档与问题之间的关联性排序The goal of a search system is to
4、 find the most relevant results quickly and efficiently.Traditionally,methods like BM25 or tf-idf have been used to rank search results based on keyword matching.Recent methods,such as embedding-based cosine similarity,have been implemented in many vector databases.These methods are straightforward
5、but can sometimes miss the subtleties of language,and most importantly,the interaction between documents and a querys intent.This is where the reranker shines.A reranker is an advanced AI model that takes the initial set of results from a searchoften provided by an embeddings/token-based searchand r
6、eevaluates them to ensure they align more closely with the users intent.It looks beyond the surface-level matching of terms to consider the deeper interaction between the search query and the content of the documents.Jina.ai CO.Reranker,Jina AI-Reranker.Available at:https:/jina.a