《大模型时代下的向量数据库:从设计到实践.pdf》由会员分享,可在线阅读,更多相关《大模型时代下的向量数据库:从设计到实践.pdf(19页珍藏版)》请在三个皮匠报告上搜索。
1、从设计到实践大模型时代下的向量数据库邱培峰,拓数派|OpenPie自 主 创 新 引 领大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会拓数派(OpenPie):大模型数据计算系统先行者立足于国内的基础数据计算领域高科技创新机构;拥有强大的数据库内核研发团队、数据科学家团队和数字化转型团队;国内虚拟数仓和eMPP技术提出者,不断在数据计算引擎方向进行创新,全面拥抱AI技术趋势旗下大模型数据计算系统“一份数据,多引擎计算”让企业具
2、备传统大数据分析能力的同时,也具备基于大模型的 AIGC 能力大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大模型应用和RAG向量数据库 PieCloudVector向量数据库010203目 录Contents大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大模
3、型应用和RAGChapter 01大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大模型大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会检索增强生成(RAG)使用大模型可以构造问答、聊天等应用,但同时也存在以下问题 数据时效-LLM训练数据有截止日期,不包含最新信
4、息,无法准确回答时效性强的问题 私域数据-LLM训练数据多来源于公开渠道,无法接触到私域数据,对特定领域的生成任务质量不高。长期记忆-LLM本身却没有长期记忆能力,对上下文时间跨度大交互的情况处理不好大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会检索增强生成(RAG)Embedding-通过模型将各种形式的数据转换为向量大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标
5、准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会检索增强生成(RAG)大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会向量数据库Chapter 02大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会向量数据
6、库 存储向量数据和与之关联的原始实体(文字/图像/音频等),并将他们关联起来 建立索引高效进行向量近似搜索 配套调用接口和生态工具技术路线从向量近似搜索和索引算法出发,开发数据存储和管理能力从数据存储方案(关系/非关系型数据库)出发,开发向量近似搜索功能和索引算法大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会拓数派向量数据库PieCloudVectorChapter 03大数据技术标准推