报告预览

彭信东-RAG检索实践.pdf

编号：168910

PDF 40页 10.04MB 下载积分：VIP专享

下载报告请您先登录！

彭信东-RAG检索实践.pdf

1、DataFunCon#2024基于ByteHouse OLAP架构如何实现性能向量检索引擎ByteHouse团队/彭信东Contents录向量检索概念及场景ByteHouse向量检索实现性能与资源使优化性能评测及未来作Contents录向量检索概念及场景ByteHouse向量检索实现性能与资源使优化性能评测及未来作什么是向量检索模型企业级模型问答系统向量检索案例向量检索的本质向量检索索引 Table-based LSH Tree-based KD-Tree,Annoy Cluster-based IVF,SCANN,SPANN Graph-based HNSW,NSG,DiskANNClust

2、er-based:IVFFlat 聚类训练优点：构建速度快额外内存占少缺点查询速度受维度信息影响较精度查询计算量较Graph-based：HNSW 构建图结构优点查询速度快，并发性能好缺点构建速度慢，内存占向量数据库overview向量数据库分类专向量数据库 Vector-centric设计极致向量检索性能现有数据库扩展向量持 Vector index的式接持复杂数据类型与查询操作，All-in-one查询Contents录向量检索概念及场景ByteHouse向量检索实现性能与资源使优化性能评测及未来作在ByteHouse创建向量索引多种索引类型 Flat HNSW

3、 HNSW(SQ)IVFFlat IVFPQ IVFPQFastScan向量数据导多种数据导式 kafka表引擎 Insert From File SDK向量检索查询使距离函数利ByteHouse特性查询 CTE查询现有数据库扩展优势完备的数据管理机制标准的SQL和多种复杂数据类型持查询优化性能执引擎问题通查询链路，额外的计算和IO开销标量索引VS向量索引 Strict monotonicity vs Relaxed monotonicity在ByteHouse上持向量检索标补充ByteHouse结构化数据处理能完备数据库功能持+深度定制的Vector-centric

4、计算链路性能向量检索云数据仓ByteHouse架构ByteHouse已有特性数据管理保障丰富数据表引擎：支持不同使用场景权限控制丰富的数据类型和语法支持复杂类型支持完善的SQL支持高性能计算引擎向量化算子执行，底层计算优化查询优化器高效的查询计划和分布式执行现有向量检索案 OLAP系统主要使Skip Index作为数据剪枝案把vector index当作skip index来使局限性计算冗余 Data skip阶段 vector index计算出来的top-k(label,distance)信息只用于做data block过滤 Post Skip阶段还需要对过滤后的向量

5、再计算一次distance信息读放大多次topK向量索引的读取实际执行distance算子时，还需要读取向量列数据ByteHouse向量数据库的实现高效向量检索执行链路 One-pass computation Column pruning 通用的向量/标量混合查询链路(通过row id bitmap关联)标量前置过滤标量后置过滤（迭代）In-memory向量索引缓存基于LRU策略标量前置过滤查询流程主要组件Contents录向量检索概念及场景ByteHouse向量检索实现性能与资源使优化性能评测及未来作优化案例：以图搜图数据规模：12亿数据，单节点(64cores,256GB)查

6、询模式先按时间，类型，平台标量过滤再从中查找最相似的1000张图和相似度评分性能（单query latency）优化前：700-800ms 优化后：150-200ms优化向量检索计算下推过滤操作优化数据冷读问题优化索引构建资源限制优化：计算下推优化标量/向量混合查询场景基于标量主键范围查找主键是有序的，只需读取首尾部分数据进行过滤，构建符合条件的row id bitmap 加速标量列剪枝 Filter by partition Key/Primary key/Skip indices 存储层过滤标量

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（彭信东-RAG检索实践.pdf）为本站（张5G）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。