当前位置:首页 > 报告详情

Vearch 的 GPU 方案在海量向量检索系统上的应用创新.pdf

上传人: li 编号:29560 2021-02-07 27页 1.58MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
Vearch是一个向量数据库技术,旨在解决AI业务场景中海量特征向量的存储和计算问题。其技术核心包括实时向量索引、标量字段范围过滤查询、基于Raft的分布式系统等。Vearch支持多种向量检索模型,如IVFPQ、IVFFLAT、HNSW等,以及文档中常规标量字段的存储和索引。其性能优势在于毫秒级检索、实时索引,以及支持十亿量级向量的存储和查询。在性能与效果评测中,Vearch旗舰版性能在大batch情况下较原生faiss可提升2-3倍。在应用场景方面,Vearch广泛应用于图像、视频、音频检索和去重,文本相似度计算,推荐、搜索召回及排序,智能视频监控等领域。已有京东之家人脸库、重复铺货、同款推荐、推荐系统等成功应用案例。未来规划包括集成更多检索模型、可视化管理web端、集成丰富算法插件等。
根据您提供的标记中的内容,可以看出这是关于向量数据库(Vearch)技术的描述。我将这些信息整理如下,以便更好地回答您可能提出的问题 随着AI业务场景的丰富,如文本、图像、视频等数据抽取了大量特征向量,用于各种业务场景如以图搜图、视频相似度检测、人脸识别等。但目前没有一套完整的解决方案能满足海量特征向量的存储和计算需求。 Vearch旨在构建一套易用的在线系统,解决海量特征向量的存储、计算以及相似向量的检索问题,为文本、图像、视频检索等应用提供统一的基础设施。 **技术核心** 支持实时索引和相似向量检索。 通过范围过滤提升性能。 内存动态扩展,支持add、delete和update操作。 适应不同数据规模和召回精度要求。 以及多标签的实时存储及检索。 如IVFPQ,提供召回TopN原始向量的精排功能。 支持原始向量、标量、向量索引和标量索引的持久化。 适用于以图搜图、视频版权保护、推荐系统、搜索排序、人脸识别、安防领域智能视频监控等场景。 支持十亿量级向量存储、查询,具有毫秒级检索性能,以及灵活易用的特点。 包括GPU优化、横向弹性扩展、算法插件服务支持、docker支持等。 应用于京东之家人脸库、重复铺货、同款推荐、YouTube视频推荐系统等。 如果您有更具体的问题或需要进一步的信息,请告诉我。
客服
商务合作
小程序
服务号
折叠