《腾讯云向量数据库:大模型时代下的数据库创新与变革.pdf》由会员分享,可在线阅读,更多相关《腾讯云向量数据库:大模型时代下的数据库创新与变革.pdf(11页珍藏版)》请在三个皮匠报告上搜索。
1、向量数据库:大模型时代下的创新与变革罗云 腾讯云数据库产品副总经理主讲人:将数据接入AI成为大模型时代最重要的事新的生产力智能处理器接入AI挖掘数据价值数据成为企业核心的竞争力绝大部分的非结构化数据没有充分利用(比例图示)高效接入挖掘价值竞争/PK企业企业大模型抹平了工程和算法层面的差距工程算法数据向量数据库是企业数据和大模型的桥梁数据接入方式预训练微调外部知识库实时性隐私性训练成本秒 通用服务1/10000月私有化部署万卡月Unstructured dateDeep learning modelsEmbedding vectorsVector database向量数据库是否应该重新定义?AI
2、 Native 时代AI Native VectorDB的定义传统向量数据库AI Native APP的AI计算AI Native VectorDB固定索引(FLAT、HNSW)AI训练索引(IVF)AI训练索引(IVF、Bi-HNSW)固定索引(FLAT、HNSW)AI训练索引(IVF、Bi-HNSW)AI EmbeddingAI精排计算AI聚合计算分割计算KNN相似计算标量过滤计算AI EmbeddingAI精排计算AI聚合计算KNN相似计算标量过滤计算自然语言查询自然语言查询标量+向量查询标量+向量查询AINativeDB接口储存计算数据库查询语言自然语言,自然文本固定的索引预训练索引数
3、据运算AI运算接口层计算层存储层Tecent Cloud AI Native VectorDBAPI LayerCompute LayerUpsertDeleteUpdateQuery标量计算SearchKNNRangeFilter向量计算EmbeddingSplitIndex TrainingAI计算Storage LayerRocksDBRaftLeaderFollowerFollowerFollowerIndexObject StorageHNSWIVFBI-IVF-HNSWReverse IndexpdfwordText99.99%多副本+多AZ故障秒级恢复Restful API We
4、b Console(DMC)SDK(Python/Java/Go)Client ToolLangchain性能和成本业界大幅度领先138433346338115940200040006000800010000120001400016000128纬度768纬度腾讯云向量数据库行业平均QPS对比0.190.771.23300.511.522.533.5128纬度768纬度腾讯云向量数据库行业平均单QPS成本(元/月)测试规格:3*4C8G(相近的规格)测试工具:ann-benchmark,数据集:sift-128-Euclidean,chinese-768-angular,数据量:100万行,召回率:99%腾讯云向量数据库,加速企业在大模型时代的AI化进程训练数据的分类、去重、清洗向量数据库作为外部知识库模型训练模型推理服务MAAS企业集成AI算子AI存储引擎应用企业接入AI效率提升10倍无需专业AI工程投入成本降低2-4个数量级10倍效率提升成本降低50%可视化管理,支持多种接入方式,数据快速接入DB/Collection在线管理模板化操作快速执行一键上传数据自动构建索引数据导入RESTful API全托管开箱即用腾讯云向量数据库应用案例集团内部 40+业务接入,1600亿次请求/天腾讯文档腾讯会议腾讯安灯100+外部企业接入THANKS谢谢观看