《朱洁-大模型时代数据库技术创新.pdf》由会员分享,可在线阅读,更多相关《朱洁-大模型时代数据库技术创新.pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、大模型时代数据库技术创新自我介绍个人著作大数据架构详解获得 2017 电子工业出版社优秀作者奖公众号大数据和云计算技术百度智能云数据库产品总架构师数据库与大模型01DB4AI:向量数据库02AI4DB:数据库运维应用03目 录4数据库与大模型数据库行业发展史概览基础设施应用场景数据库1950s大型机1970s小型机1990sPC机+局域网2000s数据中心+互联网2015云+端+4G2023GPU+AI国防科学研究大型商业应用企业信息化ERP/CRM/财务企业BI个人办公个人娱乐媒体搜索电子商务社交新媒体移动App云计算物联网在线办公、教育娱乐、短视频AI原生应用JasperMidjourne
2、y微软 copilot层次数据库网状数据库IBM IMS关系型数据库OracleDB2Ingres关系型数据库数据仓库PC单机数据库SQL ServerTeradatadBasePG 开源数据库MySQLRedisMongoDB云数据库分布式数据库AuroraRDSRedshiftOceanbaseCockroachDBGaiaDBPegaDBSCDAS向量数据库大模型二次激发了数据库和 AI 的结合大模型和数据库结合相比以前的 AI 技术场景更通用,能力更实用!数据库智能驾驶舱AI4DB向量数据库DB4AI大模型最新技术栈SaaSIaaSPaaS各种 Agent客服,销售各种 AppCRM,
3、ERP,财务,HR私有知识库互联网,金融,多媒体数据库智能驾驶舱 DBSCAgent Builder2C Agent2B AgentApp Builder低代码态开发代码态开发Model Builder大模型精调,部署相关工具链大模型(文心,Llama,etc.)RAG FlowVector DBGPUCPU8DB4AI:向量数据库向量数据库典型场景多模态检索推荐系统 分类系统相似度检索向量检索为主文档,向量混合搜索多路召回,排序模型有:Cohere Rerank和 BGE-Reranker语义搜索文本和向量混合检索知识库客服大模型记忆问答RAG检索结果给大模型总结RAG 每步的难点和要解决的
4、问题数据提取结构化/半结构化数据DatabasewebsiteAPIsLogs非结构化数据视频图片音频文档数据索引数据分块 按固定大小 按意图Embedding BGE text-embedding-3 CLIP检 索Query 预处理 意图识别 同义词生成 专有名词处理召回 向量检索 文本检索 多路召回 re-rank生 成Prompt工程 Step by Step 针对场景优化大模型能力 理解 生成 逻辑 记忆应 用搜索推荐copilotCoAIRAG 在通用性和性价比上占据明显优势大模型长文本RAG成本低性能好,尤其是响应时延更好问答稳定,解决大模型幻觉问题复杂问题,安全问题处理更好(复
5、杂过滤,安全回答)定位方便(大模型是黑盒)推理能力更强RAG 应用场景:私域知识库业务场景基于大模型的推理能力,搭配向量数据库私有数据召回能力,构建私域知识库功能需求统一的客户向量数据全生命周期管理数据 embedding 管理多模私域数据存储和检索管理针对私域数据的向量标量混合检索技术难点向量模型的版本管理和全量更新复杂的向量和标量混合查询条件支持支持私有化部署,集群小型化部署传统数据库支持向量的缺陷传统数据库的系统架构针对标量字段处理设计,需要支持复杂的SQL计算,与向量数据的 KNN 检索有很大差距,不能很好解决向量检索需求系统架构传统数据库通过扩展向量字段,并基于开源 Faiss,ns
6、wlib,annoy 等来扩展向量索引,受原有架构影响,在写入效率,查询延时和并发性能上均存在瓶颈索引性能传统数据库使用的向量检索库往往不具备实时做数据持久化,不能保障数据一致性存储方案百度AI原生向量数据库VectorDB海量向量存储 /分布式架构,支持百亿级向量规模和十万级分片数量同时支持向量数据和标量数据支持4096维的高维向量支持向量索引量化压缩高性能访问 /支持 HNSW/Puck/PQ 等高性能算法毫秒级ANN向量检索延时架构和数据引擎多方面工程优化,各场景性能均高于开源产品 37.5倍全栈LLM开发 /支持主流的LLMs框架集成开发集成百度千帆 Embedding 模型,基于百度