《Zilliz-焦恩伟-MilvusAI Native时代的数据库.pdf》由会员分享,可在线阅读,更多相关《Zilliz-焦恩伟-MilvusAI Native时代的数据库.pdf(24页珍藏版)》请在三个皮匠报告上搜索。
1、Milvus,AI Native时代的数据库焦恩伟 Zilliz席程师个简介Milvus 项的 maintainer,在 Zilliz 负责 Milvus 查询引擎相关研发作 Apache Kylin&OpenDAL&Databend contributor,前商业产品 Apache Kylin 和 MDX for Kylin 的研发负责。OLAP、数据库、数据以及开源商业化领域积累了多年的产品研发经验。上海交通学硕录为AI的数据库-向量数据库 向量数据库和LLM的结合 应场景 向量数据库的发展趋势为AI的数据库向量数据库AI是结构化数据分析的底座海量数据 基于概率的查询结果 语义信息于关键词
2、信息 CPU密集于IO密集 与AI态深度集成 批量写多于实时更新结构化数据分析的特点Milvus-全球第款开源向量数据库 分布式云原,基于K8s进微服务化设计 存储计算分离,弹性扩缩容 百亿级向量的扩展能 资源池化 GPU、CPU(x86)、CPU(arm)异构计算 SIMD 指令加速 多租户能-RBAC,Quota,资源组隔离 强的态具-GUI,CLI,监控,备份,CDC,迁移为云的向量数据库 Glass 是 Zilliz 研的向量检索库实验室版本,未开源 Knowhere 是前开源的 Milvus 依赖的内核 开源案 ScaNN/HNSW 三倍以上的性能提升性能优化-强可插拔的向量检索引擎
3、 基于列存和向量化执 持对 Json,Array 等动态数据类型进过滤,类 SQL 表达式实现 通过引代价评估,解决过滤时图的连通性问题 持对于标量数据构建倒排索引 标量向量混合查询 关键词和语义混合查询(WIP)混合查询 Milvus 与 Nvidia Rapids 合作,成为了全球了第个持 GPU 的向量数据库,相于 CPU 实现了3倍查询性能提升 Milvus 团队与 AWS Graviton 合作,利 ARM Neon 指令集加速,幅提升了向量检索在 ARM CPU 上执的性价Milvus 引擎在异构算上的尝试向量数据库和LLM的结合 在然语处理中,幻觉通常被定义为“成的内容与提供的源
4、内容意义或不可信”。Meta 将其定义为“信的假话”。模型的幻觉ChatGPT:使LLM上下推理 Vector Database:为LLM提供规模、可靠的知识库 Prompt as Code:使提示词为LLLM提供参考停幻觉-AIGC时代的CVP架构使场景应场景-模型增强应场景-GPTCache 缓存模型成的结果和Context 持多种向量/标量存储-如Milvus,FAISS,PGVector 持丰富的Embedding模型 持OpenAI以及本地部署LLamaCpp和Dolly应场景-多模态搜索 Meta AI Imagebind 持图像,本,频,深度,热度,惯性测量传感器等六个模态 多模
5、态搜索,Embedding语意叠加,多模态成 应场景 其他翻译 问答 语意检索本NLP标检测 以图搜图 图理解图像Image推荐 合规检测 视频分类视频Video物制药频控动驾驶向量数据库的未来向量数据库的发展趋势 更、更快、更稳 降低使成本 多模态、多向量持 DB for AI and AI for DB 从向量到通DB VS 通DB持向量向量数据库的未来-全托管SaaS Zilliz Cloud维护成本低low maintenance cost键创建实例资源 动态扩缩容 完善的监控报警 多云持使槛低Low threshold for use免费实例 可视化界 多语SDK 丰富的态持 数据迁
6、移丰富的企业级特性Enterprise-level features7*24服务持 99.9 SLA保障 数据备份,订阅 组织架构管理 Dedicated Cloud安全放Data SecurityRBAC权限管理 TLS,名单 PrivateLink 审计志 SOC2合规认证关注更多 Milvus&Zilliz 的信息Zilliz公众号扫码并回复“技术交流”加户交流群了解更多技术实践案例思博(msup)有限公司是家向技术型企业的培训咨询机构,携2000余位中外客座导师,服务