1、 弘则弥道(上海)投资咨询有限公司科技科技 智造 消费 医药20232023年年1212月月弘则计算机弘则计算机生成式生成式AIAI驱动向量数据库驱动向量数据库加速发展加速发展对于AI产业趋势的思考弘则研究科技组弘则研究科技组电话:电话:021-6194-6708021-6194-6708心在远方,路在脚下核心观点提示核心观点提示 toBtoB生成式生成式AIAI应用均需外挂知识库以提升大模型精度,将驱动向量数据库的爆发应用均需外挂知识库以提升大模型精度,将驱动向量数据库的爆发。向量数据库是非结构化数据的特殊形式,它的核心是将各种数据(如文档、音频和视频)转化为空间向量进行相似性搜索以提高不同
2、数据类型的搜索效率和准确性,这使其在AI和深度学习领域中有着广泛的应用。生成式AI出现后,尤其是在toB场景中需要应用到向量数据库在大模型上外挂“企业知识库”,企业内部数据将被存储在向量数据库中,以提升大模型精度。向量数据库潜在市场空间是传统结构化关系型数据库的数倍达到千亿美元。向量数据库潜在市场空间是传统结构化关系型数据库的数倍达到千亿美元。据信通院统计数据,全球数据库市场规模在2020年为671亿美元,到2025年有望达到798亿美元,CAGR 3.5%,估算关系型数据库全球龙头Oracle收入规模小几百亿美元。仅考虑现有非结构化数据的向量化处理,估算需要的存储空间增量为之前的数倍。未来随
3、着生成式AI应用增量数据的爆发,对于向量数据库的需求会更大。产业处在发展早期,尚未形成寡头垄断,厂商具备错位竞争优势。产业处在发展早期,尚未形成寡头垄断,厂商具备错位竞争优势。全球市场不同背景厂商以不同商业模式切入向量数据库赛道。美股上市公司中,MongoDB于今年12月在自身非结构化数据库业务基础上推出向量数据库产品Atlas Vector Search,Elastic于今年5月在自身搜索工具业务基础上推出向量搜索解决方案Elasticsearch Relevance Engine。最新业绩说明会中,两家公司均对向量数据库业务前景非常乐观。A股上市公司中,星环科技于今年5月推出向量数据库Hi
4、ppo,目前已迭代到1.2版本,已有客户开始试用。1oXjXbWuYnYrUdYsUpZlW9P8QaQmOqQsQnOfQqRoMjMpOrN9PmMxOvPoNqOMYmRpR心在远方,路在脚下向量数据库作为向量数据库作为B B端端Gen AIGen AI落地刚需,已经进入到商业化推广和落地刚需,已经进入到商业化推广和落地阶段落地阶段2向量数据库上市公司向量数据库上市公司来源:互联网公开资料、弘则研究整理公司公司产品更新和商业化更新产品更新和商业化更新MongoDBMongoDB23年12月正式发布Atlas Vector Search功能,以向量数据库切入生成式AI产业;FY24Q2业绩
5、会:“向量数据库处于预览阶段,但已经看到大型客户的极大兴趣向量数据库处于预览阶段,但已经看到大型客户的极大兴趣,包括某咨询公司允许顾问在超过150万份专家纪要中进行语义检索。”FY24Q3业绩会:“人工智能几乎存在于与各种规模的客户的每一次对话中。客户对矢量搜索公共预人工智能几乎存在于与各种规模的客户的每一次对话中。客户对矢量搜索公共预览版非常感兴趣览版非常感兴趣。客户正在构建一系列人工智能用例,从语义搜索到检索增强生成。客户正在构建一系列人工智能用例,从语义搜索到检索增强生成。例如,UKG为全球超过 80,000多家客户提供服务,选择使用MongoDB Atlas Vector Search
6、作为人工智能助手,帮助指导客户的员工、职能经理和人力资源主管。”ElasticsearchElasticsearchElastic官方从2018年开始支持向量检索功能,23年5月推出ESRE(Elasticsearch Relevance Engine),目前作为8.8版本的一部分,所有功能会随白金级套餐和企业级套餐一起提供;FY24Q1业绩会:“我们看到围绕生成式AI的大量活动,许多客户选择ESRE作为使用我们的向量搜索和混合搜索功能构建生成式AI应用程序的平台。目前有数百名付费客户使用目前有数百名付费客户使用 ESRE ESRE 进行向量搜索。进行向量搜索。”FY24Q2业绩会:“Elas