1、融合SQL、向量和文档的多路召回数据库D Di in ng go oD DB B多多模模数数据据库库胡宗星北京九章云极科技有限公司自 主 创 新 引 领大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会A AG GI I时时代代的的数数据据架架构构演演进进基基于于D Di in ng go oD DB B的的R RA AG G实实践践D Di in ng go oD DB B技技术术架架构构0 01 10 02 20 03 3目目
2、 录录C Co on nt te en nt ts s大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会A AG GI I时时代代的的数数据据演演进进C Ch ha ap pt te er r 0 01 1大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会数数据据架架
3、构构的的演演进进企业数据New Data Stack(2023)Data Warehouse(20082015)Data Lake(20162022)数据规模数据模态数据分析复杂度SQL、OLAP、统计、机器学习、深度学习、自助分析、分析建议、AIGC、AutoMLGPT结构化表表语义与文件多模与向量世界知识与行业数据主题数据大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会N Ne ew w D Da at ta a S St
4、ta ac ck k时时代代的的数数据据地地图图经CDC到OLAP库OLAP DB via CDC应用软件Applications事件捕捉Event Collectors日志报告Logs第三方数据接口3rd Party APIs文件及对象存储File&Object Storage数据连接器Connectors数据建模Data Modeling工作流管理Workflow Manager事件流Event Streaming流处理Stream Processing人工智能与大模型平台AI&LM Platform大模型LLM即席查询引擎Ad Hoc Query Engine实时分析Real-time
5、AnalyticsBI仪表盘Dashboard嵌入式分析Embedded AnalyticsAPP开发框架App Frameworks增强分析Augmented Analytics自助分析程序Self-service Apps生成式AI应用AIGC App元数据管理Metadata Management查询及测试Query&Testing授权与安全管理Entitlements&Security可观测性Observability向向量量海海Vector Ocean向量搜索与分析Vector search&Analytics计算引擎平台Spark Platform算子与代码库Operators&c
6、ode libs批量查询引擎Batch Query Engine大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会大数据技术标准推进委员会N Ne ew w D Da at ta a S St ta ac ck k时时代代的的数数据据地地图图经CDC到OLAP库OLAP DB via CDC应用软件Applications事件捕捉Event Collectors日志报告Logs第三方数据接口3rd Party APIs文件及对象存储File&Object