《奇点云:OLAP数据库引擎选型白皮书(2023)(12页).pdf》由会员分享,可在线阅读,更多相关《奇点云:OLAP数据库引擎选型白皮书(2023)(12页).pdf(12页珍藏版)》请在三个皮匠报告上搜索。
1、O L A P 数 据 库 引 擎 选 型 白 皮 书1.1 OLAP数据库引擎概述1.2 OLAP数据库引擎选型过程中存在的问题1.3 如何更好地对数据库引擎进行选型?1.4 报告特色2.1 测评结果表2.2 测评综述 2.3 引擎评述2.4 产品选型指南评分标准 0102020304040513171.0 背景2.0 测评结果附录010417目 录C o n t e n t s1.0背景 OLAP(Online Analytical Processing,联机分析处理),主要应用于大规模数据分析及统计计算,为决策提供数据支持。OLAP数据库引擎贯穿于数据时代发展的 3个阶段。无论在哪一阶段
2、,当企业需要积累数据并进行数据分析时,就会面临 OLAP数据库引擎的选型问题。1.1 OLAP数据库引擎概述*.0203O L A P 数 据 库 引 擎 选 型 白 皮 书本次测评在数据构造及测试过程中充分考虑到泛零售、地产物业、智能制造、金融证券、政企的业务场景,数据构造方案来源于真实客户业务场景,评测维度充分考虑了引擎的易用性及可维护性。有以下特色:1.4 报告特色本次测评覆盖泛零售、地产物业、智能制造、金融证券、政企共五大行业的真实客户业务场景。测评过程中构造数据时,充分考虑了客户在选型时关注的主要业务场景,如泛零售行业的数据计算、BI报表、不同规模数据即席查询等;1.来自最佳实践除基
3、本的性能测评外,本次测评还关注到了数据安全、运维成本、元数据等维度;2.关注更多维度除了非国内研发软硬件环境下的测评结果,本次测评还兼顾国内研发软硬件环境下的测评结果;3.拥抱自主可控结合多年来对离线数仓、实时数仓和数据湖的实践经验,可以根据具体的业务需求和数据特点进行选择引擎;4.覆盖不同数据存储和处理模式通过客观的数据建模方式进行计算,整体结论客观中立;5.客观中立整体指标及选型模型设计时更加贴合 OLAP场景。6.专注于 OLAP目前市面上可选择的数据库类型越来越多,数据库呈多元选择趋势。在进行数据库引擎选型时,可选项繁多,而目前市面上可参考的选型标准较少,选型流程长,耗费成本高。1.选
4、项繁多,选型流程长开源数据库的成熟度开始逐渐超过商业数据库。虽然避免了高昂的服务费及license费用,但开源数据库在易用性、配套能力等方面存在一定缺陷,会产生额外的开发、部署、迁移等成本。因此,在选型过程中,除了考虑性能之外,运维成本、数据安全、生态影响力等维度也需要纳入考虑范围。2.开源逐渐成为大趋势,选型时需进一步考虑的维度增加在选型过程中,针对不同的业务场景和环节,分维度对不同数据库引擎进行测试和比对,能有效提升数据库引擎选型的效率。选型时需要综合考虑业务需求、性能、维护成本、数据安全等多种维度的信息。具体而言,至少需要考虑以下三个层面:1.3 如何更好地对数据库引擎进行选型?测试业务
5、场景要与企业的实际业务场景类似,这样提供的信息才能有效有效辅助决策者做出适合业务的决策;1.充分考虑业务相关性构造的数据集过于规则容易测试出较高的指标。但真实的环境,数据是有瑕疵和倾斜的。因此,在数据构造阶段需要充分理解客户的业务场景,并可尽量模拟出贴近真实应用场景的数据。3.保障测试数据真实有效基准测试一般有多个指标,不同业务场景关注的指标会有较大区别。在设计指标时候,需要充分考虑业务关注点;2.根据实际业务场景选择合适指标如何通过测试比对,找到最适合的数据库引擎?指标多维性数据真实性业务相关性中国数据库行业研究报告(2022年)显示,2021年中国数据库市场总规模达 286.8亿元,同比增
6、长16.1%。中国数据库市场虽受疫情影响,但整体稳步增长。数据库行业持续发展的同时,在数据库引擎选型的过程中也存在着以下问题:1.2 OLAP数据库引擎选型过程中存在的问题调研企业内部业务需求结合内部需求,对市场上的供应商进行调研及初筛调研结合初筛结果触达供应商商务触达供应商演示解决方案企业结合演示情况进行进一步筛选二次评估部分企业会通过POC项目进一步验证供应商的产品及实施能力POC采购0405O L A P 数 据 库 引 擎 选 型 白 皮 书2.0测评结果测评结果如下图,共 11个分析维度在查询、计算和分析三个场景的测评结果中,我们发现:Hive在国内研发软硬件环境综合性能表现为非国内