1、云原生数据库和数据分析的首要考虑因素借助容器和 Kubernetes 加速交付云原生数据库和数据分析的首要考虑因素|1什么是数据库和数据分析?数据库和数据分析是现代云原生应用的关键组成部分。数据库用于存储重要信息,如分析数据、流数据和交易数据。Microsoft SQL Server 和 MySQL 等关系数据库按照定义好的行、列和单元格位置关系将数据存储在表格中。相比之下,像 MongoDB、Couchbase 和 Cassandra 这样的非关系型数据库以灵活的非表格形式存储数据,支持更多不同类型的数据。数据分析是指从多个来源接入、处理、转换和分析数据的一组技术功能。流行的数据分析工具包括
2、 Apache Kafka、Apache Nifi、红帽 AMQ 流、Presto 和 Apache Spark。在各行各业中,云原生应用都可以帮助企业打造差异化竞争优势。企业利用云原生应用来提供移动服务,支持电子商务和分析业务指标,并将人工智能(AI)和机器学习(ML)应用于业务运营。所有这些用例都依赖数据来实现商业价值,可见数据库和数据分析功能是云原生应用不可或缺的组成部分。因此,数据库和数据分析工作负载必须与其支持的应用具备多种相同的特征。他们必须:在设计上支持快速部署、更新和变更。弹性扩展以满足不断变化的需求。在数据中心、云和边缘 IT 基础架构上一致运行。数据驱动云原生应用各行业数据
3、库和数据分析用例医疗卫生 面向临床医生和患者的移动应用 医疗记录管理 医院设备管理金融服务 手机银行服务 欺诈检测 风险分析能源 商业应用 客户需求预测政府 公共服务的移动应用 公共服务的网络门户 人口相关趋势的地理空间分析制造和物流 资产和库存管理 航线分析云原生数据库和数据分析的首要考虑因素|2通过敏捷的部署、管理和扩展,容器和 Kubernetes 可以帮助您加快关键架构组件的云原生开发,包括数据库和数据分析。容器是一个基本的软件单位,它将应用与其所有依赖项打包。容器简化了应用的构建过程,并允许应用在不同环境中部署而无需进行更改。Kubernetes 是开源且可扩展的容器编排器。容器编排
4、涉及管理整个环境中容器的创建、部署和生命周期。自助服务功能让开发人员轻松快速地置备他们构建云原生应用所需的资源和服务。这些技术共同提供了云原生数据库和数据分析工作负载所需的敏捷性、可扩展性和可移植性。加速数据库和数据分析工作负载的开发和部署敏捷性快速部署、测试、更新和管理数据库和数据分析工作负载,以应对不断发展的市场需求。可扩展性动态和弹性地扩展计算资源,以满足数据库和数据分析工作负载波动的需求。可移植性在整个环境中部署容器化的数据库和数据分析工作负载,并随着需求的变化轻松移动。1 云原生计算基金会(CNCF)。“2020 年 CNCF 调查”,2020。2 Datadog。“关于容器实际使用
5、的 11 个事实”,2020 年 11 月。3 Flexera。“2020 年 Flexera 云状况报告”,2020 年 4 月。前 10 名中有 6 种在容器中运行的商用镜像是数据库和数据分析工作负载2。55%的企业在生产环境中的容器中运行有状态应用1。85%的企业正在使用或计划使用 Kubernetes3。云原生数据库和数据分析的首要考虑因素|3在云原生应用中实施数据库和数据分析涉及数个步骤和工具。数据生命周期的主要步骤有:1.数据接入。从多个来源和设备中收集数据。2.初步数据存储。将接入数据存储在操作数据库或数据湖中。3.数据准备。处理存储的数据,丢弃不需要的数据,并将需要的数据转换成
6、偏好的格式。4.用于分析的数据存储。将经过处理和清理的数据存储在一个单独的数据库或数据仓库中,以便进一步分析。5.数据分析。应用数据分析技术和工具来生成洞察。一个开放、适应性强的架构将帮助您更有效地执行这个过程。这个架构需要几项关键技术。数据管理工具从多个来源接入、处理和分析数据以提供洞察。从收集到使用的整个过程中,数据库、数据湖和数据仓库在云原生应用中存储数据。容器和 Kubernetes 平台为在整个基础架构中部署数据库、数据分析工具和云原生应用提供一致的基础,并且为开发人员和集成计算加速提供自助服务功能。软件定义的基础架构在混合云环境中(包括数据中心、边缘和公共云)为云原生应用开发和部署