《第五章 大数据融合数仓场景化解决方案.pdf》由会员分享,可在线阅读,更多相关《第五章 大数据融合数仓场景化解决方案.pdf(103页珍藏版)》请在三个皮匠报告上搜索。
1、版权所有 2019 华为技术有限公司 大数据融合数仓场景化解决方案 第2页版权所有 2019 华为技术有限公司 前言 随着大数据和物联网技术的迅猛发展,数据进入爆炸式增长期,原有数据仓库处理 分析的低扩展性、高扩展成本、单一数据格式、高时延,成为了客户挖掘数据金矿 的阻力。如何构建一个全新的数据仓库分析平台,集高扩展性、低扩展成本、处理 多种数据格式文件、低时延等特性,成为当下急需解决的问题。 第3页版权所有 2019 华为技术有限公司 目标 学完本课程后,您将能够: 区分数据库、数据仓库、融合数仓的概念 熟悉华为融合数仓在行业中的应用 描述GaussDB 200中的概念和架构 掌握Gauss
2、DB 200的基本用法 熟悉GaussDB 200的核心特性 第4页版权所有 2019 华为技术有限公司 目录 1.数据仓库与融合数仓 2.GaussDB 200 概述 3.GaussDB 200 6.5 新特性介绍 4.GaussDB 200 操作 5.融合数仓实战 第5页版权所有 2019 华为技术有限公司 数据库架构设计 Shared - Disk 各个处理单元使用自己的私有 CPU和Memory,共享磁盘系 统。 Shared - Nothing 各个处理单元都有自己私有的CPU/Memory/ 硬盘等,不存在共享资源,各处理单元之间通 过协议通信,并行处理和扩展能力更好。 Share
3、d - Everything 一般是针对单个主机,完全透明共享 CPU/Memory/IO,并行处理能力是最 差的。 数据库 架构设 计 第6页版权所有 2019 华为技术有限公司 数据库架构设计(续) 三者的区别如下所示: Disk DB SAN/共享存储 DBDBDBDB DBDBDBDB DiskDiskDiskDisk Shared - EverythingShared - DiskShared - Nothing 第7页版权所有 2019 华为技术有限公司 数据处理机制 主要分为OLAP和OLTP。 OLAPOLTP 用户决策人员、高级管理人员操作人员、低级管理人员 功能分析决策日常操作处理 DB设计面向主题面向应用 数据 历史的、聚集的、多维的、 集成的、统一的 当前的、最新的、细节的、 二维的、分立的 存取读上百万条记录读/写数十条记录 工作单位复杂的查询简单的事务 用户数上