您的当前位置: 首页 > 新闻中心 > 行业知识 > 数据中台、数据湖、数据仓库和BI是什么?具体区别是?

数据中台、数据湖、数据仓库和BI是什么?具体区别是?

1.数据中台

中台概念最早由中国国内公司阿里巴巴提出,其目的是为了解决大数据时代到来所引发的“数据孤岛”和“业务孤岛”问题。

阿里对中台的定义是:“中台是一个基础的理念和架构,用中台的思想建设、联通所有基础服务,共同支持上端的业务。”ThoughtWorks 认为:“中台是企业级能力复用平台。”李巍巍指出中台这概念产生的核心思想是“共享”与“复用”,意在通过中台分别与前后台相对应,还指出数据中台重要的不是技术和数据质量高低,应注重其所带来的数据思维和数据文化。

数据中台是一种架构,是一种连接前台和后台桥梁。通过中台将数据汇聚沉淀,快速响应前台业务需求。数据中台提供一种可复用的共性能力,将数据进行提炼,提供共性能力。其本质与 SOA(Service-Oriented Architecture,面向服务)一致,都是提供共性能力。但其实现方式与SOA不同,SOA以Web Service为载体,通过EBS(Enterprise Service Bus,企业服务总线)进行交互。

数据中台

2.数据湖

数据湖(Data Lake)这个术语由Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊(James Dixon)提出,他对数据湖的定义是,可以把所有的数据都放入数据湖中,应用数据时定义它的数据结构。也就是说,对于存储的数据,数据湖并不定义它的数据类型,这样数据湖就可以存储各种类型的数据,并且通过统一的存储,让不同的数据都有相同的存储方式,而在数据应用的时候定义其数据结构,让应用方便连接到数据湖上获取数据。

3.数据仓库

数据仓库的概念最早是由美国信息工程学家W.Hinmon博士所提出,其将数据仓库定义为:数据仓库是一个面向主题的、继承的、稳定的、随时间变化的、用来支持管理人员决策的数据集合。

4.BI

商务智能(BI,Business Intelligence)是一种以提供决策分析性的运营数据为目的而建立的信息系统。它将数据仓库、在线分析处理、数据挖掘等技术与客户关系管理等应用系统结合起来,并应用于企业活动实际过程当中,最终实现服务于管理层决策的目的。

5.数据仓库VS数据湖

在储存方面上,数据湖能处理所有类型的数据,如结构化数据,非结构化数据,半结构化数据等,数据的类型依赖于数据源系统的原始数据格式。数据仓库,主要处理历史的、结构化的数据,通常从事务系统中提取。

数据湖适用于深度分析,它拥有足够强的计算能力用于处理和分析所有类型的数据,可以做数据挖掘和数据分析。数据仓库主要是处理结构化数据,将它们或者转化为多维数据,或者转换为报表,以满足后续的高级报表及数据分析需求。

与数据仓库相比,数据湖缺乏结构性,而且更灵活,并且提供了更高的敏捷性。数据仓库具有高性能、可重复性的特点。

6、数据仓库VS数据中台

数据仓库的出发点为一个支撑性的技术系统,强调数据质量和元数据管理;而数据中台的第一出发点不是数据而是业务,更加注重思考业务问题需要什么样的数据服务。

在具体的技术处理环节,二者也有明显不同,数据的预处理流程正在从传统的ETL结构向ELT结构转变。传统的数据仓库集成处理架构是ETL结构,这是构建数据仓库的重要一环,即用户从数据源抽取出所需的数据,经过数据清洗,将数据加载到数据仓库中去。而大数据背景下的架构体系是ELT结构,其根据上层的应用需求,随时从数据中台中抽取想要的原始数据进行建模分析

7、数据仓库VS BI

商业智能BI相比于数据仓库,它是一个更大的概念。商业智能可以说是基于数据仓库,经过了数据挖掘后,得到了商业价值的过程。所以说数据仓库是个金矿,数据挖掘是炼金术,而商业报告则是黄金。数据仓库就像是 BI 这个房子的地基,搭建好 DW 这个地基之后,才能进行分析使用,最后产生价值。

以上梳理了数据中台、数据湖、数据仓库和BI的定义及其区别,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告行业知识栏目。

推荐阅读:

华为:数据湖治理中心-数据治理方法论(2021)(22页).pdf

数据湖建设解决方案(2022)(38页).pdf

【研报】通信行业海外云相关行业简析之Snowflake:全球领先云上数据仓库-20200921(27页).pdf

本文标签

本文由作者2200发布,版权归原作者所有,禁止转载。本文仅代表作者个人观点,与本网无关。本文文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关报告

马蜂窝:旅游直播时代——文旅生态洞察2020(21页).pdf
马蜂窝:旅游直播时代——文旅生态洞察2020(21页).pdf

1 2020旅游直播元年PART 1 “新冠”肺炎疫情开启全球“数字化生存” 直播是“云旅游”的最佳入口 直播帮助旅游行业积累“线上资产” 2020 旅游直播元年 1 3 2020旅游直播元年PART 1 “新冠”肺炎疫情 开启全球“数字化生存” 2020 年,面对突如其来的“新冠”肺炎疫情,众多国家边境封

【研报】计算机行业深度分析:重塑中国数字底座系列报告之数据库篇少年中国“甲骨文”-20200702[22页].pdf
【研报】计算机行业深度分析:重塑中国数字底座系列报告之数据库篇少年中国“甲骨文”-20200702[22页].pdf

1 少年中国“甲骨文”少年中国“甲骨文” 重塑中国数字底座系列报告之数据库重塑中国数字底座系列报告之数据库篇篇 数据库:现代企业不可或缺的数据库:现代企业不可或缺的基础软件基础软件。数据库是现代信息化管理的必然要求,是企业级用户交易数据、客户信息、存货库存等海量数据的载体。数据库本质是一款数据管理系统,除

名家汇:文旅夜游助力城市发展新引擎(28页).pdf
名家汇:文旅夜游助力城市发展新引擎(28页).pdf

文旅夜游助力城市发展新引擎深圳市名家汇科技股份有限公司 于飞灯光对城市的价值经济价值青岛上合峰会,共接待游客409.44万人次,同比增长35.8%灯光对城市的价值经济价值照明行业总产值近6千亿,超千万就业人口环境价值杭州G20夜景厦门金砖会议夜景青岛上合峰会夜景深圳夜景景观提升上海进博会夜景灯光对城市的价值

腾讯文旅:2018年旅游行业发展报告(62页).pdf
腾讯文旅:2018年旅游行业发展报告(62页).pdf

12019/1/10 20182018年年 旅游行业发展报告旅游行业发展报告 腾讯文旅团队腾讯文旅团队 & TalkingData & TalkingData 联合出品联合出品 20192019年年1 1月月 智慧旅游助力美好生活 22019/1/10 目录 CONTENTS 旅游行业发展背景- 03 01

哈啰出行-陈文博-高效团队底层设计.pdf
哈啰出行-陈文博-高效团队底层设计.pdf

主办方: 高效高效团队团队的底的底层设计层设计 陈陈文博文博 哈哈啰啰出行出行 高高级项级项目目经经理理 主办方: 陈文博 高级项目经理 “ CSM,Scrum Master by ScrumInc,现供职于哈啰出行 PMO 部门 历任程序员、技术经理、产品经理,近八年产品开发相关工作经验。 2019 年上

2019中国(上海)文旅产业发展高峰论坛PPT:沉浸体验点燃都市文旅新引擎.pdf
2019中国(上海)文旅产业发展高峰论坛PPT:沉浸体验点燃都市文旅新引擎.pdf

沉浸体验沉浸体验点燃点燃“ “都市文旅都市文旅” ”新引擎新引擎 主讲人:夏诞创意 刘育政 现象一:国家政策出台,大型文旅项目原有的捆绑供地和审批方式一去不复返 2018年4月,国家发改委、国土资 源部、环境保护部、住房和城乡建 设部和国家旅游局联合下发了关 于规范主题公园建设发展的指导意 见。指出要严控房

final2019抖音文旅行业数据报告.pdf
final2019抖音文旅行业数据报告.pdf

管业到整让每个美好之地2019都被看见2019抖音文旅行业大数据报告可业有#page#卷首语2019年,超过1.8亿用户在抖音上记录下他们的旅行生活从水上萌宠,到国宝熊猫从古城文化,到异国风情7.2亿支短视频成为美好旅程的影像志2019年的旅程已经过去,我们依托巨量引擎数据体系从文旅现象、用户、内容及创作生

客服
商务合作
小程序
服务号
折叠