1.数据中台
中台概念最早由中国国内公司阿里巴巴提出,其目的是为了解决大数据时代到来所引发的“数据孤岛”和“业务孤岛”问题。
阿里对中台的定义是:“中台是一个基础的理念和架构,用中台的思想建设、联通所有基础服务,共同支持上端的业务。”ThoughtWorks
认为:“中台是企业级能力复用平台。”李巍巍指出中台这概念产生的核心思想是“共享”与“复用”,意在通过中台分别与前后台相对应,还指出数据中台重要的不是技术和数据质量高低,应注重其所带来的数据思维和数据文化。
数据中台是一种架构,是一种连接前台和后台桥梁。通过中台将数据汇聚沉淀,快速响应前台业务需求。数据中台提供一种可复用的共性能力,将数据进行提炼,提供共性能力。其本质与
SOA(Service-Oriented Architecture,面向服务)一致,都是提供共性能力。但其实现方式与SOA不同,SOA以Web
Service为载体,通过EBS(Enterprise Service Bus,企业服务总线)进行交互。

2.数据湖
数据湖(Data Lake)这个术语由Pentaho公司的创始人兼首席技术官詹姆斯·狄克逊(James
Dixon)提出,他对数据湖的定义是,可以把所有的数据都放入数据湖中,应用数据时定义它的数据结构。也就是说,对于存储的数据,数据湖并不定义它的数据类型,这样数据湖就可以存储各种类型的数据,并且通过统一的存储,让不同的数据都有相同的存储方式,而在数据应用的时候定义其数据结构,让应用方便连接到数据湖上获取数据。
3.数据仓库
数据仓库的概念最早是由美国信息工程学家W.Hinmon博士所提出,其将数据仓库定义为:数据仓库是一个面向主题的、继承的、稳定的、随时间变化的、用来支持管理人员决策的数据集合。
4.BI
商务智能(BI,Business
Intelligence)是一种以提供决策分析性的运营数据为目的而建立的信息系统。它将数据仓库、在线分析处理、数据挖掘等技术与客户关系管理等应用系统结合起来,并应用于企业活动实际过程当中,最终实现服务于管理层决策的目的。
5.数据仓库VS数据湖
在储存方面上,数据湖能处理所有类型的数据,如结构化数据,非结构化数据,半结构化数据等,数据的类型依赖于数据源系统的原始数据格式。数据仓库,主要处理历史的、结构化的数据,通常从事务系统中提取。
数据湖适用于深度分析,它拥有足够强的计算能力用于处理和分析所有类型的数据,可以做数据挖掘和数据分析。数据仓库主要是处理结构化数据,将它们或者转化为多维数据,或者转换为报表,以满足后续的高级报表及数据分析需求。
与数据仓库相比,数据湖缺乏结构性,而且更灵活,并且提供了更高的敏捷性。数据仓库具有高性能、可重复性的特点。
6、数据仓库VS数据中台
数据仓库的出发点为一个支撑性的技术系统,强调数据质量和元数据管理;而数据中台的第一出发点不是数据而是业务,更加注重思考业务问题需要什么样的数据服务。
在具体的技术处理环节,二者也有明显不同,数据的预处理流程正在从传统的ETL结构向ELT结构转变。传统的数据仓库集成处理架构是ETL结构,这是构建数据仓库的重要一环,即用户从数据源抽取出所需的数据,经过数据清洗,将数据加载到数据仓库中去。而大数据背景下的架构体系是ELT结构,其根据上层的应用需求,随时从数据中台中抽取想要的原始数据进行建模分析
7、数据仓库VS BI
商业智能BI相比于数据仓库,它是一个更大的概念。商业智能可以说是基于数据仓库,经过了数据挖掘后,得到了商业价值的过程。所以说数据仓库是个金矿,数据挖掘是炼金术,而商业报告则是黄金。数据仓库就像是
BI 这个房子的地基,搭建好 DW 这个地基之后,才能进行分析使用,最后产生价值。
以上梳理了数据中台、数据湖、数据仓库和BI的定义及其区别,希望对你有所帮助,如果你想了解更多相关内容,敬请关注三个皮匠报告的行业知识栏目。
推荐阅读:
华为:数据湖治理中心-数据治理方法论(2021)(22页).pdf
数据湖建设解决方案(2022)(38页).pdf
【研报】通信行业海外云相关行业简析之Snowflake:全球领先云上数据仓库-20200921(27页).pdf