您的当前位置: 首页 > 新闻中心 > 行业知识 > 数据湖是什么?与数据仓库的区别在哪?易华录“数据湖+”应用场景介绍

数据湖是什么?与数据仓库的区别在哪?易华录“数据湖+”应用场景介绍

1 什么是数据湖

数据湖的概念最早是由“数据仓库之父”的 Bill Inmon提出,在其著作《数据湖架构》一书中,他提出通过设计数据湖来避免垃圾存储的概念。数据湖是存储原始数据的大型仓库,在数据湖中数据有很多不同阶段,数据湖的成功建立需要提供大规模数据接入、数据治理、数据服务和数据安全管理框架。

按照维基百科的定义数据湖是一类存储数据自然、原始格式的系统或存储,通常是对象块或者文件。数据湖通常是企业中全量数据的单一存储。使用数据湖解决方案,从结构化和非结构化数据中生成有意义的信息,并在市场中保持竞争力。

数据湖

2 建立数据湖的意义

数据湖是政府与社会资本合作,同时解决发展数字经济三个痛点的中国特色新基建方案

(1)存的起(蓝光存储):访问速度在分钟级、存储能耗在千分之三、存储成本只有6.5%、存储时间是100年。

(2)得得到:政府收储有序开放、社会数据留存共享、制定数据安全法律、建立地方要素市场

(3)用得好:企业依法获得数据、开放数据智能算法、开发数据应用场景、为数字化转型赋能

数据湖

3 易华录“数据湖+”战略的应用场景

(1)数据湖+大交通:公司作为智能交通龙头企业,可以基于数据湖中的政府数据,以及交通软件管理平台及电子车牌业务打造交通数据湖。 2020 年,公司中标哈尔滨智慧城市“交通云”平台服务项目,哈尔滨“交通云”城市交通大脑运用大数据、云计算、人 工智能等前沿技术,将“智慧治堵”作为先导性需求,建设城市数据大脑交通平台,实现智能感知路况、智能判定堵情、 智能巡查事件、智能优化配时、智能辅助指挥等五大基本功能。

(2)数据湖+大安全:目前研发了蓝鲸产品,基于人工智能分析,将摄像头数据导入数据湖,通过人脸识别精准锁定相关人员,良好辅助公安 部门侦破案件。公司在“智慧公安”项目建设中,面对技术难度大、工作时间紧、泛在感知数据接入复杂的状况,紧紧 围绕“智慧公安”体系化建设方案,积极解决技术难题、组织技术攻关,建起了智能化、实战化、一体化的“升级版技 防城”实战应用系统。

(3)数据湖+大健康:随着老龄化的加速,基于政府对老年人生活的重视,整合养老大数据,为老年人提供增值服务。

数据湖

4 数据湖与数据仓库的区别

(1)数据湖能能处理所有类型的数据,如结构化数据,非结构化数据,半结构化数据等,数据的类型依赖于数据源系统的原始数据格式;数据仓库只能处理结构化数据进行处理,而且这些数据必须与数据仓库事先定义 的模型吻合。 

(2)数据湖拥有足够强的计算能力用于处理和分析所有类型的数据,分析后的数据会被存储起来供用户使用;数据仓库处理结构化数据,将它们或者转化为多维数据,或者转换为报表,以满 足后续的高级报表及数据分析需求。

(3)数据湖通常包含更多的相关的信息,这些信息有很高概率会被访问,并且能够为企业挖掘新的运营需求。 数据仓库通常用于存储和维护长期数据,因此数据可以按需访问。

数据湖与数据仓库

推荐阅读:《【公司研究】易华录-数据湖基建龙头于波澜之中把握新机遇-210604(32页).pdf》

《【4】基于Flink+Iceberg构建企业级实时数据湖-胡争-阿里巴巴.pdf》

《数据湖技术IceBerg如何解决腾讯看点业务痛点v5.pdf》

本文由作者C-C发布,版权归原作者所有,禁止转载。本文仅代表作者个人观点,与本网无关。本文文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

相关报告

【研报】新基建通信行业投资策略:5G和数据中心的投资机会-20200429[54页].pdf
【研报】新基建通信行业投资策略:5G和数据中心的投资机会-20200429[54页].pdf

通信基建新周期,新起点:通信基建新周期,新起点 3.IDC:云计算加速渗透持续释放增量需求

【研报】科技行业云计算和数据产业链系列报告13:中国数据中心IDC REITs化的机遇与挑战-000504[17页].pdf
【研报】科技行业云计算和数据产业链系列报告13:中国数据中心IDC REITs化的机遇与挑战-000504[17页].pdf

证券研究报告 请务必阅读正文之后的免责条款 中国数据中心中国数据中心 IDC REITs 化化的机遇与挑战的机遇与挑战 云计算和数据产业链系列报告 132020.5.4 中信证券研究部中信证券研究部 许英博许英博 科技产业首席分析师 S1010511080004 陈俊云陈俊云 前瞻研究高级分析师 S101

【研报】互联网行业云计算和数据产业链系列报告15:Atlassian(TEAM)全球领先的项目管理SaaS厂商-20200515[20页].pdf
【研报】互联网行业云计算和数据产业链系列报告15:Atlassian(TEAM)全球领先的项目管理SaaS厂商-20200515[20页].pdf

证券研究报告 请务必阅读正文之后的免责条款 Atlassian( (TEAM) :全球领先的项目管理:全球领先的项目管理 SaaS 厂商厂商 云计算和数据产业链系列报告 152020.5.15 中信证券研究部中信证券研究部 核心观点核心观点 许英博许英博 科技产业首席分析师 S1010510120041

【研报】通信行业海外云相关行业简析之Snowflake:全球领先云上数据仓库-20200921(27页).pdf
【研报】通信行业海外云相关行业简析之Snowflake:全球领先云上数据仓库-20200921(27页).pdf

【国信国信通信通信 海外云相关行业简析之海外云相关行业简析之】 Snowflake:全球领先云上数据全球领先云上数据仓库仓库 2020年9月21日 证券分析师:程成 E-MAIL: 证券投资咨询执业资格证书编码: S0980513040001 证券研究报告证券研究报告 证券分析师:陈彤 E-MAIL: 证券

未来宇航研究院:2018中国商业航天产业投融资报告.pdf
未来宇航研究院:2018中国商业航天产业投融资报告.pdf

1 2 3,571,000,000 36 3 4 5 6 7 8 新 航 天 新 生 态

【研报】数据仓库系列~医药行业2020年疫苗批签发总结:后疫情时代行业持续高景气-210121(36页).pdf
【研报】数据仓库系列~医药行业2020年疫苗批签发总结:后疫情时代行业持续高景气-210121(36页).pdf

中信证券研究部中信证券研究部 20202020年年1 1月月2121日日 中信证券数据仓库系列中信证券数据仓库系列 医药行业医药行业2020年疫苗批签发总结年疫苗批签发总结 后疫情时代,行业持续高景气后疫情时代,行业持续高景气 注:本报告中疫苗批签量相关数据来自中国食品药品检定研究院(简称中检院); 图片中

58-刘笠熙-深度业务结合和数据驱动下的商业智能化能力建设.pdf
58-刘笠熙-深度业务结合和数据驱动下的商业智能化能力建设.pdf

主办方: 深度业务结合和数据驱动下的 商业智能化能力建设 刘笠熙 58同城 算法架构师 主办方主办方: 刘笠熙 58同城 算法架构师 “商业生态与智能发展中心-策略技术团队算法架构师 目前负责58集团在线广告系统核心算法和策略机制的设计与优化, 研究方向包括搜索意图理解,个性化召回,搜索相关性,兴趣相关 性

客服
商务合作
小程序
服务号
折叠