当前位置:首页 > 报告详情

阿里巴巴开源大数据平台演进之路-开源大数据与AI行业实践论坛(22页).pdf

上传人: 云闲 编号:84448 2021-01-01 22页 14.87MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文概述了阿里巴巴开源大数据平台的发展历程,由王峰(莫问),阿里云研究员和开源大数据平台负责人介绍。文章分为三个阶段: 1. **2009-2015年:** 阿里巴巴推出了第一代大数据平台“云梯”,基于Hadoop架构,实现了大数据的上云和实时化。 2. **2016-2021年:** 随着EMR(云上的Hadoop大数据平台)的发展,阿里巴巴解决了存储成本高、集群规划难和运维负担重等问题,通过EMR-2.0实现了数据湖存算分离架构,支持实时更新和云原生存储。 3. **大数据进入云原生时代:** 阿里巴巴利用Flink构建了实时大数据平台,支持实时化和离线一体化,推出了自研实时数仓(Hologres)和离线数仓(MaxCompute),实现了流批一体的计算引擎。 此外,阿里巴巴通过收购Flink创始公司Ververica,成为Flink社区的重要推动者,并在全球范围内得到了广泛应用。在Apache FY2020财年报告中,Flink在用户活跃度、代码提交次数和Github访问量方面均排名前列。 综上所述,阿里巴巴通过不断的技术创新和产品迭代,引领大数据技术从规模化向实时化演进,并在云原生大数据平台领域取得了显著的成就。
阿里巴巴大数据平台如何演进? 如何实现大数据的实时化和云原生? Flink 在阿里集团实时化数据中台中的应用如何?
客服
商务合作
小程序
服务号
折叠