当前位置:首页 > 报告详情

4、李劲松-基于 Flink Dynamic Table 构建流批一体数仓.pdf

上传人: 云闲 编号:101913 2021-01-01 31页 4.43MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里巴巴技术专家李劲松基于Flink Dynamic Table构建流批一体数仓的业务痛点、动态表、流式数仓、业务需求以及解决方案。 关键点如下: 1. 业务需求:实时数仓构建中,需要实现Streaming ETL搭建实时数仓,支持即席查询与数据订正,以及新增实时业务指标。 2. 业务痛点:现有解决方案中,Kafka成本昂贵且难以查询,流计算难以使用,流批一体难以达成,导致系统复杂度高、运维成本高、学习成本高、不同系统难以打通。 3. 动态表:Flink动态表能重新思考流和批的关系,实现流批一体的存储和处理,提供统一的流存储和批存储,满足所有实时用户案例,存储易用且直接查询DFS,全面支持SQL。 4. 流式数仓:流式数仓能实现流写和流读,提供最好的Log Connector,支持实时和历史的OLAP查询,以及离线的数据订正和分区重刷,同时支持上线新业务和新增实时指标。 5. 解决方案:Flink 1.15推出了MVP版本,后续将支持Lookup和Join Engine,以解决现有解决方案中的问题。
"Flink动态表如何实现流批一体?" "流式数仓如何满足实时与离线需求?" "动态表如何优化流计算与存储成本?"
客服
商务合作
小程序
服务号
折叠