当前位置:首页 > 报告详情

2、刘迪珊-美团基于流批一体构建增量数仓生产实践.pdf

上传人: 云闲 编号:101912 2021-01-01 39页 36.02MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了美团在数仓生产实践中,基于流批一体构建增量数仓的方法。主要内容包括:项目目标、核心设计与实现、计算能力优化和未来展望。 项目目标方面,美团旨在实现数仓生产时效性的提升,从T+1到分钟级,以及特征生产主流程的落地。同时,建立支持批量和增量读写的存储引擎,使Flink支持对存储引擎的增量读写,并提升Flink在高压场景下的处理能力和稳定性。 核心设计与实现方面,Flink作为增量生产的计算引擎,采用了流批一体的架构,实现了离线实时数据的统一计算。主要技术包括Kafka、Flink、HDFS/HIVE等。同时,文章详细介绍了增量读写的必要性、批读的必要性、Upsert的必要性以及事务的必要性等。 计算能力优化方面,美团针对Flink大作业部署和状态稳定性进行了优化实践,如Join算子优化等。 未来展望方面,美团将继续优化Beluga存储层,降低数据可见性延迟,支持点读,并扩展Flink计算状态容量,利用增量存储进行冷数据的访问更新。
"流批一体如何提升数据时效性?" "Flink在增量数仓中的关键作用是什么?" "如何优化计算任务以保持数据一致性?"
客服
商务合作
小程序
服务号
折叠