当前位置:首页 > 报告详情

王非凡、冯斐-美团Flink大作业部署与状态稳定性优化实践.pdf

上传人: 云闲 编号:101916 2021-01-01 55页 12.21MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了美团数据平台工程师在Flink大作业部署与状态稳定性优化方面的实践。主要内容包括: 1. 大作业部署优化:分析了作业部署过程中存在的问题,如JobManager部署Task过程耗时、TaskManager上Task分布不均等,并提出了相应的优化策略,如优化User Jar分发、减少RPC超时等。 2. Checkpoint跨机房副本:为满足关键作业的机房级别容灾需求,提出了Checkpoint跨机房副本方案,包括Checkpoint的自包含性和可移动性,以及副本制作服务的实现。 3. 状态稳定性相关优化:介绍了状态稳定性相关的其他优化,如RocksDBStateBackend内存泄漏问题、Savepoint导致增量Checkpoint退化问题等,并提出了相应的解决方案。 4. 未来规划:提出了稳定性建设和运行性能优化的未来规划,包括作业断流恢复时间优化、状态后端性能提升等。
如何优化大规模作业部署? 如何实现Checkpoint跨机房副本? 如何提升Flink状态稳定性?
客服
商务合作
小程序
服务号
折叠