当前位置:首页 > 报告详情

张蛟-小米基于 Flink 的稳定性优化与实践.pdf

上传人: 云闲 编号:101914 2021-01-01 37页 44.57MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了小米公司在其业务中使用Apache Flink的稳定性优化和实践经验。Flink在小米被用于广告、推荐、搜索等业务的数据查询与存储、计算层以及消息队列处理。文章指出,小米面临并解决了一些挑战,如作业内存不可控导致的YARN OOM Kill问题、YARN模式下的自动平滑重启困难、HistoryServer磁盘占用问题等。 稳定性优化方面,小米采取的措施包括Cgroup内存管理、JDK升级、OOM-Listener监听、Checkpoint优化、TaskManager日志优化等。这些优化减少了作业的OOM kill重启次数,实现了平滑重启,并提升了资源利用率。 在运维优化方面,小米针对Flink HistoryServer进行了优化,解决了历史日志文件系统不支持过期的问题,并实现了日志的自动迁移。 未来规划上,小米旨在进一步提高资源利用率和作业稳定性,计划实现自动弹性伸缩容,减少运维压力,并优化大状态作业速度和性能。此外,小米还将关注批流融合能力,以及继续完善对Batch模式和数据湖的支持。
"Apache Flink在小米的实践如何提升稳定性?" "小米如何通过Flink优化运维并提高资源利用率?" "未来小米对Flink的规划有哪些?有何创新实践?"
客服
商务合作
小程序
服务号
折叠