当前位置:首页 > 报告详情

1-董亭亭-快手基于Apache  Flink的持续优化实践-TSY.pdf

上传人: li 编号:29291 2021-02-07 24页 1.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了快手在基于Flink的实时计算领域的优化实践。快手针对Flink任务启动、稳定性、SQL实践与优化、故障恢复等方面进行了深入研究和改进。具体关键点如下: 1. Flink任务启动优化:通过自研Hawk系统和Yarn整合,实现任务快速故障发现和恢复,目标是在20秒内完成任务自动恢复。同时,优化了任务启动过程,减少IO交互,实现20秒内完成任务启动。 2. Flink稳定性持续优化:针对Flink Kafka Connector和Flink Kafka Source,实现了双机房读写、一定比例数据丢失容忍以及一键丢弃历史lag等功能。同时,优化了Flink Kafka Sink的双集群写策略,支持轮询和主从策略。 3. Flink SQL实践与优化:快手将Flink SQL任务占比提升到30%,个数达到360个,峰值处理条目数达到4亿/秒。通过MiniBatch Aggregation、Local Global Aggregation和Split Distinct Aggregation等优化方法,解决了实时计算中的倾斜问题。同时,通过UDF函数复用,提高了SQL性能。 4. 未来工作:快手将继续探索集群整体资源利用均衡性、Flink任务内调度均衡性以及Flink任务资源使用合理性。此外,将继续推广Flink SQL,提高SQL任务稳定性和资源利用率,并探索流批统一的技术方向。
"Flink如何优化Kafka连接器的高可用性?" "Flink SQL如何实现倾斜问题的优化?" "未来工作中,Flink在流批统一方面的探索有哪些?"
客服
商务合作
小程序
服务号
折叠