当前位置:首页 > 报告详情

04-龙三-圆桌Autoscaling Flink at Netflix - Timothy Farkas, Netflix.pdf

上传人: li 编号:29699 2021-02-07 49页 2.22MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了Netflix如何针对其大规模的stateless single source and single sink Flink routers实施自动扩展。主要面临的问题是消费者延迟和处理速度不匹配,当延迟超过阈值时,会触发警报。文章提出了几种自动扩展的方法,包括基于历史预测、基于规则、PID控制器和基于统计的短期预测等。在实施自动扩展时,需要考虑的假设包括更倾向于过度分配而不是不足分配,平均消息大小变化不频繁,大型峰值负载不经常发生,工作负载通常平稳增加或减少。Netflix的自动扩展策略旨在保持最小的状态,确定性行为,易于单元测试和控制。在扩展过程中,收集各种指标,如Kafka消费者延迟、每秒处理记录数、CPU利用率、最大消息延迟等。此外,还涉及到了集群大小的决定、处理峰值的方法、性能表的构建以及分区平衡等内容。在实际应用中,Netflix选择了将自动扩展集成到Flink服务控制平面的方案,该方案可以处理所有资源管理器交互,并保留所有调整操作的历史记录。
"Netflix如何解决Flink路由器延迟问题?" 如何预测工作负载?" "Netflix如何优化Flink作业的自动扩展过程?"
客服
商务合作
小程序
服务号
折叠