当前位置:首页 > 报告详情

how-to-increase-the-throughput-of-kubernetes-scheduler-by-tens-of-times-kuberneteshoy-jzha-hao-pan-yuquan-ren-bing-li-bytedance.pdf

上传人: 山海 编号:627255 2025-04-21 27页 17.65MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了如何通过Gödel调度系统提高Kubernetes调度器的吞吐量。在超大规模集群中,原始的Kubernetes调度器无法支持超过100 Pods/s的调度能力,也无法通过大规模集群中的共置进一步提高资源利用率。Gödel调度系统旨在统一处理在线和离线(如机器学习、流处理和批处理)工作负载,通过优化数据结构和算法,将单片性能提高到极致。它采用增量更新的GenerationStore来同步数据,并将现有存储迁移至该存储系统。在20K+节点和1M+ Pods的集群中,Gödel优化了调度算法,将大多数Pod的调度延迟降低超过50%,并减少了评估节点,同时并未显著降低可行节点。通过预emption优化,Gödel能够在2ms内过滤掉非可抢占的案例,实现了整体吞吐量的10倍提升。此外,通过单位语义和框架优化,如DaemonSet的快速定位和应用单元的聚合,E2E延迟得到了显著抑制。未来工作包括优化组件间通信机制、更通用的批处理调度以及更合理的插件和存储实现分离等。
如何通过Gödel调度系统提高Kubernetes的调度吞吐量? Gödel优化中,数据同步的具体改进措施是什么? 在大规模集群中,如何通过应用单元聚合提高调度效率?
客服
商务合作
小程序
服务号
折叠