当前位置:首页 > 报告详情

大规模容器集群降本增效实践-谭霖 .pdf

上传人: 张** 编号:153161 2024-01-15 32页 4.98MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大规模容器集群的降本增效实践,以美团的基础研发平台为例,详细介绍了集群负载自动管理系统(LAR)的落地实践和在线集群调度的运营实践。 首先,文章指出全球数据中心资源利用率仅为10%~20%,存在大量资源浪费,提出了提高资源利用率的挑战与困难。其次,分析了美团业务的特征,包括在线服务的双峰特征和资源在时间和空间维度的闲置问题。 针对这些问题,文章提出了全局视角下的精细化管控解决方案,包括集群运营数据中心的数据支撑、多集群调度器的全局视角和调度策略优化,以及单机维度的资源隔离和管控能力提升。LAR系统通过分级资源池调度、负载分析预测和服务质量保障三个核心模块,实现资源的精细化管控。 此外,文章还介绍了资源运营模型,包括资源成本可见性、资源调度能力和资源利用率。并通过举例说明了容器负载异常处理策略和基于负载预测的资源用量资源分配策略调整。 最后,文章提出了在线集群调度的演进思考,包括数据驱动决策、服务质量数据获取、集群调度、系统内核和服务可观测性等多个领域的深度协同建设。同时,还探讨了集群调度待解决的需求,如基于裸金属的容器/VM融合、边缘场景实例调度优化等。
"如何提高数据中心资源利用率?" "如何实现集群负载自动管理系统(LAR)?" "如何优化在线集群调度的运营实践?"
客服
商务合作
小程序
服务号
折叠