当前位置:首页 > 报告详情

赵禹-知乎K8S稳定性建设实践.pdf

上传人: 2*** 编号:131973 2023-06-30 29页 4.41MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了知乎在Kubernetes(K8S)稳定性建设方面的实践和经验。知乎的K8S负责人赵禹,具有丰富的DevOps和云原生领域工作经验,负责知乎的K8S及云原生建设相关工作。 知乎的云原生架构经历了从业务容器化、Mesos注册中心、HAProxy到Kubernetes中间件容器化、数据库容器化、ServiceMesh等阶段的演进。目前,知乎拥有10多个Kubernetes集群,涉及基础组件集群、业务集群及训练、推理服务专用集群。 在K8S稳定性建设方面,知乎遇到了如Apiserver雪崩、镜像仓库挂掉等问题,并针对这些问题进行了系统化的解决。如:改造Kubernetes集群、优化系统能力、增强资源兜底能力、改进基础组件等。 此外,知乎还构建了多云管控平台,提升了多集群的可观测性,并实现了弹性调度组件,支持弹性伸缩和非K8S节点的自愈。 经过一系列的改造和建设,知乎的K8S稳定性得到了显著提升,资源使用更加均衡,预警与监控更加精准,有效保障了业务的稳定高效运行。未来,知乎将继续在网络可观测性、数据集调度、多云多集群基础能力等方面进行优化和探索。
"K8S稳定性建设实践有哪些阶段和案例?" "知乎如何应对K8S稳定性问题和故障?" "K8S稳定性建设给知乎带来了哪些收益和改善?"
客服
商务合作
小程序
服务号
折叠