当前位置:首页 > 报告详情

郭旻欣-江苏电信 IT 运维转型之 SRE 体系建设实践.pdf

上传人: 2*** 编号:122109 2023-04-04 33页 5.28MB

报告标签

SRE体系建设实践
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
江苏电信IT运维转型之SRE体系建设实践,主要内容包括: 1. 面临挑战:系统变革、运维团队分散、缺乏集约化运维工具、运维流程管理混乱、IT运维规范不完善。 2. 构建稳定运营保障体系:围绕“故障次数、时长双压降”一个目标,依托四大运营驱动力,聚焦三个阶段,形成“规范、动作、能力”三统一运营体系。 3. 运营专项行动:组建SRE运营团队,用好数字化工具,加强运维流程管控,做实检查奖罚并举,健全IT运维规范。 4. 团队组建:运营管理团队、一线运维团队、二线运维专家团队。 5. 摸清家底:CMDB资产全面梳理,建立精准纳管三层资源数据。 6. 集中调度:全层级监控,告警集中调度与闭环管控。 7. 集约流程管控:风险操作流程、风险隐患流程、应急预案流程、故障管理流程。 8. 智能运维工具:构建三屏联动可观测平台,基于RPA技术打造数字哨兵,移动端半自动化故障自愈工具,AI场景应用,智能告警关联分析。 9. 构建系统四级应急体系:分布式缓存全阻、第三方支付通道故障、K8S集群故障、生产机房故障。 10. 构建SRE系统运营能力评估体系:分数驱动,定级奖惩,评估细则,动态调整。 11. 加强IT运维规范沉淀和执行:确立一心两翼一抓手,夯实五个基础,固化四项流程,规范宣贯,迭代沉淀。
江苏电信如何构建SRE运维体系? 江苏电信如何实现故障次数和时长双压降? 江苏电信如何通过运维规范提升运维效率?
客服
商务合作
小程序
服务号
折叠