当前位置:首页 > 报告详情

王晓川-腾讯 SRE 质量运营体系建设与实践.pptx

上传人: 2*** 编号:122060 2023-04-04 19页 10.96MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯SRE团队在质量运营体系建设与实践方面的经验。腾讯SRE团队负责质量运营、可观测、混沌工程等平台的研发工作,通过建立基于SLO与On-Call的质量运营体系,实现了产品稳定性的量化管理和持续改进。 核心数据:腾讯SRE团队已服务腾讯视频、QQ、腾讯文档、腾讯新闻、中台平台等几十个产品,上百个团队。1000+业务场景,3000+SLO指标。 关键点: 1. 建立基于SLO与On-Call的质量运营体系,解决产品稳定性无法量化和故障过程不透明的问题。 2. SLO管理:树立稳定性与功能迭代的评估关系,合理制定质量目标,面向用户场景。 3. On-Call管理:具备完整的理论与功能,已服务多个产品线和团队。 4. 大规模落地实践:建立SLO运营机制,降低SLO的配置成本,建立On-Call事件管理,提升故障自动发现比例。 5. 总结展望:实现科学的解决产品稳定性建设,推动标准化的产品与运营,客观描述产品稳定性,数据决策质量投入。
如何构建基于SLO与On-Call的质量运营体系? 腾讯鹅厂在质量运营实践中遇到了哪些挑战? 如何通过数据驱动提升故障自动发现比例?
客服
商务合作
小程序
服务号
折叠