当前位置:首页 > 报告详情

武安闯-B站 SRE 转型历程与可靠性工程实践.pdf

上传人: 2*** 编号:132045 2023-06-30 24页 4.01MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Site Reliability Engineering(SRE)的概念、转型方法、可靠性框架以及工程实践。SRE是由Google提出的,旨在通过软件工程的思维和方法论,设计和自动化取代人工操作,解决团队大小与系统负载成线性增长、研发变更效率与运维服务稳定性之间的矛盾。SRE团队将50%的精力用于开发工作,成功的关键在于对工程的关注。SRE转型中,应避免重复性、可预测的任务,关注工程化、自动化,并逐步实现全员Oncall和琐事优化。SRE的转型和维护服务相关的关键点包括文化、自动化、精益、测量和分享。SRE与传统运维和DevOps的区别在于,SRE更注重工程化和对可靠性工程的关注。SRE的实践包括故障生命周期管理、高可用架构设计、技术风险、质量运营等。此外,文章还详细介绍了SRE的可靠性框架,包括高可用架构、技术风险和质量运营等方面。最后,文章提到了SRE的工程实践,如多活容灾、SLO和故障快恢等。
"SRE转型如何保驾护航?" "高可用架构如何实践?" "如何构建质量运营体系?"
客服
商务合作
小程序
服务号
折叠