《韧性系统建设生命周期框架及分析方法.pdf》由会员分享,可在线阅读,更多相关《韧性系统建设生命周期框架及分析方法.pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。韧性生命周期和分析框架在亚马逊云科技云上构建韧性系统的模型Neeraj KumarNeeraj Kumar亚马逊云科技首席技术专家谷雷亚马逊云科技资深解决方案架构师 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。如何在云上结构建韧性应用系统高可用设计和运行可抵御故障常见的主站点容灾对于于本地高可用系统无法应对,在指定的目录内在备用站点恢复复习系统运行中核心服务满意足部业务可用的性指指
2、标备份,容量,数据保管箱可控的 RTO/RPO持续提高从预览部测试转向混合工程模式思维模式韧性是系统发高负载、攻击和故障引发的中断时,持续运行并快速恢复重复能力。2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。关于构建韧性系统的五个关键教训5 key lessons on building resilient systems5 key lessons on building resilient systems韧性是一个连续过程,不会一蹴而就、但会慢慢崩塌;在复杂的分布式系统中,失败是不可避免的,要主动应对;建立韧性系统需要人员、流程和技术齐心协力;正确设置
3、 DevOps 是关键 超过 2/3 的失败是由部署不当造成的!采用故障隔离以减少故障发生时的影响。Resilience is a continuumFailures are inevitable in complex,distributed systems embrace them.Building resilience requires people,process and technology working together in alignment Getting DevOps right is key-more than 2/3 of failures are caused by
4、bad deployments!Adopt fault isolation to reduce the impact of failures,when they happen 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。每小时的停机成本The cost of downtime per hourThe cost of downtime per hour91%的企业30 30 万美元44%的企业100 100 万美元18%的企业500 500 万美元业务频繁中断的公司 比停机时间较少公司,需付出16 倍的成本。Companies with frequent
5、 outages face costs up to16x higher than those with fewer downtime.for 91%of enterprises$300K$300Kfor 44%of enterprises$1M$1Mfor 18%of enterprises$5M$5M 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。总结LearningLearning响应RespondingResponding监控MonitoringMonitoring预测AnticipateAnticipate Resilience Engineer
6、ing in Practice 作者:Hollnagel,Paris,Woods,Wreathall韧性系统的四项基本功能Four essential capabilities in a resilient systemFour essential capabilities in a resilient system 2024,Amazon Web Services,Inc.或其附属公司。保留所有权利。亚马逊韧性系统建设生命周期The Amazon resilience lifecycleThe Amazon resilience lifecycle在与客户和内部团队展开多年合作的基础上,亚马