1、全球敏捷运维峰会广州站金融行业MySQL高可用实践全球敏捷运维峰会广州站金融行业MySQL高可用方案选型12爱可生金融级MySQL高可用方案2某大型国有银行MySQL高可用实践3目录CONTENTS全球敏捷运维峰会广州站301 金融行业MySQL高可用方案选型全球敏捷运维峰会广州站4金融行业MySQL高可用需求衡量数据一致性(RPO)?业务连续性(RTO)?同步力度?业务性能?业务规模?可维护性?全球敏捷运维峰会广州站5金融行业信息系统平台灾备等级要求数据来源-中华人民共和国金融行业标准 JR/T 01682018等级依据:影响的广度和深度,影响面分为:内部信息辅助影响、内部生产运营影响、法人
2、及其它机构影响、国家金融秩序稳定影响容灾等级RTORPO年中断时间数据备份、数据处理、网络、运维技术要求(部分)3级24小时24小时4 天至少有一个数据副本在同城或异地;支持完成切换准备后,自动或集中切换;4级4小时1小时10小时至少有一个数据副本在异地;异地处于就绪或运行状态,支持自动或集中切换;5级30分钟01小时同城、异地至少各有一个数据副本;其中至少一个应同步复制;同城、异地,至少一个处于运行状态,可实时自动或集中切换;6级2分钟05分钟同城、异地至少各有一个数据副本;其中至少一个应同步复制;同城、异地均处于运行状态,可实时自动或集中无缝切换;全球敏捷运维峰会广州站6金融行业MySQL
3、高可用方案选型容灾等级可用区运行状态MySQL高可用选型建议3级1同城 或 1异地主备+备份半同步/异步复制+备份4级1异地主备+备份异步复制+备份5级1同城+1异地同城双活中间件拆分+半同步复制+全局一致性备份6级1同城+1异地同城+异地多活全球敏捷运维峰会广州站7MySQL高可用架构/工具选型MySQL Replication MHA适用场景:历史遗留实例(MySQL 5.5)基于文件位置的主从复制解决的问题:从库一致性:一主多从环境,从库之间的日志回放进度对比数据补偿:GTID模式下,具备主动日志补偿能力(当时唯一的开源方案)问题及风险:从库调度:半同步复制下的从库会影响可用性业务访问:
4、SIP实现需要自行编写脚本数据补偿(MySQL 5.7.2以后):5.7.2引入logic_clock并行回访,binlog格式发生变化其它风险:管理节点高可用、relay_log自动清理、SSH免密登录、切换策略、切换判断、后期维护支持全球敏捷运维峰会广州站8MySQL高可用架构/工具选型MySQL Group Replication Innodb Cluster适用场景:新规划的实例(MySQL 8.0+,相比5.7+版本增加多个重要功能)低延迟、少抖动、不易隔离的网络环境解决的问题:切换:基于组复制的自动选主业务访问:轻量级中间件MySQL Router统一访问数据补偿:灵活的一致性策略
5、(写多数派&读等待)探活:允许合入大事务中、超时时间有额外等待风险与难点:部署配置(多数派选择、内网外网配置、网络超时时间、事务一致性模式、实例权重、成员离开行为)网络隔离(同城切换),需要人工维护处理全球敏捷运维峰会广州站同城切换场景MySQL组复制风险主园区备园区方案2:主存在于少数派园区主园区备园区方案1:主位于多数派园区收益:主实例故障自动切换备园区故障对集群无影响风险:主园区故障,集群无法选主,需要人工介入处理9收益:主园区故障,集群仍可选主,配合业务集中切换风险:无法做同园区切换(可评估改为5节点)备园区故障,主园区受影响,需要人工介入处理(可评估自愈处理)全球敏捷运维峰会广州站1
6、002 爱可生金融级MySQL高可用方案全球敏捷运维峰会广州站核心:异步/增强半同步/组复制;Oracle提供源码保障;优化:切换策略自定义;RPO/RTO/跨园区补充:完整性:组件本身高可用、从库调度可维护性:动作历史、延迟历史、日志记录状态判断:多维度判断,避免误判运维体系兼容性:提供脚本执行接口11UcoreUcoreUcoreUGuard_MGR(主)UGuard_MGR(备)管理区高可用决策UGuard_AgentUstatsUGuard_AgentUstats业务区UMC数据库复制sync binlogsync relaylogwrite b