《沈巍-可观测性OpsCenter在移动云平台落地实践.pdf》由会员分享,可在线阅读,更多相关《沈巍-可观测性OpsCenter在移动云平台落地实践.pdf(29页珍藏版)》请在三个皮匠报告上搜索。
1、可观测可观测性性OpsCenter在移动云平台落地实践在移动云平台落地实践沈巍(中国移动云能力中心-容器产品架构师)移动云现状移动云现状移动云发展现状移动云发展现状移动云目前已经演化为移动云目前已经演化为“分布式云分布式云”,通过,通过中心中心+边缘边缘协同发展,实现协同发展,实现“云无处不在,网无所不及云无处不在,网无所不及”的业务体系,满足客户的业务体系,满足客户全全场景云业务需求场景云业务需求,提供四大区精品、大规模低成本、区域就近入云、云网个性化定制等多形态云服务,提供四大区精品、大规模低成本、区域就近入云、云网个性化定制等多形态云服务中心区中心区域域边缘区边缘区域域省级区省级区域域固
2、网固网5G5G4G4G可信可信网关网关 广域边缘云广域边缘云泛广域边缘云泛广域边缘云省云省云省云省云中心云中心云京津冀京津冀陕川渝陕川渝长三角长三角3AZ3AZ3AZ3AZ3AZ3AZ3AZ3AZ大湾区大湾区局域边缘云局域边缘云局域边缘云局域边缘云海马等三方云海马等三方云省自建边缘云省自建边缘云网络边缘云网络边缘云基于基于“五个一五个一”构建中国移动布式云构建中国移动布式云 构建构建N+31+XN+31+X一朵分布式云一朵分布式云,中心资源池省省有,高品质精品云池立足热点,中心资源池省省有,高品质精品云池立足热点区域辐射全国,加大力度打造边缘异构池云能力实现领先区域辐射全国,加大力度打造边缘异
3、构池云能力实现领先 打造全网一键发布的打造全网一键发布的统一分布式云操作系统统一分布式云操作系统,实现云边技术栈统一,打造中,实现云边技术栈统一,打造中心心+边缘的一致用户体验边缘的一致用户体验 建设建设一套多云异构纳管运营平台一套多云异构纳管运营平台,向下实现资源统一管理、调度,向上支撑,向下实现资源统一管理、调度,向上支撑云上应用灵活搭建、适配云上应用灵活搭建、适配 推进上云用数赋智重安推进上云用数赋智重安一体化业务运营管理能力一体化业务运营管理能力,加快业务,加快业务/能力上云进度能力上云进度(加快云网安全等产品能力),快速布局协同的营销推广体系,推动市场上(加快云网安全等产品能力),快
4、速布局协同的营销推广体系,推动市场上规模规模 实现实现边缘云统一运维边缘云统一运维,有效保障故障处理时效,保证客户业务感知,有效保障故障处理时效,保证客户业务感知总体规划:总体规划:中心中心+边缘协同发展,打造边缘协同发展,打造“五统一五统一”的分布式云的分布式云云原生可观测性云原生可观测性监控监控 VS 可观测性可观测性监控监控可观测性可观测性 例如:某应用程序Crash,某Host宕机 例如:某应用程序Crash,某Host宕机 程序多实例部署(并非根因)实际则是程序内存泄漏的问题指标指向问题本身指标指向问题本身指标指标无法无法指向问题本身指向问题本身现象即是问题本身依赖“运维老手”的经验
5、判断适合检测已知问题监控监控-现象往往不是问题本身溯源根因依赖工具联动开放式的探索,适合排查未知问题可观测性可观测性-对比对比AvailabilityPerformanceCapacityMetricsDisctributed TracingLogsException Tracking监控监控 VS 可观测性可观测性服务对象服务对象人员能力要求人员能力要求部署架构部署架构关联分析能力关联分析能力告警能力告警能力数据管理方式数据管理方式运维运维运维、开发、运维、开发、运营、运营、安全安全需要多套监控工具,对人员技术要求需要多套监控工具,对人员技术要求高高统一的可观测性平台,降低了人员能力的要求统
6、一的可观测性平台,降低了人员能力的要求不同工具间部署架构存在差不同工具间部署架构存在差异异需要运维人员基于经验进行手动分析,需要运维人员基于经验进行手动分析,关联分析难度较大关联分析难度较大基于阈值的告警,容易产生告警风暴基于阈值的告警,容易产生告警风暴机器数据孤岛、数据复用难、利用率低机器数据孤岛、数据复用难、利用率低统一部署维护,云原生架构,弹性扩展,能更统一部署维护,云原生架构,弹性扩展,能更好的适应业务快速变化和发展的需求好的适应业务快速变化和发展的需求全量整合多类机器数据,打通跨设备,系统的全量整合多类机器数据,打通跨设备,系统的事件分析壁垒事件分析壁垒告警降噪,告警自愈告警降噪,告