《贾涛-运营商体系下业务的云原生数智化转型实践.pdf》由会员分享,可在线阅读,更多相关《贾涛-运营商体系下业务的云原生数智化转型实践.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站运营商业务数字化转型实践贾涛 技术主管中国移动通信集团辽宁有限公司 运维专家SRE技术专家负责运营管理、智慧运维、应急保障等平台的建设工作01转型挑战数字化转型面临的挑战02业务治理运营商业务治理理念03落地实践数字化转型中的实践经验04演进思考运维可观测的演进方向目目录录Content01转型挑战数字化转型面临的挑战2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站数字化转型过程中衍生出越来越复杂的运行环境云原生时代业务应用愈发复杂多变,环境、场景和技术越来越多样化,系统迭代更加敏捷,而运维工具
2、繁多、功能参差不齐,产生的数据相互割裂,形成的分析结果关联性不强,无法实现全局运维掌控的要求。3rd parties移动用户Web用户压力测试主动拨测WEB组件计算、存储数据库应用组件微服务视角不同模型不一数据缺失告警泛滥难以关联2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站业务转型过程中传统运维视角带来的局限为了更好的适配云原生的多层架构,不仅要实时监测基础设施各项指标、业务日志、服务链路等,还需要建设多种垂直监测工具及平台,统一了数据管控平台,通过点对点的观测解决一部分问题。看似方方面面都监控到了,但缺少了数据的关联性和分析排查的连贯性,遇到问题,只能通过大规模
3、排查分析,问题发现和定位的效率低。垂直观测工具零散观测点多种垂直监控平台日志指标服务链看板监控运维能力现状传统的工具是垂直向的,引入一个新的组件的同时也引入一个对应的观测点,为保障数据全面性,搭建了很多监控管理工具。监控工具众多数据相互独立通常我们会基于自己想要的数据去构建分析视角,而监控点各自独立,没有关联成面,数据缺乏关联性。通过零散的监控工具看见局部的观测点很难预料业务出问题时有哪些点可以去监控?掌握问题的线索时要不断切换工具去定位收集到的监控规则不能完全有效复现问题?2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站可观测性成为云原生架构下业务监控的良药监控可观
4、测告警Alerting排错:诊断故障出现的原因Debugging概况Overview剖析:进行性能分析Profilling依赖分析:厘清关系Dependency虚拟资源监控分析容器资源监控分析基础设施资源监控应用性能分析业务性能可分析客户端用户体验分析基础软件监控分析可观测视图扩展高效排障体系运营运行运营团队SRE团队可靠性业务运维团队PaaS层PaaS运维团队IaaS层IaaS运维团队找到异常的原因全方位的可观测性,能够实时地、清晰地挖掘场景化问题,利用灵活调配、协作等打破数据孤岛。02业务治理运营商业务治理理念2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站基于可
5、观测理念重定义业务监控运维体系,契合新时代趋势应急保障人员业务运营人员指挥调度人员平台运维人员本地云容器云IT云提升服务质量指标链路日志故障分类处置提升可见性AutoOPS通知服务变更管理AIOPSCI/CD业务流程再造高可用治理可观测埋点治理业务系统服务治理业务链标准服务链标准资源链标准数据标准一体化可观测平台平台高可用专项治理可观测埋点非功能测试制度保障端到端全局观测业务健康分析观测面向运维:故障快恢面向一线:技改优化资源级故障自主分析处置业务服务页面观测程序级故障全过程追踪业务规则异常优化过程追踪数据基座指标体系业务模型基础能力观测能力2023 DevOps 国际峰会 暨 BizDevO
6、ps 企业峰会 北京站基于可观测理念重定义业务监控运维体系,契合新时代趋势运维人员告警/故障通知运维专家专家运维知识混合IT环境IT云网络云移动云APMUEMRUMLog4X 业务故障预警 态势感知大盘故障根因定位辅助运维决策专家运维知识数据采集一体化可观测平台预警告警/故障运维数据人工故障定位可观测数据底座 全栈式 故障追踪指标链路日志业务健康度告警/故障03落地实践数字化转型中的实践经验2023 DevOps 国际峰会 暨 BizDevOps 企业峰会 北京站围绕业务系统开展服务治理,提供全链路的运营管控策略业务高可用治理业务流程再造治理可观测埋点治理套餐变更业务过程业务办理步骤2步骤3步