当前位置:首页 > 报告详情

2018年阿里智能化故障治理流程探索和实践.pdf

上传人: 云闲 编号:95483 2021-01-01 25页 13.12MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里巴巴在智能化故障治理方面的探索和实践。阿里巴巴的业务环境复杂,面临诸多挑战,如业务数量巨大,业务形态差异较大,业务关联性复杂等。为了应对这些挑战,阿里巴巴提出了基于AIOps的全局故障治理架构,并进行了实战案例分析。 主要内容包括:1)阿里巴巴全局故障治理流程,包括故障发现、故障定级、故障通告、故障辅助定位、处理决策、故障快速恢复、故障复盘和故障演练等环节;2)基于AIOps的全局故障治理架构,包括监控展示、异常发现、故障通告、根因分析、信息流转和故障恢复相关事件推送等模块;3)新零售和云计算等新业态给故障治理带来的挑战及应对策略;4)智能运维大图和阿里巴巴故障治理背景介绍;5)故障治理实战案例,包括自动化故障通告、故障自定义分析、智能水位、故障知识图谱等。 文中提到,阿里巴巴的故障治理目标是实现无人故障治理,目前正处于人工+部分场景智能化/自动化的阶段。虽然智能化故障治理面临诸多困难,如数据标准化、量级、质量要求高等,但已取得一定成果,并对未来故障治理充满信心。
"智能化故障治理如何提升运维效率?" "AIOps在全局故障治理中的实践案例分享" "新零售与云计算如何应对故障治理挑战?"
客服
商务合作
小程序
服务号
折叠