当前位置:首页 > 报告详情

2018年AIOps智能故障管理在阿里巴巴集团的成功实践.pdf

上传人: 云闲 编号:95632 2021-01-01 29页 3.96MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里巴巴集团在AIOps智能故障管理方面的成功实践。面对业务形态差异大、应用程序之间链路复杂、稳定性挑战巨大的情况,阿里巴巴提出了全局故障治理流程,包括故障发现、定级、通告、辅助定位、处理决策、快速恢复、复盘和演练。文章指出,传统监控系统存在误报漏报问题,而阿里巴巴的智能运维解决方案能准确发现故障,提高故障处理效率。此外,阿里巴巴还采用了时间序列异常检测和智能根因推荐技术,通过机器学习和深度学习模型,实现了对业务指标的实时监控和分析,有效降低了误报率,并提高了故障处理的准确性和速度。
"AIOps如何提升故障管理的效率?" "智能运维如何实现异常检测与根因推荐?" "阿里巴巴如何应对双11稳定性挑战?"
客服
商务合作
小程序
服务号
折叠