《2017年小米监控实践之路.pdf》由会员分享,可在线阅读,更多相关《2017年小米监控实践之路.pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、小米监控实践P路 小米工程师 210!800!2300!5000!0!1000!2000!3000!4000!5000!6000!2011!2012!2013!2014!?!曾经面L的困境?!?!?!?!?!监控体系设计 ap期自e化 体系持续演进 监控体系设计 监控架构图 监控体系设计 aAECh采集 n?!监控体系设计 m8DBic+DagC df.bytes.free.percentdf.bytes.free.percent/mount=/mount=/!df.bytes.free.percentdf.bytes.free.percent/mount=/home/mount=/home!
2、HostGroupHostGroup:miui.apm.nginxmiui.apm.nginx!Strategy:Strategy:df.bytes.free.percentdf.bytes.free.percent all(#3)80 all(#3)5!ap期自e化 集群监控 p?QPS?!p?!p?!?:$(cpu.busy)50!?:$#!ap期自e化 成效 40!41!48!52!56!61!56!70!80!81!88!86!89!0!10!20!30!40!50!60!70!80!90!100!4?!5?!6?!7?!8?!9?!10?!11?!12?!1?!2?!3?!4?!QP
3、S?/?!Endpoint?40000+!Counter?16000?+!SRE?0.5?!?!?!?!?!?!?!183byte!157.07M!13.25T!397.58T!4.84P!?!8byte!6.87M!579.36G!17.38T!211.47T!监控体系设计 ap期自e化 体系持续演进 体系持续演进 NodaDaC n?!体系持续演进 自e配置扩容 体系持续演进 非连续性报警 n?!体系持续演进 容器弹性环境 n 去除PING监控F改MJ-B粒度实例数监控 n 容器退c时钩子清理o警Q件 n 平滑daCh5oaBd曲线 体系持续演进 自e缩扩容 n Falcon自e采集 CP
4、U IDLE +E+FREE PR-C QPS PR-C DELAY n Hook回调 +aBaDhon API n 最短5C触m伸缩 体系持续演进 网络监控 n 网络设备监控 n ig、J西流量监控 n Pingm8Cha网连通质量监控 体系持续演进 o警管理 n o警认领 n o警h级 n 运维成熟度评Y 体系持续演进 o警管理 体系持续演进 智能监控 n?!n?!n?!Judge?Slinker?Graph?Hook?User?体系持续演进 o警驱e CDackCDoBmCDackCDoBm 接收t应报警Q件 ChaD命令触m自e修复 故障设计 精b故障定位 服d治理框架 故障自愈 总结?!?!?!