1、分布式主动感知在智能运维中的实践分布式主动感知在智能运维中的实践运维的发展什么是智能运维宜信运维的实践主动感知01020304运维的价值资源提供业务变更请求处理故障预测异常检测根因分析动态扩容服务降级容量规划弹性调度利用率分析趋势分析成本分析效率质量成本运维的困境服务在运维层面的多维度网络拓扑技术栈服务拓扑运维质量=运维人员 X 运维手段运维的发展空白ITSMITOMITOAAIOps(Algorithm)AIOpsDevOpsChatOps运营角度运维角度管理工程手工阶段标准化阶段自动化阶段智能化阶段分布式主动感知在智能运维中的实践运维的发展什么是智能运维宜信运维的实践主动感知0102030
2、4AIOps 定义AIOps refers to multi-layered technology platforms that automate and enhance IT operations by 1)using analytics and machine learning to analyze big data collected from various IT operations tools and devices,in order to 2)automatically spot and react to issues in real time.BMC技术、场景与算法p 大数据分
3、析p 机器学习p 知识图谱p 自然语言处理p 单指标异常检测p 多维指标异常检测p 趋势预测p 日志异常检测p 根因分析p 智能问答p 智能执行p 规则p 统计p 机器学习变分自编码器、GBRT、EMA、极限理论Pearson 相关系数、DBScan 算法FP-TreePath Ranking架构SensingActingThinking分布式主动感知在智能运维中的实践运维的发展什么是智能运维宜信运维的实践主动感知01020304宜信IT运营架构物理环境全网网络服务器存储终端IAASPAASSAAS自动化信息流程监控CI/CD数据算法应用数据通道智能应用运维中台技术中台数据/智能中台业务价值运
4、维管理服务台自服务展示主机自动化请求管理事件管理问题管理需求管理变更管理持续集成CMDB资产管理持续发布域名自动化数据库自动化负载均衡自动化编排管理指标跟踪日志采集与处理业务应用链路基础设施全网日志配置拓扑工单UAVEagleNatrixWatchDogDashunKafkaDBusWormholeSpark StreamingNeo4jm3dbElasticSearchHiveHDFS关系指标文档/日志结构化数据历史动态静态采集加工存储智能场景搜索引擎知识图谱NLP工单编排规则CMDB画像服务台(Chat)编排管理问答后台KPIsLogsTracing异常检测趋势预测根因分析算法/模型监控系
5、统(报警)展板通知算法模型应用业务价值智能问答/执行故障检测分布式主动感知在智能运维中的实践运维的发展什么是智能运维宜信运维的实践主动感知01020304ROI痛点承载业务的 IT运维可观察的 IT真实观察的 IT 数据主动感知定义Active Perception is where an agents behaviors are selected in order to increase the information content derived from the flow of sensor data obtained by those behaviors in the environ
6、ment in question.Wikipedia态势感知情景感知决策动作执行经验训练条例规则预期目标环境情景理解预见计划反馈主动感知领域机器人自动驾驶智能手机路网监控.分布式主动感知全网 Agent网络 Agent主机 Agent业务 Agent应用 Agent基于规则基于智能算法(贝叶斯决策树等)有主动筛选的被动感知有主动行为的主动感知通过对真实 IT 环境的参与者建立模型,有目的的获取相关 IT 数据,并基于获取到的数据持续优化获取的数据和方法,以实现对真实 IT 实时完整的监控画像关联细节捕捉定向跟踪本地