《AI赋能可观测性的展望.pdf》由会员分享,可在线阅读,更多相关《AI赋能可观测性的展望.pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、科来网络技术股份有限公司AI赋能下一代可观测系统的展望科来-冀佳鹏1、科来智能运维的发展路径2、科来AI应用平台3、可观测AI能力场景设计4、面向AI基础设施的可观测能力5、产品思考目录科来智能运维的发展路径01PART科来智能化运维发展的历程基础架构性能Https应用性能业务全链路容量规划音视频互联网用户体验专线监控HttpDNS预定义场景指标走势线业务指标主机指标指标定界趋势/拓扑分析全链路数据指标关联,故障定位实时告警KPI阈值告警+人工研判数据包指标数据追踪数据智能基线数据检测、关联、归并交叉验证根因定位算法日志数据Profile网络指标场景化的自动分析基于算法的智能运维AI+可视化/
2、决策-异常检测模型-故障分析模型-NLP知识提取AI引擎-可观测语料-故障分析案例-经验知识科来知识库-告警通知-自动处置-策略下发运维响应-网络数据包-metrictracelog-基础设施、标签可观测数据源-流量特征协议字段-时序特征构造-标签对象统一关联特征提取与标准化科来AI应用开发平台02PARTAI应用平台的应用与知识库将材料,经验与案例录入知识库后自动根据库中资料进行查询调用。格式:TXT、md、PDF文件识别:智能分段:自动分段分片 高级分段:按照规则分片分段结果:更精准查询出对应的问题。AI Agent知识库提供极简模式、智能体和专家系统三种应用。极简模式:通过关联知识库,售
3、后助手、机器问答。智能体:ReAct模型、PlanAndExecute模型。应用、工具、API。网络流量分析案例、故障定位分析、AI智能图表。专家系统:通过流程编排定义的支持复杂业务。应用知识库工作流编排 虽然有RAG技术的加持,但依然会有幻觉问题,需要通过流程编排的设计,结合业务API,更加精准的输出期望结果 在平台使用和排障流程中,打造向导式AI辅助能力 融合告警处理处置流程,在进行告警分析和报告生成时,根据业务接口的返回数据继续进行多维度数据关联分析让AI真正贴合业务融合故障排查最佳实践构建的工作流,提升应用初始效果问题:拓扑中告警问题的解释以拓扑异常分析为例:回答2:容器集群和VMwa
4、re集群建连失败率高,我进行了挖掘分析,发现是VMware环境中的19个VM(属于同一个VPC1),访问容器service1的时候发生连接重置导致的建连失败,经过与其他VPC和Service互访情况比对,判断是由于该ServiceIP的80端口未开通来自VPC1的访问策略。回答1:容器集群和VMware集群建连失败率高(30.2%)不满足预期答案满足预期答案结合AI平台对复杂问题的自动化分析,可以展现自动分析的过程和思路,并自动创建出数据可视化大屏。l一句话生成你的智能分析大屏l自定义大屏风格AI数据可视化及交互AI数据可视化及交互可观测AI能力场景设计03PART运维知识问答系统2024年开
5、始,科来构建了以RAG为核心的应用平台,陆续在网络分析、数据可视化、异常诊断等方面进行了落地。故障处理效率提升通过实时配置指导和知识库调取,快速定位和解决故障,将故障处理效率提升60%。例如在系统出现故障时,维护操作助手能够快速提供解决方案,减少停机时间。系统状态实时监控实时监控系统状态,及时发现异常,将异常发现速度提升3倍。例如通过CPU、内存、网络健康度实时看板,用户可以随时了解系统的运行状态,提前预防故障。维护操作助手信息检索耗时降低提供全资产拓扑图和属性穿透查询功能,将信息检索耗时降低80%。例如用户可以通过资产信息速查功能,快速获取设备的详细信息和关联关系。资产信息速查智能搜索跳转
6、在复杂的环境中,查找特定对象是否让您感到头疼?无论何种对象,如虚拟机、VPC、NS、网络设备、用户、应用等,全局对象极速搜索功能都能让您一键直达,告别层层点击,快速定位 所需信息,大幅提升工作效率,不浪费时间在无谓的搜索上。跨系统搜索效率提升实现资产、设备、用户、应用的全局索引,将跨系统搜索效率提升90%。例如在多系统环境下,用户可以快速搜索到所需的信息,提高工作效率。01根据数据分析结果,自动生成智能报告,包括Top数据统计和趋势预测,为决策提供有力支持。例如在业务数据分析中,生成详细的业务报告,帮助管理层做出科学合理的决策。智能报告生成AI智能报表AI赋能云魔方可观测平台流程设计AI引擎交