《A3--张加浪--大模型时代下AIOps的研究与实践.pdf》由会员分享,可在线阅读,更多相关《A3--张加浪--大模型时代下AIOps的研究与实践.pdf(32页珍藏版)》请在三个皮匠报告上搜索。
1、大模型时代下AIOps的研究与实践张加浪腾讯高级工程师正文要求:微软雅黑:最小字号 8号 宋体:最小字号 10号 等线:最小字号 12号张加浪腾讯 高级工程师多年一直从事AIOps相关研究和建设工作,原腾讯云智能监控负责人,从0到1组建腾讯云智能监控商业化产品。对内支撑了腾讯会议、QQ空间和腾讯云等上百个产品的监控感知。腾讯网络安全质量建设负责人,将大模型、AIOps引入安全业务实践落地,使业务得到显著的提效和提质目录C O N T E N T S1.AIOps的背景与发展2.大模型的崛起3.大模型在AIOps中的应用实践4.未来展望与探索AIOPS的背景与发展01IT运维面临的挑战随着Dev
2、Ops模式的普及,规划、开发、测试、交付的效率越来越高效率越来越高Waterfall开发模式AgileDevOpsMonitorPlanCodeBuildTestDeployOperateReleaseMicroservicesMonolithicN-Tier系统架构Physical ServerVirtual ServersContainers部署模式CloudData CenterHosted基础设施架构从开始的一体化到分层模式,再到现在的微服务架构模式系统更加稳定容器化的部署模式动态性增强,每个实例的生命周期变得更短环境动态性增强云原生应用依赖云上的各类产品,上下游变得更顺上下游依赖更顺
3、IT运维面临的挑战庞大网络庞大网络海量存储海量存储复杂应用复杂应用资源按需服务托管敏捷开发多云互备专家支持安全可靠Devops海量监控二手信息风险加速木桶效应人少事多预算有限不停“背锅”IT运维面临的挑战AIOps定义及关键应用手工运维手工运维系统自动化系统自动化DevOpsDevOps脚本半自动脚本半自动AIOpsAIOps经验经验算法算法数据数据智能决策智能决策AIOps(AIOps(Artificial Intelligence for IT OperationsArtificial Intelligence for IT Operations):是一种将:是一种将人工智能技术人工智能技
4、术应用于应用于 IT IT 运维管理领域的方案运维管理领域的方案目标:利用大数据、机器学习和其他人工智能技术,自动、智能地处理和目标:利用大数据、机器学习和其他人工智能技术,自动、智能地处理和分析分析 IT IT 运维中的各种数据,运维中的各种数据,以实现更高效、更准确的运维管理以实现更高效、更准确的运维管理AIOps定义及关键应用事前事前事中事中事后事后 容量预测容量预测 故障预测故障预测 性能优化性能优化 链路挖掘链路挖掘 异常监控异常监控 根因分析根因分析 告警关联告警关联 智能止损智能止损 故障关联故障关联 工单分析工单分析 场景运营场景运营 业务联动业务联动AIOps定义及关键应用-
5、智能检测AIOps定义及关键应用-智能分析/关联AIOps应用的不足技术门槛高技术门槛高海量数据挑战海量数据挑战最后一公里缺失最后一公里缺失创新创新/灵活性不足灵活性不足大模型的崛起02大模型的发展及应用萌芽期(萌芽期(19501950-20052005)传统神经网络模型传统神经网络模型沉淀期(沉淀期(20062006-20192019)全新神经网络模型全新神经网络模型爆发期(爆发期(20202020-至今)至今)预训练大模型预训练大模型大模型的发展及应用场景场景应用应用场景场景应用应用信息检索信息检索元宝、豆包元宝、豆包影视制作影视制作剧本、角色设计剧本、角色设计新闻媒体新闻媒体闻海、全媒体
6、多模态大模型智能教育智能教育子曰、MathGPT智慧城市智慧城市Talk2Car、CityGPT智慧金融智慧金融LightGPT、天镜生物科技生物科技Enformer、EVE智慧医疗智慧医疗MedGPT、Med-PaLM、京医千询智慧办公智慧办公Copilot、智慧工厂智慧工厂M6生活服务生活服务M6智能机器人智能机器人Robotic Transformer-1、Control Transformer大模型为AIOps带来的机遇AIOpsAIOps&大模型大模型增强智能性增强智能性提升互动性提升互动性促进普适性促进