《eBPF + LLM:实现可观测性智能体的基础设施-向阳.pdf》由会员分享,可在线阅读,更多相关《eBPF + LLM:实现可观测性智能体的基础设施-向阳.pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、eBPF+LLM:实现可观测性智能体的基础设施云杉网络/向阳关于清华大学博士,云杉网络研发 VP,DeepFlow 开源社区负责人。曾在国际顶级学术会议 ACM SIGCOMM、ACM IMC 上发表应用可观测性、网络测量等方向的学术论文,现负责可观测性产品 DeepFlow。向阳研发研发 VP VP 云杉云杉网络网络eBPF+LLM:实现可观测性智能体的基础设施使用 eBPF 构建高质量的可观测性信号源使用 LLM 构建高效率的可观测性智能体DeepFlow 用户的可观测性智能体实践案例未来演进方向的思考使用 APM 采集观测信号的痛点DALL.E使用 eBPF 的独特优势Zero Code
2、FullStackeBPF Raw DataSocket EventsFile EventsPerf EventsProcess EventsKernel EventsHW Events从 Raw Data 到高质量观测信号Distributed TracingSocket EventsFile EventsPerf EventsFile EventsProcessEventsService Map/API MapContinuous Profiling内核C性能系统应用Java效率业务如何突破次元壁从系统到业务DALL.E以 eBPF 为基础设施,感知业务以 eBPF 为基础设施,感知业务e
3、BPF+LLM:实现可观测性智能体的基础设施使用 eBPF 构建高质量的可观测性信号源使用 LLM 构建高效率的可观测性智能体DeepFlow 用户的可观测性智能体实践案例未来演进方向的思考数据AIDALL.E日常工作中的低效环节变更工单漏洞工单的低效工单可观测性智能体为工单提效问题:1.在资源 172.21.107.150 中,15:36:00-15:38:00时段中,请求速率下降,同时服务端异常比例上升,并且响应时延增加。此外,TCP 建连失败比例维持在较高水平。2.在资源 nginx-ingress-controller-68ff96c985-xndm6,TCP 重传比例在 15:36:
4、00 时达到最高,说明可能存在网络问题。3.在资源 icn-vehicle-lbs-647f74d76-7srgr,服务端异常比例在 15:31:00-15:34:00 时段相对较高,但是该值依然很低。突出问题资源:1.资源 172.21.107.150,可能存在网络或者服务稳定性问题,需要优化。2.资源 nginx-ingress-controller-68ff96c985-xndm6,可能存在网络问题,需要进一步检查。tag.owner变更的低效变更为什么发版之后性能降低了?复杂的调用链复杂的函数栈可观测性智能体为变更提效漏洞修复的低效漏洞可观测性智能体为漏洞修复提效LLM黄金信号+LLM
5、带来的改变?如何持续改进 AgenteBPF+LLM:实现可观测性智能体的基础设施使用 eBPF 构建高质量的可观测性信号源使用 LLM 构建高效率的可观测性智能体DeepFlow 用户的可观测性智能体实践案例未来演进方向的思考DeepFlow Tracing AgenteBPF Tracing 数据eBPF Map/Metrics/Log/Event 数据Function Call/JSON ModeDeepFlow Profiling AgenteBPF Profile 数据RAG=Docs、CommentsAskGPT-Grafana DeepFlow Topo PluginGPT通义千问文心一言ChatGLM解读、分析下钻建议https:/ DeepFlow Tracing PluginGPT通义千问文心一言ChatGLM解读、分析https:/ eBPF 构建高质量的可观测性信号源使用 LLM 构建高效率的可观测性智能体DeepFlow 用户的可观测性智能体实践案例未来演进方向的思考让零侵扰数据覆盖更全CloudWorkloadSmart VehicleSmartPhoneLLMRetrieval-Augmented GenerationLLM欢迎加入DeepFlow社区微信群