《1.阿里基于eBPF的应用可观测技术实践.pptx》由会员分享,可在线阅读,更多相关《1.阿里基于eBPF的应用可观测技术实践.pptx(21页珍藏版)》请在三个皮匠报告上搜索。
1、首届中国首届中国eBPFeBPF研讨会研讨会首届中国首届中国eBPFeBPF研讨会研讨会基于eBPF的应用可观测方案阿里云-张城(元乙)自我介绍元乙(张城)元乙(张城)负责阿里巴巴集团、蚂蚁金服、阿里云等可观测基础设施,服务数万内外部客户,EB级规模、日流量近百PB 多次在QCon、KubeCon、云栖大会等做过相关议题分享,云原生操作系统Kubernetes作者之一 目前主要关注AIOps、内核技术、云原生、大规模存储/分析引擎等方向阿里云-高级技术专家首届中国首届中国eBPFeBPF研讨会研讨会告警监控可观测性A system is said to be observable if,for
2、 any possible evolution of state and control vectors,the current state can be estimated using only the information from outputs.监控 vs 可观测性聚焦在故障发现可观测性 目标白盒化,多种观测手段 确保找到根因,防患于未然 注重Recall+Precision 贯穿Dev/Tester/Ops等环节Failed聚焦在故障发现监控 聚焦在发现 确保系统稳定性 PrecisionRecall Ops为主首届中国首届中国eBPFeBPF研讨会研讨会云原生应用可观测首届中国首
3、届中国eBPFeBPF研讨会研讨会应用可观测技术如何还原应用的各类行为、特性首届中国首届中国eBPFeBPF研讨会研讨会常见的应用观测技术 手动 每个接口、调用处埋点半自动 只需修改部分框架代码全自动 自动注入,无需修改代码NetworkHTTP FrameworkProcessorAProcessorBInterceptor.beforeInterceptor.afterProcessor X半自动全自动首届中国首届中国eBPFeBPF研讨会研讨会eBPF&应用可观测无侵入高性能 无需修改代码 适应所有语言 只需部署一个Agent 内核态处理/过滤 Zero Copy 采样机制一些优秀的eB
4、PF可观测项目Pixie:https:/ 问题问题:日志、监控统一收集,减轻运维监控负担 特点:特点:日志/监控实时采集、采集配置Web管理、运行状态监控、异常自动上报 状态:状态:日10TB+数据,3W+部署2017阿里集团阶段阿里集团阶段 问题问题:多部门、百万规模自动化运维/部署、稳定性保证 特点:特点:日志采集可靠性保证、自动化部署/升级/异常灰度/运维、采集管控、多租户管理 状态:状态:日1PB+数据,百万部署云原生阶段云原生阶段 问题问题:云上管理、容器化/K8s、对接开源标准协议、碎片化需求 特点:特点:统一版本、容器数据采集、K8s Operator、插件化扩展机制、多种开源数
5、据接入 状态:状态:日10PB+数据,千万部署开源共建阶段开源共建阶段 期望期望 可观测数据采集“共同富裕”支持更加丰富的上下游生态 挖掘更多的应用场景与潜力 性能、稳定性持续提升https:/ sendfile64readreadvrecvrecvmsgcloseHookPreFilterPreProcessSendToUserSpaceAPP1网络交互Kprobe HookRecvFromKernelCopyToBufferProcessConnectionManagementLocal MetaManagementParseProtocolPostFilterhttpgrpcmysqlk
6、afkaredisCorrelate MetaGarbage CollectionAggregateSendKProbe。DataPanelControlPanelPreParseProtocolNetStatCounterTraceRulePreTracehttpgrpcmysqlkafkaredis。ConfigManagementECS K8s APP1APP1APP1APP1APP2无侵入无侵入轻量级轻量级高稳定高稳定无需应用做任何代码级修改,无需重启或重新部署应用基于eBPF技术,内核态数据包预过滤,支持采样精细化采集资源控制,崩溃隔离,不影响