《云原生可观测Prometheus:构建开放的全栈可观测能力.pdf》由会员分享,可在线阅读,更多相关《云原生可观测Prometheus:构建开放的全栈可观测能力.pdf(19页珍藏版)》请在三个皮匠报告上搜索。
1、云原生可观测Prometheus:构建开放的全栈可观测能力徐葛阿里云可观测产品专家Contents目录01可观测挑战和趋势分享02基于Prometheus x Grafana构建开放的全栈可观测能力03全栈可观测最佳实践分享可观测落地挑战和趋势Observable Challenges and Trends01企业建设可观测能力核心挑战数据和工具割裂超过 63%的企业组织拥有超过 10 种 以上的工具没有统一的观测数据模型*成本膨胀业务规模扩大,观测数据指数增长数据读写性能和投入产出比面临挑战“无法兑现的价值”技术架构、技术组件迭代快,可观测能力发挥严重依赖专家经验全球化业务需求、多云、分布式
2、云战略落地,使企业建设“统一”可观测能力难度进一步增加*引用ESG调查和信通院可观测性成熟度白皮书自身性能和稳定性挑战打通了淘系所有常见中间件的调用数据;大促和单元化的容量规划、依赖分析提供了数据支撑和故障定位能力EagleEye内部工具商业化,围绕微服务应用,结合Trace、Metric、Log提供应用可观测能力ARMS 应用实时监控服务前端监控、APP监控、云拨测基于Prometheus 容器监控多语言链路追踪全栈可观测能力云原生可观测服务2013201720202022阿里云可观测十年,从自研走向开放全栈可观测以 ARMS 应实时监控服务、可观测监控 Prometheus 版、可观测可视
3、化 Grafana 版、可观测链 OpenTelemetry 版为核,打造云原生时代标准开发可观测数据生态与产品统一标准而不是统一存储连接价值而不是搬运数据建设可观测系统而不是建设数据存储系统全栈可观测是企业可观测能力核心具备全栈可观测性的组织,其年平均停机成本下降了 37%,可观测性的平均投资回报率能提高了 14%。*引自2023 Observability Forecastby New Relic基于 Prometheus x Grafana构建开放全栈的可观测能力02New Future on CloudPrometheusOpenTelemetry开源标准的数据模型和观测界面数据完全兼
4、容 Prometheus 和 OpenTelemetry 协议,核心观测完全基于 Grafana 大盘开放数据探索能力用户从使用数据到真正拥有数据,使企业能发挥可观测数据最大价值统一接入统一标准数据存储数据探索CRM 用户体验Grafana应用监控中间件监控容器监控云产品监控调用链分析指标探索OpenAPIRemote ReadRemote Write数据投递200+开箱即用的数据集成基于阿里内部专家经验沉淀的 300+观测大盘、1000+告警规则模版更丰富、更开放的生态集成能力指标级成本洞悉以指标为基本单元,构建全局指标上报量聚合视图。直观洞悉指标的成本占比分布,友邦保险基于指标成本洞察治理
5、,成本下降 30%*高基数指标分析提供了指标级、标签级基数查询,轻松获取指标的时间线数量、标签的基数。高效定位高基数指标查询慢的原因,可做数据治理提速。无端游戏基于基数洞察长周期数据查询速度提示 10 倍*指标探索集成Grafana Explore,可视化界面支持多元的函数选择,通过指标名、标签名、标签值构造 PromQL,提高易用性。指标画像支持获取指标来源、指标名称、描述、指标类型、付费方式、Job、采集周期等元信息获取,建立可观测指标知识库。指标中心全新发布,构建统一的指标生态视图阿里云 Prometheus 指标中心分析治理数据统计数据管道指标来源慢查询预聚合推荐智能降采样异常诊断指标
6、画像热查询洞察实时写入实时消费数据加工数据投递指标上报量指标时间线指标齐全度标签基数指标元信息采集间隔存储时长标签详情标签数量*数据来自已授权客户的真实数据统计覆盖14个场景包括14个场景相应响应时间、错误率、调用量、http状态码支持快速覆盖新场景新场景覆盖只需要些少量样例准确率 86.9%基于Chain-of-Thought的Prompt engineering,给大模型更多的相关领域知识,以提升LLM回答的准确率PromQL智能问答:基于 CoT 的 Prompt Engineering*截图数据来自模拟数据,仅做功能效果示意0.4元/GB50GB/月费用下降 50%99%数据写入量免费