《1-白鳝-PostgreSQL的可观测性能力.pdf》由会员分享,可在线阅读,更多相关《1-白鳝-PostgreSQL的可观测性能力.pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、PostgreSQL的可观测性能力白鳝2024.03一个好的数据库要有哪些优点稳定 不宕机 不出错 少卡顿高效 大负载 高性能 多场景易用 易安装 易管理 易运维除此之外,还需要看得见、摸得着可观测性最初指的是一种管理策略。将最相关、最重要和最核心的问题提供给运维人员,并将关键信息与常规信息分离。可观察性是控制理论中的一个要素,它说 IT 系统的内部状态可以从它们的输入和输出之间的关系中推断出来。因此,它也经常被描述为自上而下的评估。可观察性的挑战不在于从观察中得出内部状态,而在于收集正确的观察。“可观测性”最初在分布式系统中被提出,目前已经被延伸到各个领域。可观测性日志告警指标体系全面跟踪用
2、户体验指标难以标记和排序,并且难以用于故障排除;对日志进行排序和汇总以得出有意义的结论或关系可能具有挑战性;跟踪会产生大量不必要的数据;用户体验可能不够准确。可观测性VS监控监控 对预知的场景采集数据并设置仪表盘;依赖于已知知识的提前假设;过多的告警可能会淹没运维工作;比较容易发现唯一性问题,无法定位根因;可观测性 更注重于问题分析;即可供提前假设性的问题分析,也可以用于未知问题分析;尽可能收敛告警,将多种告警因素归类于某个问题;可以用于复杂的场景下的问题定位。可观测性能力的作用 建立操作任务与威胁用户体验的问题之间的关联;正确应用可观察性可以提高IT系统的可用性和性能;改善用户体验 通过加快
3、故障处置的速度和提前预警故障来降低系统故障带来的运营成本增加;通过减少不相关或冗余信息的数量并优先通知关键事件来实现的运维成本的降低;这种降本增效在需要大型运营团队的大型企业运营中最为明显;降低运营成本 有助于IT基础设施总体规划和运维工具选择;通过识别可以通过更改配置、应用程序设计和资源管理来纠正的系统漏洞,实现可用性与性能提升。提升可用性和性能管理PG的可观测性能力配置信息运行状态数据对象统计数据运行指标等待事件活跃会话历史*TOPSQL*诊断跟踪日志信息数据库可观测性监控预警系统日检状态巡检月度巡检健康度分析SQL审计安全审计容量管理根因溯源性能优化高可用切换*部分生态产品具备,或通过插
4、件获得全面的可观测性数据与运维场景场景全面可观测性原因监控数据库是否存活否仅需要采集数据库状态信息基线预警否仅需要采集需要预警的指标,无需分析根因慢SQL采集与优化否仅需要采集与分析慢日志,并使用Explain去做TRACE数据库巡检是需要全面分析数据库状态,需要大量的历史数据而不是某个快照的状态信息根因分析是不仅需要全面的当前数据,还需要故障发生前某个时间段的历史数据,甚至需要通过历史数据的 比对才能发现异常数据库优化是需要通过全面的分析找到系统中存在的主要问题点,并选择重要的因素进行优化容量预测是需要通过全面的负载、性能、容量变化的历史信息,才能获得较为准确的容量预测关键SQL跟踪与变化预
5、警是需要跟踪SQL的变化,通过系统状态的变化状态进行辅助分析数据库故障预警是需要采集与分析较为全面的数据库指标,才能较大范围覆盖数据库故障类型,并能提供较强的故障预警与分析能力不同的运维场景与运维需求对可观测性能力的使用需求是不同的。最简单的监控不需要特别复杂的指标与数据,对于数据库的可观测性接口的使用也是与自己的运维需求决定的。PG可观测接口概述OS信息system_stats插件基础运行状态PG_STAT_*等/PG_*等待事件pg_stat_activityTOP_SQL慢SQL日志插件pg_stat_statements/pg_stat_monitorASHpgsentinel/pgs
6、ampler插件openGauss:ASP:GS_ASP/DBE_PERF.LOCAL_ACTIVE_SESSIONAWRpg_profile插件PG_*/PG_STAT*PG_SETTINGS/PG_FILE_SETTINGS:配置参数PG_CONTROL_CHECKPOINT/PG_CONTROL_SYSTEM:基本信息PG_EXTENSION:插件pg_database/pg_user/pg_tablespace:数据库信息pg_stat_replication/pg_stat_replication_slots:复制pg_current_wal_lsn/pg_current_xlog_