首页
/ Apache APISIX 指标异常问题排查与解决

Apache APISIX 指标异常问题排查与解决

2025-05-15 23:18:06作者:郜逊炳

问题背景

在使用 Apache APISIX 3.8.0 版本部署在 EKS 集群时,发现一个异常现象:当将 APISIX 的部署副本数从 1 增加到 10 后,Prometheus 监控指标出现了异常增长,即使在没有实际流量负载的情况下。

现象描述

从监控图表可以观察到:

  1. 指标 apisix_http_requests_total 出现了异常增长
  2. 在 10 个 APISIX Pod 的部署中,指标值明显高于 5 个 Pod 的部署
  3. 深入检查发现,在 5 个 Pod 的部署中,其中一个 Pod 的指标值异常高(约 160,000),而其他 Pod 只有 200-300 左右

配置分析

用户提供的 Helm values.yaml 配置中包含了 Prometheus 插件的关键设置:

pluginAttrs:
  prometheus: 
    export_uri: /apisix/prometheus/metrics 
    metric_prefix: apisix_ 
    enable_export_server: true 
    export_addr: 
      ip: 0.0.0.0 
      port: 9091 
    prefer_name: true

问题原因

  1. 指标标签缺失:从现象看,指标 apisix_http_requests_total 缺少应有的标签(如路由、服务等标识),这使得难以追踪指标来源
  2. Prometheus 配置问题prefer_name 设置为 true 可能导致指标名称优先于标签
  3. 内部通信影响:APISIX 节点间的健康检查或内部通信可能被错误计入指标

解决方案

通过调整 Prometheus 插件的配置解决了问题,关键修改点包括:

  1. 优化 prefer_name 设置,确保指标包含足够的标签信息
  2. 检查并调整内部通信的监控排除设置
  3. 验证指标采集端点的过滤规则

最佳实践建议

  1. 合理设置指标前缀和标签:确保监控指标包含足够的上下文信息
  2. 副本数调整时的监控验证:在调整 APISIX 集群规模时,应验证监控指标的准确性
  3. 内部通信隔离:配置排除内部健康检查等通信的监控计数
  4. 版本兼容性检查:确保 Prometheus 插件版本与 APISIX 核心版本兼容

总结

APISIX 的监控指标异常通常与插件配置和内部通信处理相关。通过合理的 Prometheus 插件配置和监控策略调整,可以确保指标数据的准确性和可靠性,为系统运维提供有效的数据支持。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
897
533
KonadoKonado
Konado是一个对话创建工具,提供多种对话模板以及对话管理器,可以快速创建对话游戏,也可以嵌入各类游戏的对话场景
GDScript
21
13
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
85
4
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
374
387
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
94
15
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
626
60
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
402
378