Apache APISIX 指标异常问题排查与解决

2025-05-15 01:16:33作者：郜逊炳

问题背景

在使用 Apache APISIX 3.8.0 版本部署在 EKS 集群时，发现一个异常现象：当将 APISIX 的部署副本数从 1 增加到 10 后，Prometheus 监控指标出现了异常增长，即使在没有实际流量负载的情况下。

现象描述

从监控图表可以观察到：

指标 apisix_http_requests_total 出现了异常增长
在 10 个 APISIX Pod 的部署中，指标值明显高于 5 个 Pod 的部署
深入检查发现，在 5 个 Pod 的部署中，其中一个 Pod 的指标值异常高（约 160,000），而其他 Pod 只有 200-300 左右

配置分析

用户提供的 Helm values.yaml 配置中包含了 Prometheus 插件的关键设置：

pluginAttrs:
  prometheus: 
    export_uri: /apisix/prometheus/metrics 
    metric_prefix: apisix_ 
    enable_export_server: true 
    export_addr: 
      ip: 0.0.0.0 
      port: 9091 
    prefer_name: true

问题原因

指标标签缺失：从现象看，指标 apisix_http_requests_total 缺少应有的标签（如路由、服务等标识），这使得难以追踪指标来源
Prometheus 配置问题：prefer_name 设置为 true 可能导致指标名称优先于标签
内部通信影响：APISIX 节点间的健康检查或内部通信可能被错误计入指标

解决方案

通过调整 Prometheus 插件的配置解决了问题，关键修改点包括：

优化 prefer_name 设置，确保指标包含足够的标签信息
检查并调整内部通信的监控排除设置
验证指标采集端点的过滤规则

最佳实践建议

合理设置指标前缀和标签：确保监控指标包含足够的上下文信息
副本数调整时的监控验证：在调整 APISIX 集群规模时，应验证监控指标的准确性
内部通信隔离：配置排除内部健康检查等通信的监控计数
版本兼容性检查：确保 Prometheus 插件版本与 APISIX 核心版本兼容

总结

APISIX 的监控指标异常通常与插件配置和内部通信处理相关。通过合理的 Prometheus 插件配置和监控策略调整，可以确保指标数据的准确性和可靠性，为系统运维提供有效的数据支持。

apisix

The Cloud-Native API Gateway

项目地址：https://gitcode.com/GitHub_Trending/ap/apisix

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

Apache APISIX 指标异常问题排查与解决

问题背景

现象描述

配置分析

问题原因

解决方案

最佳实践建议

总结

热门内容推荐

最新内容推荐

项目优选

Apache APISIX 指标异常问题排查与解决

问题背景

现象描述

配置分析

问题原因

解决方案

最佳实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选