Grafana Helm Charts中多端口Pod监控导致重复抓取问题的分析与解决

2025-07-08 09:53:25作者：卓炯娓

【解锁Kubernetes可视化新境界】 grafana/helm-charts，你的云原生监控仪表盘构建神器！这是一套由Grafana社区精心打造的Helm图表集合，专为简化Kubernetes上的Grafana部署而生。无需从零开始，一键添加仓库，即可拥有强大的监控与可视化能力。无论是新手还是专家，通过这份详尽文档指导，轻松管理你的数据面板。想贡献代码或一同完善？欢迎加入，让我们共同遵守Apache 2.0许可下的开放创新之旅，携手推进云端监控技术的边界！立即探索，开启你的集群洞察之旅！

项目地址：https://gitcode.com/gh_mirrors/helm/helm-charts

在Kubernetes监控领域，Grafana Helm Charts是广泛使用的监控解决方案之一。近期发现一个值得注意的技术问题：当Pod配置了多个端口并使用Grafana注解时，会导致Prometheus对同一端口进行重复抓取，进而造成指标数据翻倍(DPM翻倍)的现象。

问题现象

在配置了多端口Pod的场景下，如果使用如下注解配置：

metadata:
  annotations:
    "k8s.grafana.com/metrics.portNumber": "9091"
spec:
  ports:
  - name: "http-9080"
    port: 9080
  - name: "http-9091" 
    port: 9091

Prometheus会对9091端口执行两次抓取操作，导致该端口的指标数据量(DPM)变为正常值的两倍。随着Pod中定义的端口数量增加，这个问题会进一步放大，造成监控数据异常膨胀。

问题根源

这个问题源于Grafana Helm Charts在生成Prometheus配置时的处理逻辑存在缺陷。当同时满足以下两个条件时就会触发此问题：

Pod中定义了多个端口
使用了k8s.grafana.com/metrics.portNumber注解指定监控端口

系统会在生成Prometheus抓取配置时，错误地为同一个端口创建多个抓取任务，而没有进行去重处理。

影响范围

此问题会影响以下版本：

k8s-monitoring chart 1.5.0及更早版本
app version 2.8.1

主要影响表现为：

监控数据量异常增加
Prometheus存储压力增大
可能引发告警误报
监控仪表板显示数据不准确

解决方案

Grafana团队已在k8s-monitoring chart的1.5.2版本中修复了此问题。建议用户尽快升级到1.5.2或更高版本。

对于暂时无法升级的用户，可以考虑以下临时解决方案：

避免在同一个Pod中定义多个端口
不使用k8s.grafana.com/metrics.portNumber注解
手动调整Prometheus的scrape配置

最佳实践

为避免类似问题，建议在使用多端口Pod监控时注意：

保持Grafana Helm Charts版本更新
定期检查Prometheus的scrape配置
监控关键指标如scrape_samples_scraped来发现异常抓取
新版本部署前在测试环境验证监控配置

这个问题提醒我们，在复杂的Kubernetes监控场景中，配置的细节可能对系统产生重大影响，保持监控组件版本更新和配置验证是保证监控系统可靠性的重要手段。

helm-charts

项目地址：https://gitcode.com/gh_mirrors/helm/helm-charts

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781