Prometheus Operator中PodMonitor对端口号的支持问题解析

2025-05-25 00:19:43作者：丁柯新Fawn

prometheus-operator/prometheus-operator: Prometheus Operator 是一个针对Kubernetes的运营商（Operator），它自动化了Prometheus及相关组件在Kubernetes集群中的部署和管理任务，使得运维人员能够更方便地维护和扩展基于Prometheus的监控系统。

项目地址：https://gitcode.com/gh_mirrors/pr/prometheus-operator

背景介绍

在Kubernetes监控体系中，Prometheus Operator是一个非常重要的组件，它简化了Prometheus在Kubernetes环境中的部署和管理。其中，PodMonitor资源是Prometheus Operator提供的一种自定义资源定义(CRD)，用于配置Prometheus如何从Kubernetes Pod中抓取指标。

问题现象

在实际使用中，用户发现当Pod的容器端口只定义了端口号而没有定义端口名称时，PodMonitor无法正确识别和监控这些端口。例如，在ingress-nginx的部署中，metrics端口10254只以数字形式暴露，而没有对应的端口名称。

技术分析

当前实现机制

当前Prometheus Operator的PodMonitor实现中，当使用targetPort字段指定端口时，Operator会生成一个基于__meta_kubernetes_pod_container_port_name的relabel配置。这意味着：

如果端口在Pod定义中有明确的名称，这种配置可以正常工作
如果端口只有数字定义而没有名称，这种配置就会失效

解决方案比较

目前有两种可行的解决方案：

使用targetPort的数值形式
虽然文档中targetPort被标记为"deprecated"，但它仍然支持直接指定端口号（不带引号的数字形式）。这种方式可以绕过端口名称的限制。
创建Service并使用ServiceMonitor
另一种更规范的解决方案是为这些Pod创建对应的Service资源，然后使用ServiceMonitor来进行监控。这种方式虽然需要额外资源，但更符合Kubernetes的最佳实践。