Prometheus Operator中使用Traefik作为Ingress控制器的实践指南

2025-05-31 05:36:27作者：曹令琨Iris

prometheus-operator/kube-prometheus: kube-prometheus项目提供了在Kubernetes集群中部署Prometheus监控解决方案的一体化方法，包括Prometheus Server、Alertmanager、Grafana以及其他相关的监控组件，旨在简化在K8s环境下的监控配置与管理。

项目地址：https://gitcode.com/gh_mirrors/ku/kube-prometheus

前言

在Kubernetes环境中部署监控系统时，Prometheus Operator是一个常用的解决方案。然而，当涉及到Ingress控制器的选择时，许多用户会遇到配置上的挑战。本文将详细介绍如何在Prometheus Operator中使用Traefik作为Ingress控制器，并解决常见的访问问题。

环境准备

首先需要明确的是，本文讨论的环境基于以下组件：

Kubernetes集群（文中示例使用TKG/VMware Tanzu Kubernetes Grid）
Prometheus Operator v0.71.2
Traefik作为Ingress控制器
cert-manager用于证书管理

核心问题分析

用户在尝试通过Traefik暴露Prometheus、Alertmanager和Grafana服务时遇到了以下问题：

Grafana返回"Bad Gateway"错误
Alertmanager和Prometheus返回404错误

这些问题通常源于Ingress配置不完整或服务路由不正确。

详细解决方案

1. 基础Ingress配置

对于Prometheus的Ingress配置，需要特别注意以下几点：

apiVersion: networking.k8s.io/v1
kind: Ingress
metadata:
  name: prometheus-ingress
  namespace: monitoring
  annotations:
    cert-manager.io/cluster-issuer: letsencrypt-http-live
spec:
  ingressClassName: traefik  # 明确指定Traefik作为Ingress控制器
  tls:
  - secretName: prometheus-ingress-cert
    hosts:
    - prometheus.yourdomain.com
  rules:
  - host: prometheus.yourdomain.com
    http:
      paths:
      - path: /
        pathType: Prefix
        backend:
          service:
            name: prometheus-k8s
            port:
              name: web  # 必须与服务端口名称匹配

2. 网络策略配置

在启用了网络策略的集群中，必须确保Traefik能够访问后端服务。以下是允许Traefik访问Grafana的网络策略示例：

apiVersion: networking.k8s.io/v1
kind: NetworkPolicy
metadata:
  name: grafana-ingress
  namespace: monitoring
spec:
  podSelector:
    matchLabels:
      app.kubernetes.io/name: grafana
  ingress:
  - from:
    - podSelector:
        matchLabels:
          app.kubernetes.io/name: traefik
      namespaceSelector:
        matchLabels:
          kubernetes.io/metadata.name: kube-system
    ports:
    - port: 3000
      protocol: TCP