Prometheus Operator中实现Kubelet指标采集的技术方案

2025-05-25 22:28:11作者：凌朦慧Richard

在Kubernetes监控体系中，采集kubelet的监控指标对于了解节点资源使用情况至关重要，特别是持久卷(PV)的容量监控。本文将详细介绍在Prometheus Operator环境下实现kubelet指标采集的完整技术方案。

核心需求分析

kubelet作为Kubernetes节点上的核心组件，提供了丰富的指标数据接口。要采集这些指标，需要解决三个关键问题：

服务账号权限配置
指标采集端点发现
TLS安全通信

传统实现方案

早期方案通常通过additionalScrapeConfigs参数添加采集配置，需要手动配置以下内容：

服务账号权限配置ClusterRole：

rules:
- apiGroups: [""]
  resources: ["nodes", "nodes/proxy"]
  verbs: ["get"]

采集任务配置示例：

- job_name: kubernetes-nodes
  kubernetes_sd_configs:
  - role: node
  scheme: https
  tls_config:
    ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
  bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
  relabel_configs:
  - action: labelmap
    regex: __meta_kubernetes_node_label_(.+)
  - replacement: kubernetes.default.svc:443
    target_label: __address__
  - source_labels: [__meta_kubernetes_node_name]
    regex: (.+)
    replacement: /api/v1/nodes/$1/proxy/metrics
    target_label: __metrics_path__

现代最佳实践

随着Prometheus Operator的发展，现在推荐使用ScrapeConfig CRD来实现更优雅的配置：

创建ScrapeConfig资源：

apiVersion: monitoring.coreos.com/v1alpha1
kind: ScrapeConfig
metadata:
  name: kubernetes-nodes
spec:
  kubernetesSDConfigs:
  - role: node
  scheme: https
  tlsConfig:
    caFile: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
  bearerTokenFile: /var/run/secrets/kubernetes.io/serviceaccount/token
  relabelings:
  - action: labelmap
    regex: __meta_kubernetes_node_label_(.+)
  - replacement: kubernetes.default.svc:443
    targetLabel: __address__
  - sourceLabels: [__meta_kubernetes_node_name]
    regex: (.+)
    replacement: /api/v1/nodes/$1/proxy/metrics
    targetLabel: __metrics_path__