Kubernetes Metrics Server在1.24+版本中的ServiceAccount令牌问题解析

2025-06-04 06:51:20作者：咎竹峻Karen

**Metrics Server：精准驱动Kubernetes容器自动扩展的利器** Metrics Server是专为Kubernetes设计的轻量级资源度量中枢，支撑着集群的自动化运维核心。它无缝集成于Kubelets与API服务器之间，每15秒快速搜集节点资源使用情况，通过Metrics API为横向和垂直 Pod 自动缩放提供关键数据，同时也简化了利用`kubectl top`进行问题排查的过程。这一高效部署方案在大多数集群中即装即用，仅占用每个节点微小的1毫核CPU和2MB内存，轻松支撑至5000节点的大规模集群。适用于基于CPU/内存的自动扩缩容，以及辅助调整容器资源需求。注意，它专注服务于自规模化场景，对于监控系统数据源，请直接从Kubelet获取。想拥抱智能扩缩容？Metrics Server，让您的Kubernetes集群管理更加得心应手！

项目地址：https://gitcode.com/gh_mirrors/met/metrics-server

问题背景

在Kubernetes 1.24及更高版本中，Metrics Server组件在默认安装后出现无法采集kubelet指标的问题。这一问题主要表现为Metrics Server持续收到403 Forbidden错误，导致无法获取节点指标数据。

根本原因分析

问题的核心在于Kubernetes 1.24版本引入的一个重要安全变更：ServiceAccount的令牌/密钥不再自动创建。这一变更属于Kubernetes对安全模型的改进，旨在减少默认情况下不必要的长期凭证。

在Metrics Server的场景中，组件需要访问kubelet的10250端口来获取节点指标。在1.24之前版本中，系统会自动为Metrics Server的ServiceAccount创建令牌，使得组件能够通过身份验证。但在新版本中，这一自动机制被移除，导致Metrics Server无法获取有效的身份凭证。

技术细节

当Metrics Server尝试访问kubelet API时，会经历以下流程：

Metrics Server使用其ServiceAccount的身份发起请求
由于缺少有效的令牌，请求无法通过身份验证
kubelet返回403 Forbidden响应
Metrics Server记录错误日志并无法获取指标数据

错误日志中通常会显示类似以下内容：

Failed to scrape node err="request failed, status: \"403 Forbidden\"" node="node-name"

解决方案

临时解决方案（不推荐）

修改kubelet的授权模式为AlwaysAllow可以临时解决问题，但会带来严重的安全隐患：

--authorization-mode=AlwaysAllow

这种方法虽然能让Metrics Server工作，但会完全禁用kubelet API的身份验证，使集群面临安全风险。

最佳实践建议

对于生产环境，始终使用手动创建的ServiceAccount令牌
定期轮换这些令牌以提高安全性
考虑使用TokenRequest API而不是静态令牌
监控Metrics Server的运行状态，确保指标采集正常工作

版本兼容性说明

这一问题主要影响Kubernetes 1.24及以上版本。对于使用较新Kubernetes版本的用户，需要特别注意这一变更，并在部署Metrics Server时采取相应的配置措施。

总结

Kubernetes 1.24的安全改进虽然增加了初始配置的复杂性，但提高了集群的整体安全性。理解并正确处理ServiceAccount令牌的创建和管理，是确保Metrics Server等组件在新版本Kubernetes中正常运行的关键。建议管理员在升级集群时，仔细审查所有依赖ServiceAccount令牌的组件配置，确保它们符合新的安全模型要求。

metrics-server