Kubernetes Descheduler 0.32.0版本中的PodDisruptionBudget权限问题分析

2025-06-11 07:46:34作者：冯爽妲Honey

项目地址：https://gitcode.com/gh_mirrors/des/descheduler

Kubernetes Descheduler作为集群资源优化的重要组件，在0.32.0版本发布后，用户在使用过程中发现了一个关键的权限配置问题。这个问题会导致Descheduler无法正常获取PodDisruptionBudget资源信息，影响其调度决策功能。

问题现象

当用户将Descheduler升级到0.32.0版本后，日志中会出现类似如下的错误信息：

W0103 10:56:41.504105       1 reflector.go:569] k8s.io/client-go/informers/factory.go:160: failed to list *v1.PodDisruptionBudget: poddisruptionbudgets.policy is forbidden: User "system:serviceaccount:kube-system:descheduler" cannot list resource "poddisruptionbudgets" in API group "policy" at the cluster scope

这表明Descheduler的服务账户缺少对PodDisruptionBudget资源的访问权限，无法获取集群范围内的PodDisruptionBudget信息。

问题根源

深入分析后发现，问题的根本原因是0.32.0版本的Helm Chart中，Descheduler的ClusterRole定义缺少了对policy API组中poddisruptionbudgets资源的必要权限。Descheduler需要这些权限来：

获取PodDisruptionBudget列表
监控PodDisruptionBudget变更
读取PodDisruptionBudget详情

这些权限对于Descheduler正确评估Pod的驱逐安全性至关重要，特别是在考虑PodDisruptionBudget约束的情况下进行Pod驱逐决策。

解决方案

临时解决方案

对于急需解决问题的用户，可以通过以下方式手动添加缺失的权限：

直接编辑ClusterRole资源：

apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  name: descheduler-clusterrole
rules:
- apiGroups: ["policy"]
  resources: ["poddisruptionbudgets"]
  verbs: ["get", "list", "watch"]

对于使用FluxCD的用户，可以通过postRenderers配置自动添加权限：

postRenderers:
  - kustomize:
      patches:
        - target:
            kind: ClusterRole
          patch: |
            - op: add
              path: /rules/-
              value:
                verbs: ["get", "watch", "list"]
                apiGroups: ["policy"]
                resources: ["poddisruptionbudgets"]

长期解决方案

官方已在后续版本中修复了这个问题。建议用户升级到包含修复的版本（0.32.1之后的版本），以获得完整的权限配置。

影响分析

这个问题主要影响以下功能场景：

当Descheduler尝试驱逐受PodDisruptionBudget保护的Pod时
在评估Pod驱逐安全性时
在计算集群资源平衡时考虑PDB约束

缺少这些权限不会导致Descheduler完全无法工作，但会影响其决策的准确性和安全性，可能导致违反PDB约束的Pod驱逐操作。

最佳实践建议

在升级Descheduler前，始终检查版本变更日志中的权限变更
对于生产环境，建议先在测试环境验证新版本
考虑使用RBAC审计工具定期检查服务账户权限
对于关键系统组件，建立权限需求的文档记录

总结

Kubernetes生态系统中，权限配置是保障组件安全运行的基础。这次Descheduler的权限问题提醒我们，在组件升级时需要特别关注RBAC配置的变化。通过理解问题本质和掌握解决方案，运维团队可以更好地维护集群调度系统的稳定性和可靠性。

项目地址：https://gitcode.com/gh_mirrors/des/descheduler

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

ohos_react_native

React Native鸿蒙化仓库

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。