Kubernetes Descheduler中nonRemovablePods问题解析与解决方案

2025-06-11 07:31:38作者：董灵辛Dennis

项目地址：https://gitcode.com/gh_mirrors/des/descheduler

问题背景

在使用Kubernetes Descheduler的lowNodeUtilization策略时，用户可能会在日志中看到"nonRemovablePods"的提示信息。这表明Descheduler识别出了需要重新调度的Pod，但由于某些限制条件无法实际执行驱逐操作。

nonRemovablePods的含义

nonRemovablePods指的是那些根据Descheduler默认策略或用户配置不能被驱逐的Pod。这些Pod通常包括以下几种类型：

DaemonSet管理的Pod
带有本地存储的Pod
具有系统关键优先级的Pod
优先级高于指定阈值的Pod
处于kube-system等排除命名空间中的Pod

问题诊断方法

要深入了解为什么某些Pod被标记为nonRemovablePods，可以将Descheduler的日志级别调整为v=4或更高。这样可以在日志中看到更详细的决策信息，例如：

checks="[pod is a DaemonSet pod, pod has local storage and descheduler is not configured with evictLocalStoragePods]"
checks="pod is a DaemonSet pod"
checks="[pod is a DaemonSet pod, pod has system critical priority, pod has higher priority than specified priority class threshold]"

解决方案

1. 配置允许驱逐特定类型Pod

在Descheduler的配置中，可以通过以下参数放宽驱逐限制：

LowNodeUtilization:
  enabled: true
  params:
    evictLocalStoragePods: true
    evictDaemonSetPods: true

2. 调整资源利用率阈值

合理设置资源利用率阈值可以更精确地控制Descheduler的行为：

nodeResourceUtilizationThresholds:
  thresholds:
    memory: 50
  targetThresholds:
    memory: 70

3. 排除特定命名空间

对于系统关键Pod所在的命名空间，可以配置排除规则：

evictableNamespaces:
  exclude:
  - "kube-system"

版本兼容性注意事项

在某些较旧版本的Descheduler中，即使配置了允许驱逐特定类型Pod的参数，实际行为可能仍不符合预期。如用户反馈，升级到v0.31版本后问题得到解决。因此，建议用户：

使用最新稳定版本的Descheduler
仔细阅读版本变更日志，了解行为变更
在生产环境部署前进行充分测试

最佳实践建议

在非生产环境充分测试Descheduler配置
逐步调整参数，观察集群行为变化
结合监控系统评估Descheduler效果
为关键工作负载设置适当的Pod优先级和反亲和性规则
定期审查Descheduler日志，确保其行为符合预期

通过合理配置和版本选择，可以充分发挥Descheduler在Kubernetes集群资源优化中的作用，同时避免对关键业务造成影响。

descheduler

项目地址：https://gitcode.com/gh_mirrors/des/descheduler

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

Kubernetes Descheduler中nonRemovablePods问题解析与解决方案

问题背景

nonRemovablePods的含义

问题诊断方法

解决方案

1. 配置允许驱逐特定类型Pod

2. 调整资源利用率阈值

3. 排除特定命名空间

版本兼容性注意事项

最佳实践建议

热门内容推荐

最新内容推荐

项目优选

Kubernetes Descheduler中nonRemovablePods问题解析与解决方案

问题背景

nonRemovablePods的含义

问题诊断方法

解决方案

1. 配置允许驱逐特定类型Pod

2. 调整资源利用率阈值

3. 排除特定命名空间

版本兼容性注意事项

最佳实践建议

相关内容推荐

热门内容推荐

最新内容推荐

项目优选