Kubereboot/kured 优化：节点重启过程中的调度策略改进

2025-07-02 04:34:41作者：廉皓灿Ida

在 Kubernetes 集群运维中，节点重启是一个常见的操作场景。Kubereboot 项目下的 kured 组件作为集群重启守护进程，其核心职责是安全有序地管理节点重启流程。近期社区针对节点重启调度策略提出了一项重要优化建议，本文将深入分析其技术背景、现有问题及改进方案。

当前机制的技术痛点

现有 kured 实现中存在一个关键行为逻辑：当同时启用 prefer-no-schedule-taint（优选不调度污点）和 blocking-pod-selector（阻塞Pod选择器）时，若节点存在阻塞条件（如匹配的Pod存在或Prometheus告警触发），系统会直接进入休眠等待状态，而不会立即为节点添加调度污点。

这种设计会导致两个显著问题：

调度真空期：在等待下一次检测周期期间，新的阻塞Pod可能被调度到该节点
重启延迟放大：节点可能长期无法满足"无阻塞Pod"的条件，显著延长整个集群的重启周期

优化方案设计原理

提出的改进方案核心思想是前置调度隔离，即在检测到节点需要重启的第一时间（无论是否存在阻塞条件）就施加 PreferNoSchedule 污点。这种设计带来以下技术优势：

主动防御：通过早期污点标记，有效阻止新Pod被调度到待重启节点
渐进式解耦：允许调度器有更长时间将现有Pod迁移到其他可用节点
最终一致性：当所有阻塞条件解除后，节点可立即进入重启流程

实现方案对比

特性	原实现方案	优化后方案
污点触发时机	无阻塞条件时	检测到重启需求时立即触发
调度器介入时间窗口	较短（仅无阻塞期）	从检测到需求到实际重启全程
集群重启效率	可能因持续阻塞而延迟	最大化利用调度器能力加速重启
适用场景	阻塞Pod较少的稳定环境	动态调度需求较高的生产环境