Kured 1.16.0 版本中检测不到重启信号文件的问题分析与解决

2025-07-02 13:46:52作者：滕妙奇

问题背景

Kured（Kubernetes Reboot Daemon）是 Kubernetes 生态中用于管理节点重启的工具，它通过检测系统是否需要重启来确保节点安全更新。近期有用户反馈，在升级到 Kured 1.16.0 版本后，工具无法正确识别 /var/run/reboot-required 文件，导致系统即使存在重启需求也不会触发重启流程。

问题现象

用户部署环境为：

K3s 1.30.3-rc1
Kured 1.16.0（通过官方YAML部署）

日志显示Kured持续报告"Reboot not required"，但实际上系统已生成重启标记文件：

-rw-r--r--. 1 root root 0 Jul 29 16:23 /var/run/reboot-required

根本原因分析

通过深入排查发现，问题源于配置不完整：

文件路径映射问题：Kured 1.16.0 默认通过容器内的 /sentinel 目录来访问主机的 /var/run 目录，这是通过HostMount实现的。
配置缺失：用户使用了额外的补丁YAML文件来配置Kured，但该配置中遗漏了关键的 sentinel 参数，导致Kured仍然尝试从默认的 /var/run 路径查找重启标记文件，而该路径在容器内并不存在。
版本差异：Kured 1.14.0 可以正常工作，说明新版本在路径处理逻辑上有所变化，需要更精确的配置。

解决方案

要解决这个问题，需要确保：

完整的sentinel配置：在部署配置中明确指定sentinel目录的映射关系：

volumeMounts:
- mountPath: /sentinel
  name: sentinel
volumes:
- hostPath:
    path: /var/run
    type: Directory
  name: sentinel

正确的检测路径：确保Kured配置中使用的是容器内的映射路径 /sentinel/reboot-required 而非主机路径 /var/run/reboot-required。

验证方法

可以通过以下命令验证配置是否正确：

检查容器内是否能访问标记文件：

kubectl exec -n kube-system <kured-pod> -- ls -l /sentinel/reboot-required

查看Kured日志确认检测路径：

kubectl logs -n kube-system <kured-pod> | grep "Reboot check command"

最佳实践建议

版本升级注意事项：在升级Kured时，特别是跨越大版本时，应仔细阅读版本变更说明，关注配置参数的变化。
配置统一管理：避免使用多个YAML文件片段来配置同一个组件，这容易导致配置冲突或遗漏。
日志监控：部署后应持续监控Kured日志，确保其按预期工作。
测试环境验证：在生产环境部署前，先在测试环境验证新版本的行为。

总结

这个问题典型地展示了配置管理在容器化环境中的重要性。Kured作为系统关键组件，其正确配置直接关系到节点的安全维护。通过这个案例，我们学习到：

容器内外路径映射需要明确配置
版本升级需要关注配置变更
多配置文件的协调管理至关重要

正确的配置后，Kured 1.16.0能够正常工作，及时检测并处理系统的重启需求，保障Kubernetes集群的稳定运行。

kured

项目地址：https://gitcode.com/gh_mirrors/ku/kured

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

202

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理