在kube-hetzner项目中实现节点预安装重启的最佳实践

2025-06-27 19:19:17作者：董斯意

在基于Terraform的kube-hetzner项目部署过程中，用户经常需要在节点预安装阶段执行系统级操作，这些操作有时需要重启节点才能生效。本文深入分析这一技术挑战，并提供经过验证的解决方案。

问题背景分析

当使用kube-hetzner项目创建混合集群时，用户可能需要在preinstall_exec阶段完成以下操作：

安装Tailscale等网络组件
修改系统安全策略
启用持久化服务

这些操作中，某些系统级变更（如内核模块加载、SELinux策略更新）需要重启才能完全生效。然而，直接在preinstall_exec脚本中执行reboot命令会导致Terraform的remote-exec provisioner异常中断。

技术挑战详解

Terraform的远程执行机制存在以下限制：

同步执行模型：provisioner需要等待脚本完整执行并返回退出状态码
连接中断检测：当节点重启时，SSH连接会意外终止
状态一致性：无法确保重启后脚本继续执行剩余命令

原始方案中尝试的"shutdown -r 1"命令虽然能延迟重启，但仍会导致provisioner报"remote command exited without exit status"错误。

已验证解决方案

方案一：自定义MicroOS快照（推荐）

预先创建包含所有必要软件和配置的MicroOS镜像
在镜像构建阶段完成需要重启的操作
使用定制镜像作为部署基础

优势：

完全避免运行时重启需求
部署过程更可靠
减少Terraform执行时间

实现步骤：

启动临时MicroOS实例
执行所有系统配置和软件安装
创建Hetzner云快照
在kube-hetzner配置中指定自定义镜像ID

方案二：分阶段部署模式

将需要重启的操作分离到独立脚本
使用systemd服务确保重启后继续执行
通过Terraform的local-exec触发后续流程

示例实现：

# 第一阶段preinstall_exec
"echo '#!/bin/bash' > /root/post-reboot.sh",
"echo 'systemctl enable --now tailscaled' >> /root/post-reboot.sh",
"chmod +x /root/post-reboot.sh",
"echo '[Unit]' > /etc/systemd/system/post-reboot.service",
"echo 'After=network.target' >> /etc/systemd/system/post-reboot.service",
"echo '[Service]' >> /etc/systemd/system/post-reboot.service",
"echo 'ExecStart=/root/post-reboot.sh' >> /etc/systemd/system/post-reboot.service",
"echo '[Install]' >> /etc/systemd/system/post-reboot.service",
"echo 'WantedBy=multi-user.target' >> /etc/systemd/system/post-reboot.service",
"systemctl enable post-reboot.service",
"shutdown -r +1"