解决Kind在Ubuntu LTS上创建集群失败的问题

2025-05-15 23:19:08作者：郁楠烈Hubert

在使用Kind创建Kubernetes集群时，用户可能会遇到"failed to create cluster"的错误，特别是在Ubuntu LTS系统上。本文将深入分析这个问题的原因，并提供有效的解决方案。

问题现象

当在Ubuntu 24.04 LTS系统上执行kind create cluster命令时，会出现以下错误信息：

Creating cluster "kind" ...
 ✓ Ensuring node image (kindest/node:v1.32.2) 🖼 
 ✗ Preparing nodes 📦  
Deleted nodes: ["kind-control-plane"]
ERROR: failed to create cluster: could not find a log line that matches "Reached target .*Multi-User System.*|detected cgroup v1"

问题分析

这个错误表明Kind在准备节点时遇到了问题，无法找到特定的日志行来确认系统状态。经过调查，这通常与系统的inotify资源限制有关。

inotify是Linux内核提供的一个机制，用于监控文件系统事件。当inotify的资源限制设置过低时，可能会导致Kind无法正常创建集群，因为Kubernetes组件需要监控大量文件变化。

解决方案

要解决这个问题，需要调整系统的inotify资源限制。具体步骤如下：

编辑系统配置文件：

sudo nano /etc/sysctl.conf

在文件末尾添加以下配置：

fs.inotify.max_user_watches = 524288
fs.inotify.max_user_instances = 512

保存文件后，执行以下命令使配置生效：

sudo sysctl -p

配置说明

fs.inotify.max_user_watches：设置单个用户可监控的文件数量上限，默认值通常较低，增加此值可以确保Kubernetes组件能够监控足够的文件变化。
fs.inotify.max_user_instances：设置单个用户可创建的inotify实例数量上限，增加此值可以确保系统能够创建足够的监控实例。

验证解决方案

调整完inotify限制后，再次尝试创建Kind集群：

kind create cluster

如果一切正常，集群应该能够成功创建。如果仍然遇到问题，可以考虑使用--retain参数保留失败的集群，然后导出日志进行更详细的分析：

kind create cluster --retain
kind export logs

总结

在Ubuntu LTS系统上使用Kind创建Kubernetes集群时，可能会因为系统inotify资源限制不足而导致失败。通过适当调整fs.inotify.max_user_watches和fs.inotify.max_user_instances参数，可以解决这个问题。这些调整不仅有助于Kind集群的创建，也能改善其他需要大量文件监控的应用的性能表现。

kind

Kubernetes IN Docker - local clusters for testing Kubernetes

项目地址：https://gitcode.com/gh_mirrors/ki/kind

登录后查看全文