Sealos在麒麟SP3系统部署Kubernetes集群的runc兼容性问题解析

2025-05-14 04:31:06作者：咎竹峻Karen

Sealos，革新您的云体验！这是一个基于Kubernetes打造的现代化云操作系统，打破传统架构束缚，引领你步入以K8s为核心的新时代云计算。想象一下，如同操作电脑般轻松驾驭云资源，无论是瞬间部署Nginx，还是快速启动高可用数据库集群，乃至运行复杂的低代码平台，Sealos都游刃有余。其核心优势在于一键式应用管理，高速数据库部署，及兼具公私云特性的灵活解决方案，帮助企业极大提升效率，降低经济负担。加入这个强大且友好的社区，共同探索无缝迁移至云端、低成本高安全的未来之路。无论是技术新手还是资深开发者，在Sealos的世界里，都能找到属于你的那份简单与高效。立即探索，开启云端之旅！

项目地址：https://gitcode.com/gh_mirrors/sea/sealos

问题背景

在使用Sealos工具部署Kubernetes集群时，用户在麒麟SP3操作系统(aarch64架构)上遇到了控制平面组件无法正常启动的问题。具体表现为kubelet无法从/etc/kubernetes/manifests目录加载静态Pod，包括kube-apiserver、kube-controller-manager和kube-scheduler等核心组件。值得注意的是，相同配置在麒麟SP2系统上可以正常部署，仅存在cgroup相关的小问题。

现象分析

通过排查发现以下关键现象：

kubelet服务状态显示为running，但报错"getting node xxx not found"
containerd服务也处于running状态，但报错"failed to get sandbox container task: no running task found"
使用crictl命令检查容器时，发现容器实际上并未成功创建，因此无法获取容器日志

根本原因

经过深入排查，发现问题根源在于麒麟SP3系统自带的runc版本存在兼容性问题。runc是容器运行时的重要组件，负责实际创建和运行容器。当使用SP3系统默认的/usr/local/bin/runc时，容器创建过程会失败，导致Kubernetes控制平面组件无法启动。

解决方案

验证有效的解决方法是：

获取麒麟SP2系统上的runc可执行文件
替换SP3系统中的/usr/local/bin/runc为SP2版本的runc
重启containerd和kubelet服务

技术原理深入

runc作为OCI(Open Container Initiative)标准的参考实现，其版本兼容性对容器运行至关重要。不同Linux发行版可能会对runc进行定制化修改，这可能导致在特定环境下的兼容性问题。在本案例中，麒麟SP3系统的runc实现可能与containerd或Kubernetes的某些特性不兼容，导致容器创建失败。