runc项目在cgroup v1 rootless模式下共享PID命名空间的容器删除问题分析

2025-05-18 17:16:52作者：郜逊炳

问题背景

在容器技术中，runc作为低级别的容器运行时工具，负责实际创建和运行容器。近期在runc v1.2.0-rc.3版本中发现了一个特定场景下的功能退化问题：当在cgroup v1环境下以非root用户(rootless)运行容器，并且容器间共享PID命名空间时，使用nerdctl rm -f命令删除容器会出现挂起现象。

问题现象

具体表现为：

首先创建一个名为foo的基础容器
然后创建一个名为bar的容器，与foo共享PID命名空间
当尝试使用nerdctl rm -f bar强制删除bar容器时，命令会挂起

值得注意的是，这个问题仅在特定环境下出现：

Ubuntu 20.04系统（使用cgroup v1）
以非root用户(rootless)运行
使用runc v1.2.0-rc.3版本

而在其他环境中则表现正常，包括：

相同系统但使用cgroup v2
以root用户运行
使用runc v1.1.14版本

技术分析

根本原因

经过排查，这个问题是由于runc在v1.2.0-rc.3版本中对信号处理逻辑的修改引起的。具体来说，commit 9583b3d1c297021109081872c52302316ede15b1中"libct: move killing logic to container.Signal"的改动导致了此问题。

在cgroup v1 rootless模式下，当容器共享PID命名空间时，runc kill命令无法简单地杀死容器初始化进程(因为共享PID命名空间后，该进程不再是PID 1)。理论上，它应该杀死容器cgroup中的所有进程。然而，在rootless模式下，cgroup v1可能无法正确设置或访问，导致无法完成这一操作。

运行机制差异

有趣的是，虽然nerdctl rm -f bar会挂起，但分步执行nerdctl stop bar && nerdctl rm bar却能正常工作。这是因为两种操作虽然最终都会调用runc kill命令，但执行路径和时序有所不同：

直接rm -f尝试立即强制终止容器，在cgroup v1 rootless环境下遇到进程终止问题
分步操作可能给了容器更优雅的终止机会，或者时序差异避免了竞争条件

解决方案

针对这个问题，社区提出了几种可能的解决方案：

代码修复：通过PR #4395修复了信号处理逻辑，使runc能够正确处理这种特殊情况
配置限制：从设计角度考虑，可以在runc run/start时就检测并阻止这种不支持的配置组合(cgroup v1 + rootless + 共享PID命名空间)
警告机制：在不完全禁止的情况下，至少应该向用户发出警告，提示这种配置可能存在问题