Sysbox容器运行时中解决只读根文件系统下cgroup挂载问题

2025-06-26 12:30:10作者：苗圣禹Peter

背景与问题描述

在Kubernetes环境中使用Sysbox容器运行时（一种支持容器内运行容器的特殊运行时）时，安全团队通常会要求将容器的根文件系统设置为只读模式。这种配置可以有效防止容器内root用户随意写入文件导致宿主节点磁盘耗尽的风险。

然而，当Sysbox容器以只读根文件系统启动时，会出现一个关键问题：/sys/fs/cgroup目录会被自动挂载为只读模式。这会导致容器内无法运行Docker等容器运行时，因为这些运行时需要可写的cgroup文件系统来管理资源限制。

通过分析Sysbox的挂载行为，我们发现：

深入研究发现，这实际上是Sysbox的一个设计特性与实现细节问题。Sysbox通过sysbox-fs组件管理这些特殊挂载点，其默认行为会阻止关键系统目录的重新挂载操作。

在Sysbox 0.6.5及更高版本中，可以通过以下步骤解决此问题：

修改sysbox-mgr配置：编辑/lib/systemd/system/sysbox-mgr.service文件，在启动参数中添加--relaxed-read-only选项：
```
ExecStart=/usr/bin/sysbox-mgr --disable-inner-image-preload --relaxed-read-only
```

重启Sysbox服务：

systemctl daemon-reload
systemctl restart sysbox

持久化配置（针对Kubernetes环境）：修改kube-system命名空间下的sysbox-operational-attributes ConfigMap，在SYSBOX_MGR_CONFIG值中添加--relaxed-read-only参数。

--relaxed-read-only参数改变了Sysbox对只读容器的处理方式：

虽然此方案放松了部分限制，但仍保持了合理的安全边界：

对于生产环境，建议：

通过这种配置，可以在保证安全性的同时，获得Sysbox提供的容器内运行容器的强大功能。

登录后查看全文