Sysbox容器中高CPU占用问题的分析与解决

2025-06-26 00:10:12作者：段琳惟

An open-source, next-generation "runc" that empowers rootless containers to run workloads such as Systemd, Docker, Kubernetes, just like VMs.

项目地址：https://gitcode.com/gh_mirrors/sy/sysbox

问题背景

Sysbox是一款用于运行系统级工作负载的容器运行时，它通过特殊的虚拟化技术使容器能够像虚拟机一样运行系统服务。近期用户报告在使用Sysbox运行容器时出现sysbox-fs进程CPU占用率异常升高的问题，特别是在容器中挂载GPU设备（如/dev/dri/renderD128）时更为明显。

问题现象

当用户在Sysbox容器中挂载设备文件时，系统日志中会出现大量重复的umount调用记录，主要针对/run/systemd/mount-rootfs/sys/devices/virtual路径。这些调用形成了一个无限循环，导致sysbox-fs进程持续消耗大量CPU资源。

日志示例显示sysbox-fs不断收到并忽略针对该路径的卸载请求：

Received umount syscall from pid 1098145
target: /run/systemd/mount-rootfs/sys/devices/virtual
Ignoring unmount of sysbox-fs managed submount at /run/systemd/mount-rootfs/sys/devices/virtual

根本原因分析

经过深入调查，发现问题源于以下几个关键因素：

系统服务冲突：容器内的e2scrub_reap.service和e2scrub_all.timer服务会定期执行文件系统检查，这些服务在容器环境中是不必要的，因为它们通常由宿主机执行。
mount命名空间处理：Sysbox会拦截容器内的mount和umount系统调用。当系统尝试卸载sysbox-fs管理的挂载点时（如/sys/devices/virtual），Sysbox出于安全考虑会阻止这些操作，导致调用方不断重试。
递归绑定挂载问题：systemd服务会将容器的根文件系统递归绑定挂载到/run/systemd/mount-rootfs/，然后尝试卸载其中的虚拟设备目录，而Sysbox错误地将这些卸载请求识别为对原始sysbox-fs挂载点的操作。

解决方案

Sysbox开发团队提供了多层次的解决方案：

临时解决方案：
- 在容器内禁用e2scrub相关服务：
```
systemctl stop e2scrub_reap.service
systemctl disable e2scrub_reap.service e2scrub_all.timer
```
- 重启sysbox-fs服务可以暂时缓解问题
长期修复：
- Sysbox团队在代码库中修复了挂载点识别逻辑，确保只保护原始sysbox-fs挂载点，而允许对绑定挂载副本的操作
- 该修复已合并到主分支，将在v0.6.5版本中发布
最佳实践：
- 对于基于Ubuntu Noble的Sysbox容器镜像，官方已更新镜像默认禁用这些服务
- 用户自定义镜像时应评估容器内运行的服务必要性，禁用容器环境不需要的系统服务

技术细节

Sysbox通过以下机制实现安全隔离：

syscall拦截：使用seccomp过滤器和ptrace拦截容器内的mount/umount调用
虚拟文件系统：sysbox-fs为/proc和/sys中的特定路径提供虚拟化视图
挂载点保护：防止容器进程卸载关键虚拟文件系统挂载点

在修复中，开发团队改进了挂载点识别算法，现在能够正确区分：

原始sysbox-fs管理的挂载点（需要保护）
用户创建的绑定挂载副本（可以安全卸载）

影响评估

该问题主要影响以下场景：

使用systemd作为init系统的容器
容器中挂载额外设备文件的场景
运行文件系统检查等系统服务的容器环境

对于大多数轻量级容器工作负载，可能不会触发此问题。但对于需要完整系统环境的容器（如运行Kubernetes节点、CI/CD构建环境等），此问题更为常见。

结论

Sysbox容器中的高CPU占用问题展示了容器运行时与系统服务交互时的复杂性。通过深入分析系统调用拦截、挂载命名空间管理等底层机制，Sysbox团队不仅解决了当前问题，还增强了运行时对复杂场景的处理能力。

对于用户而言，理解容器与虚拟机的差异、合理配置容器内服务是避免类似问题的关键。Sysbox的持续改进也体现了开源项目对用户反馈的快速响应能力，使其成为运行系统级容器工作负载的可靠选择。

An open-source, next-generation "runc" that empowers rootless containers to run workloads such as Systemd, Docker, Kubernetes, just like VMs.

项目地址：https://gitcode.com/gh_mirrors/sy/sysbox

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理