Containerd中非特权容器启用可写cgroups的技术解析

2025-05-12 09:15:36作者：卓炯娓

containerd 是一个容器运行时和镜像生成工具，用于管理容器化应用程序的生命周期管理。 * 容器化应用程序管理、容器运行时和编排工具 * 有什么特点：容器管理工具、支持多种容器化应用程序管理和部署工具、易于使用和集成

项目地址：https://gitcode.com/GitHub_Trending/co/containerd

在容器化技术中，cgroups（控制组）是Linux内核提供的重要资源管理机制。传统上，只有特权容器才能获得对cgroups的写权限，这限制了非特权容器对自身资源管理的灵活性。本文将深入探讨containerd项目中如何为普通容器启用cgroups写权限的技术实现。

背景与现状

在默认配置下，使用cgroup v2时，容器的cgroup接口会被挂载为只读模式。这种设计虽然提高了安全性，但也带来了一些限制。例如，某些需要动态调整资源限制的应用场景（如GitLab中的仓库级资源隔离）就无法在非特权容器中实现。

目前，CRI-O运行时已经通过特定注解实现了这一功能，而containerd社区也在考虑引入类似的支持。这种需求主要来源于以下几种场景：

容器内运行Docker（DinD）的场景
需要动态调整资源限制的应用
构建系统需要在容器内管理子进程资源

技术实现方案

containerd社区提出了两种主要实现路径：

运行时类配置：通过在containerd配置文件中为特定运行时处理器添加cgroup_writable = true选项，管理员可以精细控制哪些容器可以获得cgroups写权限。
注解方式：类似于CRI-O的实现，通过特定注解来请求cgroups写权限，但需要配合严格的安全控制机制。

从安全角度考虑，运行时类配置更为推荐，因为它：

需要节点管理员显式配置
可以与用户命名空间结合使用
避免了注解可能带来的安全风险

安全考量

启用cgroups写权限会带来一定的安全风险，需要特别注意：

在cgroup v2环境下，除非授予CAP_BPF能力，否则设备控制器的委托是相对安全的
必须确保只有受信任的工作负载才能获得此权限
建议与用户命名空间隔离结合使用
需要防止容器请求无限资源的情况

未来展望

Kubernetes社区已经就此功能展开了讨论，未来可能会通过CRI接口提供标准化的支持方式。同时，containerd的实现也将与上游Kubernetes的进展保持同步。

对于需要此功能的用户，目前可以通过containerd的运行时类配置进行实验性使用，但需要注意这仍处于发展阶段，生产环境使用前应充分评估安全影响。

containerd 是一个容器运行时和镜像生成工具，用于管理容器化应用程序的生命周期管理。 * 容器化应用程序管理、容器运行时和编排工具 * 有什么特点：容器管理工具、支持多种容器化应用程序管理和部署工具、易于使用和集成

项目地址：https://gitcode.com/GitHub_Trending/co/containerd

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统