crun项目中的BPF创建错误问题分析与解决方案

2025-06-25 22:28:36作者：房伟宁

问题背景

在使用containerd与crun作为Kubernetes容器运行时的环境中，当节点操作系统升级到Debian Bullseye内核版本5.10.0-26-amd64及以上时，出现了容器创建失败的问题。错误信息表明BPF程序加载失败，系统返回"没有空间"的错误提示。

错误现象

当尝试创建容器时，系统会记录如下关键错误信息：

failed to create containerd task: failed to create shim task: OCI runtime create failed: bpf create `0: (61) r2 = *(u32 *)(r...`: No space left on device: unknown

这个错误表明BPF验证器在验证BPF程序时遇到了问题，导致无法创建容器。

问题分析

经过深入调查，发现这个问题具有以下特征：

内核版本相关性：
- 在5.10.0-22-amd64及以下版本的内核中运行正常
- 在5.10.0-26-amd64及以上版本的内核中出现问题
- 在6.1版本内核中问题消失
运行时相关性：
- 使用crun作为运行时会出现问题
- 切换到runc作为运行时则不会出现问题
根本原因：
- 问题出在crun的BPF程序加载逻辑中
- 当BPF验证失败时，错误日志信息过长，超过了内核日志缓冲区的容量
- 内核因此返回ENOSPC(没有空间)错误

技术细节

BPF(伯克利包过滤器)是Linux内核中的一种虚拟机，允许用户空间程序在内核中运行沙盒程序。crun使用BPF来实现某些安全特性。

在较新的内核版本中，BPF验证器变得更加严格，导致某些BPF程序无法通过验证。当验证失败时，内核会生成详细的错误信息说明为什么验证失败。然而，crun的日志缓冲区大小不足以容纳这些详细的错误信息，导致内核返回"没有空间"的错误。

解决方案

该问题已在crun 1.14.1版本中修复，具体修复提交为f2ade6031efcaf6556f52a1448d2e5fc3c49711c。建议用户升级到最新版本(1.14.3)，因为该版本还修复了其他一些bug。

临时解决方案

如果无法立即升级crun，可以考虑以下临时解决方案：

降级内核到5.10.0-22-amd64或以下版本
升级内核到6.1或以上版本
临时将容器运行时切换为runc

最佳实践建议

保持crun和内核版本同步更新
在生产环境升级前，先在测试环境验证新版本组合
关注容器运行时项目的发布说明，了解已知问题和修复情况

这个问题展示了容器生态系统中各组件(内核、容器运行时、容器引擎)之间复杂的依赖关系，强调了保持各组件版本兼容性的重要性。

crun

A fast and lightweight fully featured OCI runtime and C library for running containers

项目地址：https://gitcode.com/gh_mirrors/cr/crun

登录后查看全文