CRIU项目中容器检查点功能故障排查指南

2025-06-25 15:18:47作者：郦嵘贵Just

问题背景

在使用CRIU（Checkpoint/Restore In Userspace）工具对容器进行检查点操作时，用户遇到了"could not load libcriu.so.2"的错误提示。该问题主要出现在Ubuntu 22.04系统环境下，涉及CRI-O容器运行时、Kubernetes 1.29以及CRIU 3.19等组件。

核心问题分析

错误信息表明系统无法加载libcriu.so.2动态库文件，这通常由以下原因导致：

运行时依赖缺失：CRUN容器运行时需要libcriu库支持
构建配置问题：CRUN在编译时未正确包含CRIU头文件
包管理问题：Ubuntu系统可能未正确安装criu-libs相关依赖

解决方案对比

方案一：使用RUNC替代CRUN（推荐）

安装RUNC运行时：
```
sudo apt install runc
```
修改CRI-O配置：编辑/etc/crio/crio.conf或/etc/crio/crio.conf.d/目录下的配置文件，确保包含：
```
[crio.runtime]
default_runtime = "runc"
```
重启CRI-O服务

方案二：修复CRUN依赖（复杂）

确保完整安装CRIU开发包：
```
sudo apt install criu libcriu-dev
```
重新编译CRUN并确保包含CRIU支持

配置动态库路径（如需要）：

export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH

技术细节说明

CGROUP版本兼容性

Ubuntu 22.04默认使用cgroupv2，目前存在以下限制：

检查点功能可以正常工作
恢复功能在cgroupv2下存在兼容性问题
如需完整功能，建议临时切换至cgroupv1

组件选择建议

RUNC优势：
- 直接调用CRIU二进制而非动态库
- Kubernetes生态中的主流选择
- 稳定性经过长期验证
CRUN限制：
- 需要动态链接libcriu
- 在Ubuntu等系统上可能存在打包问题
- 对检查点/恢复功能的支持较新

最佳实践建议

生产环境优先选择RUNC方案
测试环境可使用CRUN，但需确保：
- 完整安装CRIU开发包
- 正确配置动态库路径
- 验证构建时包含CRIU支持
关注CRIU项目更新，特别是cgroupv2支持进展

总结

容器检查点功能是CRIU项目的核心能力之一，在实际部署时需要注意运行时选择和环境配置。对于Ubuntu等使用cgroupv2的系统，目前推荐使用RUNC作为容器运行时以获得最佳兼容性。随着CRIU项目的持续发展，未来版本将进一步完善对现代容器环境的支持。

criu

Checkpoint/Restore tool

项目地址：https://gitcode.com/gh_mirrors/cr/criu

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理