CRIU项目在Debian Bookworm中恢复失败问题分析

2025-06-25 12:09:09作者：冯梦姬Eddie

问题背景

CRIU(Checkpoint/Restore In Userspace)是一个用于Linux系统的开源工具，它能够冻结正在运行的应用程序并将其状态保存为文件集合，之后可以从这些文件中恢复应用程序的运行状态。最近在Debian Bookworm系统中，用户发现当glibc升级到2.36-9+deb12u8版本后，CRIU的恢复功能出现了段错误问题。

问题现象

当用户按照官方文档中的简单循环示例进行操作时，dump操作可以正常完成，但在执行restore操作时会遇到段错误(Segmentation fault)，错误代码为11。这一现象在多种硬件架构(x86_64和arm64)以及不同部署环境(WSL、虚拟机和裸机)中均能复现。

根本原因分析

经过技术专家调查，这个问题与glibc库的更新有关。具体来说：

当glibc从2.36-9+deb12u7升级到2.36-9+deb12u8版本后，CRIU的恢复功能开始出现故障
问题很可能与glibc内部结构变化有关，特别是与"可重启序列"(restartable sequences)相关的部分
Debian打包的CRIU版本(3.17.1)没有针对新glibc进行重新编译，导致兼容性问题

解决方案

目前有以下几种可行的解决方法：

使用官方提供的预编译包：CRIU项目官方提供了针对Debian 12的预编译包，这些包已经解决了兼容性问题。
从源代码重新构建CRIU：用户可以自行从Git仓库获取最新源代码并重新构建CRIU，这种方法也能解决兼容性问题。
应用特定补丁：对于熟悉CRIU代码的开发者，可以手动应用两个关键提交(cacddf19dad339f963b0b01f7174091b90c49e5d和f7972a3f0468e32231af6914e2e9c9e07ac53ae6)来解决此问题。