CRIU项目中PAGEMAP_SCAN系统调用的兼容性问题分析

2025-06-25 12:30:37作者：范靓好Udolf

问题背景

在Linux系统检查点/恢复工具CRIU的开发过程中，开发团队遇到了一个与内核PAGEMAP_SCAN系统调用相关的兼容性问题。这个问题最初在Fedora 40的6.7.0-68内核版本上被发现，表现为在执行静态测试用例busyloop00时出现"PAGEMAP_SCAN: Invalid argument"错误。

技术细节

问题的核心在于CRIU使用PAGEMAP_SCAN系统调用来扫描进程的内存页表信息。在代码实现中，CRIU向该系统调用传递了一个包含PAGE_IS_SOFT_DIRTY标志的return_mask参数。然而，在某些内核版本中，这个标志并不被支持，导致系统调用返回EINVAL(无效参数)错误。

具体来说，问题出现在pagemap-cache.c文件的pmc_fill函数中。该函数在构建pagemap_scan_args结构体时，设置了以下标志组合：

.return_mask = PAGE_IS_PRESENT | PAGE_IS_SWAPPED | PAGE_IS_SOFT_DIRTY

解决方案

经过分析，开发团队发现PAGE_IS_SOFT_DIRTY标志的支持是在Linux内核6.8版本中才被引入的。因此，对于6.7及更早版本的内核，需要从return_mask中移除这个标志。修改后的代码如下：

.return_mask = PAGE_IS_PRESENT | PAGE_IS_SWAPPED

这个修改使得CRIU能够在更广泛的内核版本上正常工作，同时不会影响核心功能的实现。

影响范围

这个问题不仅影响了Fedora 40的6.7内核，后来在Fedora 39的6.7.4内核上也重现了相同的问题。这表明该兼容性问题存在于多个Linux发行版的6.7内核系列中。

技术启示

这个案例展示了用户空间工具与内核接口之间版本兼容性的重要性。开发者在设计系统调用接口时需要考虑：

向后兼容性：新功能的引入不应破坏现有应用程序的功能
版本检测：用户空间工具应能够检测内核功能支持情况
优雅降级：当某些功能不可用时，应有替代方案或降级处理

对于CRIU这样的系统级工具，正确处理不同内核版本间的差异尤为重要，因为它直接依赖于许多底层内核接口。

结论

通过移除PAGE_IS_SOFT_DIRTY标志，CRIU团队成功解决了在6.7及更早内核版本上的兼容性问题。这个修复不仅解决了当前的测试失败问题，也为将来处理类似的内核接口变更提供了经验。对于系统工具开发者而言，持续关注内核接口变化并做好兼容性处理是保证工具稳定性的关键。

criu

Checkpoint/Restore tool

项目地址：https://gitcode.com/gh_mirrors/cr/criu

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理