stress-ng项目中的RTC测试问题分析与修复

2025-07-05 01:53:30作者：滑思眉Philip

This is the stress-ng upstream project git repository. stress-ng will stress test a computer system in various selectable ways. It was designed to exercise various physical subsystems of a computer as well as the various operating system kernel interfaces.

项目地址：https://gitcode.com/gh_mirrors/st/stress-ng

在最新版本的stress-ng（0.17.08）中，开发团队发现了一个在PowerPC架构上运行RTC（实时时钟）测试时出现的故障问题。这个问题在Ubuntu Focal和Noble系统上均能复现，涉及Power8虚拟机和Power9裸金属服务器两种环境。

问题现象

当在PowerPC架构上运行stress-ng的RTC测试时，系统会报告多个错误，主要症状包括：

多个RTC测试实例失败，返回错误码2
系统日志显示"ioctl RTC_ALRM_READ failed"错误，错误号为22（无效参数）
部分实例成功运行，但整体测试被标记为失败

通过代码bisect分析，这个问题首次出现在commit 21d5baad中，该提交增强了RTC测试的错误处理机制，确保在失败时正确返回EXIT_FAILURE状态。

根本原因分析

深入分析后发现，这个问题源于PowerPC架构上某些内核版本对RTC相关ioctl操作的支持不完整。具体表现为：

部分较旧的内核版本未实现RTC_ALRM_READ ioctl操作
同样，RTC_WKALRM_RD等ioctl操作在某些环境下也不被支持
当这些操作不被支持时，内核会返回EINVAL（无效参数）错误

这些情况在x86架构上较少出现，但在PowerPC架构上更为常见，特别是在一些特定的内核版本和配置组合中。

解决方案

开发团队针对这个问题实施了多层次的修复：

首先修改了RTC测试模块，使其能够优雅地处理EINVAL错误。当检测到ioctl操作不被支持时，测试会继续运行而非直接失败。
修复了PowerPC架构特有的编译问题，包括：
- 添加了缺失的asm头文件包含，解决了stress_asm_ppc64_yield未定义的问题
- 完善了LSM（Linux安全模块）测试中的shim_lsm_set_self_attr辅助函数
对所有RTC相关的ioctl操作都添加了类似的容错处理，确保测试在各种环境下都能稳定运行。

技术意义

这个问题的解决体现了几个重要的软件开发原则：

跨平台兼容性：在开发系统级工具时，必须考虑不同架构和内核版本的行为差异。
优雅降级：当某些功能不可用时，程序应该尽可能继续运行而非直接失败。
全面测试：新增的错误处理机制需要经过各种环境和配置的验证。

对于系统压力测试工具如stress-ng来说，保持在不同平台上的稳定性和可靠性尤为重要，因为它的主要用途就是验证系统在各种极端条件下的行为。

用户建议

对于使用stress-ng的用户，特别是PowerPC架构上的用户，建议：

更新到包含这些修复的最新版本
在运行测试时注意观察日志中的警告信息
如果遇到类似问题，可以尝试使用--skip-rtc参数跳过RTC测试

这些改进已经合并到stress-ng的主干代码中，将在下一个正式版本中发布。对于需要立即使用的用户，可以从Git仓库获取最新代码自行编译。

This is the stress-ng upstream project git repository. stress-ng will stress test a computer system in various selectable ways. It was designed to exercise various physical subsystems of a computer as well as the various operating system kernel interfaces.

项目地址：https://gitcode.com/gh_mirrors/st/stress-ng

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统