stress-ng项目中的多线程同步测试问题分析

2025-07-05 21:43:56作者：廉皓灿Ida

This is the stress-ng upstream project git repository. stress-ng will stress test a computer system in various selectable ways. It was designed to exercise various physical subsystems of a computer as well as the various operating system kernel interfaces.

项目地址：https://gitcode.com/gh_mirrors/st/stress-ng

在开源系统压力测试工具stress-ng的最新版本0.18.07中，测试人员在进行快速测试时发现了三个关键的多线程同步测试失败案例：dekker、peterson和prio-inv。这些测试失败揭示了在不同硬件架构下实现线程同步机制时可能遇到的挑战。

测试环境与现象

测试环境采用了基于ARM架构的aarch64系统，运行Linux内核5.10.0版本，配备了128个处理器核心和502GB内存。在运行make fast-test-all命令时，系统报告了三个测试项的失败：

dekker测试：检测到互斥锁检查失败，计数器值出现1的偏差
peterson测试：同样出现互斥锁检查失败，计数器值不匹配
prio-inv测试：无法设置调度优先级和策略，返回"Operation not permitted"错误

问题根源分析

优先级反转测试(prio-inv)问题

prio-inv测试失败的原因是测试进程没有足够的权限来修改调度优先级。这是一个典型的权限问题，解决方案是确保测试进程具有足够的权限来修改实时调度参数。开发者在后续提交中修复了这个问题，通过调整测试所需的权限设置。

Dekker和Peterson算法测试问题

这两个测试都实现了经典的线程同步算法：

Dekker算法：最早的解决临界区问题的算法之一，使用共享变量和轮询机制
Peterson算法：更简洁的双线程互斥解决方案，使用turn变量和flag数组

在ARM架构的多核NUMA系统中，这些测试失败的根本原因在于：

内存顺序问题：ARM架构相比x86具有更宽松的内存模型，对内存访问顺序的保证较弱
NUMA架构影响：非统一内存访问架构下，不同NUMA节点间的内存同步延迟更高
缓存一致性：多核系统中缓存一致性协议可能导致内存访问顺序的不可预测性

解决方案与改进

开发者针对这些问题实施了以下改进措施：

prio-inv测试：调整了测试所需的权限设置，确保测试能够正常执行调度优先级修改操作
Dekker和Peterson测试：
- 引入了完整的系统内存屏障(memory barrier)指令
- 确保关键内存操作的顺序性
- 加强了跨NUMA节点的内存同步保证

这些改进确保了在多核ARM系统中，这些经典的线程同步算法能够正确工作，计数器值能够保持一致性。

技术启示

这一案例为我们提供了几个重要的技术启示：

跨架构兼容性：在x86上运行良好的同步算法可能在ARM架构上出现问题，特别是在多核NUMA系统中
内存模型差异：不同CPU架构的内存模型差异可能导致同步机制失效
测试覆盖重要性：全面的跨平台测试对于确保软件可靠性至关重要
同步原语选择：在现代多核系统中，应优先考虑更高级别的同步原语而非依赖特定内存顺序的算法

通过分析stress-ng项目中的这些问题，我们可以更好地理解在多核异构计算环境中实现可靠线程同步的挑战和解决方案。

stress-ng

项目地址：https://gitcode.com/gh_mirrors/st/stress-ng

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

213

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

apinto

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。