NumPy在多线程环境下descr->byteorder数据竞争问题分析

2025-05-05 14:13:47作者：咎竹峻Karen

The fundamental package for scientific computing with Python.

项目地址：https://gitcode.com/gh_mirrors/nu/numpy

问题背景

在NumPy项目的开发过程中，开发人员发现当使用线程检查工具TSAN（ThreadSanitizer）配合Python的自由线程（free-threading）模式运行时，会出现一个关于descr->byteorder的数据竞争问题。这个问题暴露了NumPy在多线程环境下潜在的内存安全问题。

问题现象

当运行特定多线程测试代码时，TSAN报告了一个真实的数据竞争情况。具体表现为：主线程正在读取一个全局描述符LONG_Descr的byteorder字段，而另一个线程T147同时正在修改同一个字段。

技术分析

数据竞争的本质

数据竞争是指多个线程在没有适当同步机制的情况下，同时访问同一内存位置，且至少有一个访问是写入操作。在NumPy的这个案例中：

读取操作：发生在PyArray_PromoteTypes函数中，主线程读取descr->byteorder字段
写入操作：发生在PyArray_CheckFromAny_int函数中，工作线程修改了同一个字段

问题根源

深入分析代码后发现，问题出在numpy/_core/src/multiarray/ctors.c文件中的PyArray_CheckFromAny_int函数。该函数在特定条件下会无条件地将in_descr->byteorder设置为NPY_NATIVE，而没有考虑多线程环境下可能存在的竞争条件。

修复方案

开发团队提出了一个简单的修复方案：在修改byteorder字段前增加一个检查条件，只有当当前值既不是NPY_IGNORE也不是NPY_NATIVE时才进行修改。这样可以避免不必要的写入操作，从而消除数据竞争。

技术影响

虽然这个特定的数据竞争在实际应用中可能不会立即导致严重问题，但从技术角度来看：

内存安全：任何数据竞争都可能引发不可预测的行为，特别是在现代编译器的优化下
可维护性：暴露了NumPy代码中对全局或共享状态处理的不严谨
性能影响：不必要的内存写入在多核处理器上可能导致缓存一致性问题

最佳实践建议

对于类似的多线程编程场景，建议：

最小化共享状态：尽可能减少线程间共享的可变数据
使用适当同步：对必须共享的数据使用锁或其他同步机制
静态分析工具：定期使用TSAN等工具进行多线程问题检测
不可变设计：考虑使用不可变数据结构来避免并发修改

总结

NumPy团队对这个数据竞争问题的快速响应体现了对代码质量的重视。虽然这个问题本身可能不会立即影响大多数用户，但它的修复有助于提高NumPy在多线程环境下的稳定性和可靠性。这也提醒我们，在开发高性能数值计算库时，除了关注功能实现，还需要特别注意并发环境下的线程安全问题。

The fundamental package for scientific computing with Python.

项目地址：https://gitcode.com/gh_mirrors/nu/numpy

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

deepin linux kernel

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

flutter_flutter

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统