NumExpr项目支持Python 3.13无GIL版本的实践与思考

2025-07-02 05:33:14作者：魏侃纯Zoe

Fast numerical array expression evaluator for Python, NumPy, Pandas, PyTables and more

项目地址：https://gitcode.com/gh_mirrors/nu/numexpr

在Python 3.13中，CPython引入了一项重大变革——实验性的"无GIL"(Global Interpreter Lock)构建版本，也被称为"free-threaded"Python。这一变化使得多线程程序能够绕过GIL的限制，从而显著提升执行效率，但同时也带来了全新的并发和并行编程挑战。作为PyData生态系统中的重要成员，NumExpr项目近期完成了对Python 3.13无GIL版本的支持工作。

无GIL Python的技术背景

传统Python解释器中的GIL一直是限制多线程性能的主要瓶颈。PEP 703提出的无GILPython实现移除了这一限制，使得多线程程序能够真正实现并行执行。这一变革为科学计算领域带来了新的机遇，特别是对于像NumExpr这样已经内置多线程支持的计算引擎。

NumExpr的适配工作

NumExpr团队与社区合作完成了多项关键工作以确保在无GIL环境下的稳定运行：

代码审计：全面检查C++代码中的全局变量、缓存等潜在线程安全问题
并行测试：使用pytest-run-parallel工具进行并发测试，暴露潜在问题
扩展模块声明：明确声明扩展模块支持无GIL环境
CI/CD集成：在持续集成中添加对cp313t架构的wheel构建支持

技术挑战与解决方案

在适配过程中，团队遇到了几个关键挑战：

线程局部缓存问题

NumExpr原本使用全局缓存来存储编译结果以提高性能。在无GIL环境下，这种设计会导致线程安全问题。解决方案是将缓存改为线程局部存储，确保每个线程有自己的独立缓存空间。

线程数量控制

NumExpr提供了set_num_threads等API来控制计算线程数。在无GIL环境下，如果上层Python代码也使用多线程，可能导致线程过度分配问题。团队建议用户使用threadpoolctl工具来更好地管理线程资源。

环境检测

目前Python没有公开API来检测是否运行在无GIL模式下。团队采用了通过sysconfig检查Py_GIL_DISABLED配置变量的方式来实现这一检测，为后续可能的警告或优化提供基础。

性能考量

为了帮助用户理解无GIL环境下的性能特性，团队更新了基准测试脚本。新的测试展示了在无GIL环境下如何正确使用NumExpr的多线程能力，同时避免了由于缓存机制变化可能导致的性能误解。

未来展望

随着Python无GIL版本逐步成为默认实现，NumExpr团队将持续优化其多线程实现。特别是在以下方面：

更精细的线程资源管理
针对无GIL环境的性能优化
用户教育，帮助科学计算社区顺利过渡到无GIL环境

这次适配工作不仅确保了NumExpr在新Python版本中的兼容性，也为PyData生态系统的其他项目提供了宝贵经验。随着Python并发模型的演进，科学计算领域将迎来新的性能突破。

Fast numerical array expression evaluator for Python, NumPy, Pandas, PyTables and more

项目地址：https://gitcode.com/gh_mirrors/nu/numexpr

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

deepin linux kernel

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

昇腾LLM分布式训练框架

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter