PyO3项目中字典与列表的线程安全迭代优化

2025-05-17 23:02:04作者：胡唯隽

在Python生态系统的Rust绑定库PyO3中，开发团队正在针对字典(dict)和列表(list)的迭代操作进行线程安全性的优化。这一改进源于Python在多线程环境下对字典和列表迭代的特殊处理方式。

Python标准实现中，字典和列表的迭代操作默认不提供线程安全保证，允许潜在的竞态条件存在。为了在PyO3中保持与Python一致的行为，同时又要兼顾性能，开发团队设计了一套新的API方案。

当前实现中，为了确保线程安全，PyO3不得不使用较慢的引用计数API来处理列表迭代，并对字典迭代采用临界区保护。这种保守的实现方式虽然安全，但牺牲了性能。特别是在Python即将推出的自由线程(free-threaded)构建版本中，这种性能损耗更为明显。

技术方案的核心是引入新的locked_iter函数，该函数将被添加到PyDictMethods和PyListMethods特性中。与直接返回迭代器的传统方法不同，这个新API采用闭包回调的设计模式。用户需要提供一个闭包，该闭包接收一个特殊的锁定迭代器作为参数，并在闭包内部进行实际的迭代操作。

这种设计有多个技术优势：

确保临界区的正确配对，即使在发生panic的情况下也能保证资源释放
防止临界区的嵌套使用
保持与Python标准行为的一致性，同时提供更高效的线程安全迭代选项

对于字典迭代，闭包将接收一个PyDictLockedIterator类型的参数；对于列表迭代，也会有对应的锁定迭代器类型。这些特殊迭代器类型隐式地表示当前持有临界区锁，开发者无需手动管理锁的获取和释放。

在实现细节上，团队还探讨了利用Iterator::fold和Iterator::try_fold的可能性，这些高阶函数可以自动优化许多常见的迭代模式。虽然由于Rust稳定性的限制，完整的try_fold实现目前只能在nightly版本中使用，但这为未来的性能优化指明了方向。

这一改进将分阶段进行：在PyO3 0.23版本中先采用保守但安全的实现，确保功能正确性；而在0.24版本中引入新的锁定迭代API，为开发者提供更高效的线程安全迭代选项。这种渐进式的改进策略既保证了稳定性，又为性能优化留下了空间。

pyo3

Rust bindings for the Python interpreter

项目地址：https://gitcode.com/gh_mirrors/py/pyo3

登录后查看全文

PyO3项目中字典与列表的线程安全迭代优化

项目优选