Datachain项目中的Python 3.12性能问题分析与解决
2025-06-30 13:12:19作者:曹令琨Iris
在Datachain项目的测试过程中,我们发现了一个有趣的现象:test_shutdown_on_sigterm测试用例在Python 3.12环境下会出现超时问题。经过深入分析,我们发现这实际上是一个由Python 3.12与pytest-cov组合使用时产生的性能问题。
问题现象
最初观察到的现象是测试用例在Python 3.12环境下运行时会超时,而在Python 3.11环境下则表现正常。更具体地说:
- 在Python 3.12中,带有
--cov参数的测试运行速度显著变慢 - 同样的测试在Python 3.11中无论是否使用
--cov都能快速完成 - 测试超时时间设定为5秒,而在Python 3.12中,测试运行时间经常超过这个阈值
根本原因
经过深入调查,我们发现这个问题源于CPython 3.12中的一个性能回归问题。具体来说:
- pytest-cov在Python 3.12环境下会产生显著的性能开销
- 这种性能下降是由于CPython 3.12中与代码覆盖率收集相关的底层机制发生了变化
- 在Python 3.12中,即使运行一个空函数,使用pytest-cov时也可能需要5-6秒的时间
性能对比
为了更清楚地理解这个问题,我们进行了以下性能对比:
- Python 3.12不带
--cov参数:测试约1秒完成 - Python 3.11带
--cov参数:测试约1.5秒完成 - Python 3.12带
--cov参数:测试接近或超过5秒超时阈值
解决方案
针对这个问题,我们有以下几种解决方案:
-
使用实验性功能:可以设置环境变量
COVERAGE_CORE=sysmon来启用coverage的实验性实现,这可能会提高性能 -
调整超时时间:如果性能优化方案效果不明显,可以考虑适当增加测试的超时时间
-
版本兼容性处理:对于Python 3.12环境,可以特别处理测试配置,或者暂时跳过某些耗时测试
经验教训
这个问题给我们带来了一些重要的经验:
-
性能问题的诊断:有时候性能问题可能隐藏得很深,传统的性能分析工具可能无法直接揭示根本原因
-
版本兼容性测试:新版本的Python可能会引入意想不到的性能变化,需要特别关注
-
测试环境的影响:测试工具链(如pytest-cov)在不同Python版本下可能有不同的表现
结论
Datachain项目中遇到的这个测试超时问题,表面上看是一个简单的测试失败,实际上揭示了Python 3.12中一个有趣的性能回归问题。通过这个案例,我们不仅解决了当前的问题,也为未来处理类似情况积累了宝贵经验。在软件开发中,这种跨版本、跨工具的兼容性问题时有发生,保持对底层技术变化的敏感性,才能快速定位和解决问题。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0216
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0138
uni-appA cross-platform framework using Vue.jsJavaScript08
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
465
Ascend Extension for PyTorch
Python
758
968
昇腾LLM分布式训练框架
Python
186
231
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
698
1.4 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
878
2.03 K
暂无描述
Dockerfile
780
5.08 K
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
70
22
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
2.08 K
216