pytest升级后跳过测试时__new__调用行为的变化分析
背景介绍
在pytest测试框架中,开发者经常使用跳过标记(skip marker)来控制特定测试用例的执行。近期有用户从pytest 6.2.5升级到8.3.3版本后发现,测试类的__new__方法调用行为发生了变化,这影响了他们原有的测试安全机制实现方式。
问题现象
在pytest 6.2.5版本中,当通过pytest_collection_modifyitems钩子为测试项添加跳过标记时:
- 如果测试被标记为跳过,测试类的
__new__方法不会被调用 - 只有未被跳过的测试才会触发
__new__方法的执行
而在升级到pytest 8.3.3后:
- 无论测试是否被跳过,测试类的
__new__方法都会被调用 - 这导致原本依赖
__new__方法进行环境安全检查的代码出现了问题
技术分析
原有实现机制
用户原有的实现方式是在unittest.TestCase的子类中重写__new__方法,用于执行环境安全检查。当检测到不安全的测试环境时,会抛出异常阻止测试执行。这种实现方式依赖于pytest 6.2.5版本中跳过测试时不实例化测试类的行为特性。
pytest内部机制变化
pytest核心开发者指出,测试类实例化是unittest.TestCase的标准契约行为。在早期版本中跳过测试时不调用__new__实际上是一个实现细节而非设计特性。随着pytest内部实现的改进,8.3.3版本更加严格地遵循了unittest的契约,确保测试类总是会被实例化。
安全机制的正确实现方式
对于需要在测试执行前进行环境检查的场景,推荐使用以下替代方案:
- setUpClass类方法:在类级别进行一次性检查
@classmethod
def setUpClass(cls):
if not is_safe_environment():
raise unittest.SkipTest("Unsafe environment")
super().setUpClass()
- setUp实例方法:在每个测试方法执行前进行检查
def setUp(self):
if not is_safe_environment():
raise unittest.SkipTest("Unsafe environment")
super().setUp()
- 自定义pytest标记:结合pytest的标记系统和钩子函数实现更灵活的检查
@pytest.mark.safe_environment
def test_something(self):
pass
最佳实践建议
-
避免依赖框架内部实现细节:
__new__方法的调用行为属于框架实现细节,不应作为安全检查的依赖点 -
明确区分收集阶段和执行阶段:pytest的测试生命周期中,收集阶段和执行阶段有不同的职责,安全检查应放在合适的阶段
-
考虑多种运行场景:如果测试可能通过不同方式运行(如直接使用unittest运行器),应确保安全机制在所有场景下都有效
-
使用标准扩展点:优先使用unittest或pytest提供的标准扩展点(如setUp、标记系统)来实现自定义逻辑
结论
pytest从6.2.5到8.3.3版本的这一行为变化,实际上是框架朝着更加规范和可靠的方向发展。开发者应该调整测试安全机制的实现方式,使用更加标准和可靠的方法来进行环境检查。这不仅解决了当前的问题,也使代码更加健壮和可维护。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust099- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00