pytest升级后跳过测试时__new__调用行为的变化分析
背景介绍
在pytest测试框架中,开发者经常使用跳过标记(skip marker)来控制特定测试用例的执行。近期有用户从pytest 6.2.5升级到8.3.3版本后发现,测试类的__new__方法调用行为发生了变化,这影响了他们原有的测试安全机制实现方式。
问题现象
在pytest 6.2.5版本中,当通过pytest_collection_modifyitems钩子为测试项添加跳过标记时:
- 如果测试被标记为跳过,测试类的
__new__方法不会被调用 - 只有未被跳过的测试才会触发
__new__方法的执行
而在升级到pytest 8.3.3后:
- 无论测试是否被跳过,测试类的
__new__方法都会被调用 - 这导致原本依赖
__new__方法进行环境安全检查的代码出现了问题
技术分析
原有实现机制
用户原有的实现方式是在unittest.TestCase的子类中重写__new__方法,用于执行环境安全检查。当检测到不安全的测试环境时,会抛出异常阻止测试执行。这种实现方式依赖于pytest 6.2.5版本中跳过测试时不实例化测试类的行为特性。
pytest内部机制变化
pytest核心开发者指出,测试类实例化是unittest.TestCase的标准契约行为。在早期版本中跳过测试时不调用__new__实际上是一个实现细节而非设计特性。随着pytest内部实现的改进,8.3.3版本更加严格地遵循了unittest的契约,确保测试类总是会被实例化。
安全机制的正确实现方式
对于需要在测试执行前进行环境检查的场景,推荐使用以下替代方案:
- setUpClass类方法:在类级别进行一次性检查
@classmethod
def setUpClass(cls):
if not is_safe_environment():
raise unittest.SkipTest("Unsafe environment")
super().setUpClass()
- setUp实例方法:在每个测试方法执行前进行检查
def setUp(self):
if not is_safe_environment():
raise unittest.SkipTest("Unsafe environment")
super().setUp()
- 自定义pytest标记:结合pytest的标记系统和钩子函数实现更灵活的检查
@pytest.mark.safe_environment
def test_something(self):
pass
最佳实践建议
-
避免依赖框架内部实现细节:
__new__方法的调用行为属于框架实现细节,不应作为安全检查的依赖点 -
明确区分收集阶段和执行阶段:pytest的测试生命周期中,收集阶段和执行阶段有不同的职责,安全检查应放在合适的阶段
-
考虑多种运行场景:如果测试可能通过不同方式运行(如直接使用unittest运行器),应确保安全机制在所有场景下都有效
-
使用标准扩展点:优先使用unittest或pytest提供的标准扩展点(如setUp、标记系统)来实现自定义逻辑
结论
pytest从6.2.5到8.3.3版本的这一行为变化,实际上是框架朝着更加规范和可靠的方向发展。开发者应该调整测试安全机制的实现方式,使用更加标准和可靠的方法来进行环境检查。这不仅解决了当前的问题,也使代码更加健壮和可维护。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00