Coveragepy 项目中关于测试用例模拟 glob 导致文件读取异常的深度解析

2025-06-26 21:41:49作者：田桥桑Industrious

The code coverage tool for Python

项目地址：https://gitcode.com/gh_mirrors/co/coveragepy

在软件测试领域，模拟(mock)外部依赖是常见的测试手段，但不当的模拟方式可能导致意料之外的问题。本文将深入分析 coveragepy 项目中一个由测试用例模拟 glob 函数引发的文件读取异常案例，探讨其技术背景和解决方案。

问题背景

在 coveragepy 项目中，当用户从 5.4 版本升级到 7.4.0 版本时，遇到了一个 FileNotFoundError 异常。该异常发生在 coverage 尝试合并并行数据时，具体是在 data.py 文件的 combine_parallel_data 函数中。新版本中 coverage 会计算文件的 SHA3-256 哈希值，而旧版本则没有这个步骤。

技术细节分析

问题的根源在于测试用例中对 glob 函数的模拟方式。测试代码原本意图是模拟某个应用模块中的 glob 函数，但实际上错误地模拟了 Python 内置的 glob 模块。这种错误的模拟方式导致了以下连锁反应：

测试中模拟的 glob 返回了不存在的文件路径
coverage 7.4.0 版本新增了文件哈希计算功能
当 coverage 尝试打开这些不存在的文件计算哈希时抛出异常

版本差异对比

在 coverage 5.4 版本中，这个问题不会显现，因为：

旧版本不计算文件哈希值
即使 glob 返回了不存在的文件路径，也不会立即引发异常

而在 7.4.0 版本中：

新增了文件哈希计算功能
会立即尝试打开文件进行读取
遇到不存在的文件时直接抛出 FileNotFoundError

正确的解决方案

虽然可以通过修改 coverage 代码来捕获 FileNotFoundError 异常，但这不是最佳实践。正确的解决方案应该是：

修正测试用例中的模拟方式
- 应该精确模拟应用模块中的 glob 函数，而非全局的 glob 模块
- 确保模拟停止后能正确恢复原始函数
测试代码应该：
- 使用更精确的模拟作用域
- 在测试完成后确保清理所有模拟
- 考虑使用上下文管理器或装饰器来管理模拟的生命周期

经验总结

这个案例给我们提供了几个重要的经验教训：

模拟外部依赖时需要格外小心作用域问题
升级依赖库时，新增的功能可能会暴露测试中的隐藏问题
测试代码的质量同样重要，需要像产品代码一样精心维护
在大型代码库中，全局模拟的风险很高，应该尽量使用局部模拟

对于测试框架开发者而言，这个案例也提醒我们：虽然可以让代码更健壮以容忍测试中的错误，但更好的做法是帮助用户写出正确的测试代码。

The code coverage tool for Python

项目地址：https://gitcode.com/gh_mirrors/co/coveragepy

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统