Web平台测试项目优化：移除基础设施测试中的禁用预期

2025-06-12 13:25:49作者：苗圣禹Peter

Web平台测试（Web Platform Tests，简称WPT）是一个开源项目，旨在为Web平台提供跨浏览器兼容性测试套件。作为Web标准实现一致性的重要验证工具，WPT包含了数以万计的测试用例，覆盖HTML、CSS、JavaScript等Web技术的各个方面。

禁用测试的反模式问题

在WPT项目中，基础设施测试（infrastructure/）部分存在多个被禁用的测试预期（disabled expectations）。这种做法本质上是一种反模式，因为它可能掩盖真正的新问题。禁用测试应该是最后不得已的选择，而不是常规做法。

通过分析发现，某些测试被禁用多年却无人关注。例如allowed-to-play.html.ini测试中引用的Firefox bug实际上已在五年前修复，但由于测试一直被禁用，导致项目失去了五年的测试覆盖率，未能及时发现测试已重新通过的情况。

具体测试案例分析与处理

对于testdriver-in-ref.html.ini测试，项目团队认为没有理由将其禁用。虽然它在Firefox中预期会超时，但这只是众多类似情况中的一个，超时本身就是一个合理的断言结果。

test_load_file.py.ini测试的禁用原因则更加模糊。在相关PR的早期讨论中，它被标记为不稳定（flaky），但随后在没有进一步讨论或解释的情况下被完全禁用。

特别值得注意的是testdriver/bidi/和webdriver/bidi/目录下的测试。这些测试应该在所有浏览器上运行。虽然目前只有Chrome的testharness执行器支持双向通信（bidi），但不能允许bidi测试在其他浏览器上引发关键错误。例如，当浏览器不支持某功能时启用相应能力，可能导致执行器永远无法成功设置。

保留的合理禁用案例

经过清理后，项目中仅保留了两个基础设施测试的禁用注释，它们都有更充分的理由：

minimize_restore_popup.html.ini测试被禁用是因为存在一个已知问题
dir.ini文件中的条件禁用专门针对Firefox浏览器

这些案例相比其他被移除的禁用注释更具合理性，因此予以保留。

测试健康度的重要性

保持测试套件的健康运行对Web平台的发展至关重要。过度依赖禁用测试会降低测试覆盖率，掩盖真正的问题，最终损害项目的可信度。通过这次清理，WPT项目不仅移除了不必要的测试禁用，还恢复了长期被忽视的测试覆盖，为Web平台的兼容性验证提供了更可靠的基础。

这一改进体现了WPT项目对测试质量的持续关注，也展示了开源社区通过代码审查和协作不断完善项目的良好实践。对于依赖WPT结果的浏览器开发者、Web开发者和标准制定者来说，这些改进意味着更准确、更全面的兼容性反馈。

登录后查看全文

项目优选

收起

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用