HtmlUnit 4.12.0 版本发布：Web 自动化测试框架的重大更新

2025-07-09 05:46:52作者：卓艾滢Kingsley

HtmlUnit 是一个基于 Java 的无头浏览器（headless browser）实现，它允许开发者在没有图形用户界面的情况下模拟浏览器行为，执行网页加载、表单提交、JavaScript 执行等操作。作为 Web 自动化测试领域的重要工具，HtmlUnit 广泛应用于单元测试、集成测试和 Web 爬虫开发等场景。

版本兼容性说明

HtmlUnit 4.12.0 版本与 3.x 系列版本不兼容，这意味着从 3.x 升级到 4.12.0 需要进行相应的代码调整。这种重大版本变更通常意味着底层架构或核心 API 发生了显著变化，开发者需要特别注意迁移过程中可能遇到的问题。

浏览器引擎支持

本次更新带来了对现代浏览器引擎的更好支持：

Chrome/Edge 135 版本模拟
Firefox 137 版本模拟

这种浏览器引擎版本的更新确保了 HtmlUnit 能够更准确地模拟现代浏览器的行为，包括对最新 JavaScript 特性、CSS 属性和 HTML5 功能的支持。对于测试现代 Web 应用的开发者来说，这意味着更真实的测试环境和更可靠的测试结果。

HTML 解析器改进

HtmlUnit 的 HTML 解析器（neko）得到了重要改进：

现在会忽略特殊标签闭合符号 > 前的空白字符
避免对自闭合标签（self-closing tags）报告 HTML1011 错误

这些改进使得 HtmlUnit 能够更宽容地处理实际 Web 开发中常见的 HTML 标记写法，减少了因格式不规范导致的解析错误，提高了框架的健壮性。

JavaScript 引擎增强

HtmlUnit 的核心 JavaScript 实现（core-js）获得了多项重要更新：

NativeArray 实现重构：现在基于 lambda 表达式实现，这通常会带来更好的性能和更现代的代码结构
日期字符串解析器改进：提高了对多种日期格式的解析能力
集合迭代方法增强：
- DomTokenList.forEach()
- NodeList.forEach()
现在这些方法能够正确处理列表在迭代过程中被修改的情况（如 forEach 回调函数中可能添加或删除元素）。这一改进使得 HtmlUnit 的行为更接近真实浏览器，减少了因集合修改导致的意外错误。
字符串方法全面重构：
- String.prototype.search
- String.prototype.replace
- String.prototype.replaceAll
- String.prototype.split
新的实现更严格遵循 ECMAScript 规范，提供了更准确的行为。特别是对于正则表达式相关操作，现在支持命名捕获组（named capture groups），并修复了多个正则表达式相关的问题。

WebSocket 功能重构

WebSocket 支持是 HtmlUnit 的重要功能之一，本次更新对 WebSocket 相关 API 进行了重构：

新增 WebClient.setWebSocketAdapter(WebSocketAdapterFactory) 方法，允许开发者更灵活地使用不同的 WebSocket 实现
将 WebSocketAdapter 拆分为：
- WebSocketAdapter
- WebSocketListener
引入新的 WebSocketAdapterFactory 接口