Ferrum项目中JavaScript执行问题的分析与解决方案

2025-07-07 08:48:44作者：裴麒琰

Headless Chrome Ruby API

项目地址：https://gitcode.com/gh_mirrors/fe/ferrum

问题背景

在使用Ferrum（一个基于Ruby的CDP工具）进行网页自动化测试时，开发人员遇到了一个典型问题：页面中的内联JavaScript脚本未能按预期执行。具体表现为使用PDF.js嵌入PDF页面的功能失效，而其他静态内容却能正常渲染。虽然启用了js_errors选项，但控制台并未捕获到任何错误信息。

技术分析

Ferrum的执行机制

Ferrum作为Chrome DevTools Protocol的Ruby封装，其页面加载和脚本执行遵循现代浏览器的异步加载模型。当页面主框架完成加载后，浏览器可能仍在处理后续资源请求或执行延迟脚本。

问题的根本原因

异步加载特性：PDF.js这类库通常采用异步加载方式，其执行时机可能晚于主页面框架的ready状态
网络空闲检测缺失：默认情况下，Ferrum可能在DOMContentLoaded事件触发后就认为页面加载完成，而此时异步脚本可能尚未执行完毕
静默失败：某些JavaScript错误可能被捕获但未向上抛出，导致js_errors选项也无法捕获

解决方案

核心修复方法

通过显式等待网络空闲状态来确保所有资源加载完成：

page.network.wait_for_idle

技术原理

网络空闲检测：该方法会阻塞执行直到所有网络请求完成
执行时机保证：确保所有异步脚本和依赖资源都已加载并执行
兼容性考虑：适用于各种动态内容加载场景，包括但不限于PDF.js等第三方库

最佳实践建议

常规等待策略：对于动态内容丰富的页面，建议总是添加网络空闲等待
复合等待条件：可结合DOM元素检测创建更健壮的等待条件
调试技巧：
- 优先检查浏览器开发者工具中的Console和Network面板
- 使用Ferrum的screenshot功能可视化页面加载状态
- 分阶段验证脚本执行情况

深入理解

这个问题揭示了现代Web应用中资源加载的复杂性。单页应用(SPA)和各类Web组件普遍采用异步加载模式，传统的"页面加载完成"概念已经变得模糊。Ferrum提供的网络空闲检测机制正是为了应对这种变化，它通过CDP协议深入浏览器内核，获取真实的网络活动状态，比简单的DOM ready检测更加可靠。

对于自动化测试开发者来说，理解这种异步特性并合理使用等待机制，是编写稳定测试用例的关键所在。同时，这也提醒我们在进行网页自动化时，不能仅依赖表面可见的元素，还需要关注背后的执行时序和资源依赖关系。

Headless Chrome Ruby API

项目地址：https://gitcode.com/gh_mirrors/fe/ferrum

登录后查看全文

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

昇腾LLM分布式训练框架

flutter_flutter

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

ohos_react_native

React Native鸿蒙化仓库