Ferrum项目中的DeadBrowserError问题分析与解决方案

2025-07-07 06:10:46作者：韦蓉瑛

问题现象

在使用Ferrum进行HTML转PDF的过程中，开发人员遇到了间歇性的Ferrum::DeadBrowserError异常。这个问题表现为：在刚创建浏览器实例和页面后，尝试设置页面内容时浏览器就意外终止了。

问题分析

通过深入分析，我们发现这个问题的根本原因与系统内存不足(OOM)有关。Ferrum作为基于Chrome的无头浏览器工具，其运行需要消耗相当数量的内存资源。当系统可用内存不足时，Chrome进程会被系统强制终止，导致Ferrum失去与浏览器的连接，从而抛出DeadBrowserError异常。

技术细节

Ferrum的工作原理：Ferrum通过CDP协议与Chrome浏览器通信，当浏览器进程意外终止时，连接会立即中断。
内存消耗特点：
- Chrome浏览器本身是内存密集型应用
- 每个标签页都会消耗额外内存
- PDF生成过程需要更多内存来处理渲染
错误触发条件：当系统内存和交换空间都接近耗尽时，Linux内核的OOM Killer会终止占用内存最多的进程，通常是Chrome。

解决方案

增加系统内存监控：
- 在关键操作前检查系统可用内存
- 设置内存阈值，低于阈值时暂停处理或报警
优化内存使用：
- 减少同时运行的Ferrum实例数量
- 及时清理不再使用的浏览器实例
- 考虑使用browser.reset代替创建新实例
代码改进建议：

def convert(html)
  # 增加内存检查
  check_system_memory!

  browser = Ferrum::Browser.new(
    headless: 'new',
    window_size: [1920, 1080],
    process_timeout: 15,
    timeout: 15,
  )
  
  begin
    page = browser.create_page
    page.content = html
    page.network.wait_for_idle
    page.pdf(encoding: :binary)
  rescue Ferrum::DeadBrowserError => e
    # 增加错误处理和重试逻辑
    retry if can_retry?
    raise
  ensure
    browser&.quit
  end
end