在go-rod中解决Hijack与代理冲突问题的技术方案

2025-06-05 13:41:31作者：滕妙奇

go-rod是一个强大的Go语言浏览器自动化库，它提供了丰富的功能来控制浏览器行为。在实际使用过程中，开发者可能会遇到Hijack功能与代理设置冲突的情况。本文将深入分析这一问题的成因，并提供完整的解决方案。

问题现象分析

当开发者同时启用Hijack功能和代理设置时，可能会出现以下现象：

单独启用Hijack时，代理设置失效
单独使用代理时，功能正常
系统进程显示代理设置已加载，但实际请求未走代理通道

根本原因

问题的核心在于Hijack功能的工作机制。当使用page.HijackRequests()拦截请求时，默认会创建一个新的HTTP客户端来处理请求，这个客户端不会自动继承启动时设置的代理配置。因此，虽然浏览器进程本身有代理参数，但被拦截的请求却绕过了这个代理设置。

解决方案

正确的做法是在Hijack处理函数中显式配置HTTP客户端的Transport属性，确保代理设置被正确应用：

func pageDisableCache(page *rod.Page) {
    router := page.HijackRequests()
    err := router.Add("", "", func(ctx *rod.Hijack) {
        // 解析代理URL
        ul, _ := url.Parse("socks5://127.0.0.1:8888")
        proxy := http.ProxyURL(ul)
        
        // 创建自定义Transport并设置代理
        transport := &http.Transport{Proxy: proxy}
        
        // 使用配置了代理的自定义HTTP客户端
        err := ctx.LoadResponse(&http.Client{Transport: transport}, true)
        if err != nil {
            log.Println("Hijack LoadResponse err:", err)
            return
        }
        
        // 设置缓存控制头
        ctx.Response.SetHeader("Cache-Control", "no-cache, no-store, must-revalidate")
        ctx.Response.SetHeader("Pragma", "no-cache")
        ctx.Response.SetHeader("Expires", "0")
    })
    
    if err != nil {
        log.Println("Hijack response headers err:", err)
        return
    }
    go router.Run()
}