Changedetection.io项目中浏览器步骤请求头失效问题解析

2025-05-08 06:14:34作者：蔡丛锟

The best and simplest free open source website change detection, website watcher, restock monitor and notification service. Restock Monitor, change detection. Designed for simplicity - Simply monitor which websites had a text change for free. Free Open source web page change detection, Website defacement monitoring, Price change notification

项目地址：https://gitcode.com/GitHub_Trending/ch/changedetection.io

在网站变更检测工具Changedetection.io的使用过程中，开发者发现了一个关于浏览器步骤（Browser Steps）功能的重要问题：通过"Request"标签页设置的自定义HTTP请求头（如User-Agent）在浏览器步骤中未被正确应用。这个问题的存在会影响需要特定请求头才能正常访问的网站监控场景。

问题现象

当用户尝试以下操作流程时，可以复现该问题：

创建一个针对特定URL（如设备信息检测网站）的监控任务
在Request标签中选择Playwright Chromium作为请求方式
在高级选项中添加自定义请求头（如修改User-Agent）
使用浏览器步骤功能进行测试

此时观察到的现象是：常规的diff/watch操作能正确应用自定义请求头，但在浏览器步骤中这些请求头却未被使用。这不仅影响了功能一致性，还可能导致某些对User-Agent敏感的网站无法正常工作。

技术原因分析

经过项目维护者的深入调查，发现问题的根源在于代码架构设计：

浏览器步骤功能与核心请求功能使用了不同的代码路径
浏览器步骤的请求处理逻辑（位于browser_steps.py）没有继承主请求流程的配置
核心请求处理逻辑（位于playwright.py）包含了完整的请求头处理机制
两者应该共享相同的页面对象初始化逻辑，但目前是独立实现的

这种架构上的分离导致了功能不一致，特别是在请求头处理方面。维护者指出，理想的解决方案应该是让浏览器步骤复用主请求流程的页面对象初始化代码。

解决方案与改进方向

项目维护者已经着手修复此问题，并提出了更全面的改进计划：

统一请求处理逻辑：让浏览器步骤使用与主流程相同的页面对象初始化代码
完善Cookie处理机制：当前简单的"cookie:"头设置方式不足以处理现代网站的复杂Cookie需求
考虑特殊请求头（如User-Agent）的多渠道检测问题：
- HTTP头部的User-Agent
- JavaScript中的navigator.userAgent
- Chrome特有的SEC-UA头