三步掌握智能驱动的网页自动化：Nanobrowser全功能使用指南

2026-04-20 12:20:14作者：平淮齐Percy

Nanobrowser是一款开源的多智能体浏览器自动化工具，通过内置Chrome扩展实现网页自动化操作。它采用先进的多智能体协作架构，能够模拟人类浏览行为，自动完成网页信息提取、表单填写、数据收集等重复性任务，让你从繁琐的网页操作中解放出来，专注于更有价值的工作。

确认环境兼容性

在开始安装前，请确保你的环境满足以下要求：

浏览器兼容性：Chrome 或 Edge 最新版
网络环境：可访问互联网以下载扩展和依赖
开发环境（可选）：若需从源码构建，需安装Node.js v22.12.0+和pnpm v9.15.1+

选择合适的安装路径

快速部署：Chrome商店一键安装

访问 Chrome Web Store 中的 Nanobrowser 扩展页面
点击"添加到Chrome"按钮
在弹出的确认对话框中选择"添加扩展"

提示：安装完成后，扩展图标将出现在浏览器工具栏。若未显示，可点击工具栏右侧的"拼图"图标找到Nanobrowser并固定到工具栏。

手动部署：体验最新功能

如需体验最新开发版本，可手动安装：

从项目仓库下载最新发布的nanobrowser.zip文件
将下载的ZIP文件解压到任意文件夹（例如Documents/nanobrowser）
打开Chrome浏览器，访问chrome://extensions/
开启右上角"开发者模式"开关
点击"加载已解压的扩展程序"，选择之前解压的文件夹
确认添加扩展

源码构建：自定义开发

如果你是开发者，想自定义或贡献代码，可以从源码构建：

克隆仓库

git clone https://gitcode.com/GitHub_Trending/na/nanobrowser
cd nanobrowser

安装依赖

pnpm install

构建扩展

pnpm build

构建完成的扩展文件将生成在dist目录下，按照手动部署的步骤加载即可。开发模式下可使用热重载：

pnpm dev

配置AI服务连接

打开设置面板

点击浏览器工具栏的Nanobrowser图标打开侧边栏，然后点击右上角⚙️图标进入设置。

配置API密钥

在设置页面中，选择"LLM Providers"选项卡，添加你的API密钥。支持多种提供商：

方案	适用场景	配置难度
OpenAI API	追求稳定性和通用性	⭐⭐
Anthropic API	需要长文本处理能力	⭐⭐
Google Gemini API	偏好Google生态	⭐⭐
兼容API（Ollama/Groq）	本地部署或特定优化	⭐⭐⭐

智能体模型分配

Nanobrowser采用多智能体架构，建议为不同角色分配合适的模型：

智能体角色	推荐模型	功能说明
Planner	Claude Sonnet 4	负责任务规划和策略制定
Navigator	Claude Haiku 3.5	负责网页导航和元素交互

验证功能完整性

安装完成后，让我们测试一个简单任务：

打开任意网页（例如GitHub Trending）
在Nanobrowser侧边栏输入：帮我提取当前页面的前5个项目标题和链接
点击发送按钮，观察智能体如何自动浏览并提取信息

🛠️ 操作提示：首次使用时，系统会请求必要的网页访问权限，请在弹出的权限请求对话框中点击"允许"。

排查常见运行故障

扩展无法加载怎么办？

确保已启用开发者模式
检查扩展文件是否完整
尝试重启浏览器后重新加载

智能体没有响应如何处理？

验证API密钥是否正确配置
检查网络连接是否正常
确认所选模型是否支持当前地区访问

任务执行失败如何解决？

尝试简化任务描述
检查目标网站是否有反爬虫机制
在设置中调整智能体的"思考深度"参数

探索高级应用场景

自动化工作流示例

定期收集行业新闻并整理摘要
自动填写重复性表单
监控网页内容变化并发送通知

自定义开发资源

多智能体协作原理：AGENTS.md
API文档：packages/storage/lib/
贡献指南：CONTRIBUTING.md

通过本指南，你已掌握Nanobrowser的安装配置和基础使用方法。这款智能驱动的网页自动化工具将帮助你大幅提升工作效率，减少重复劳动。开始探索更多高级功能，打造属于你的自动化工作流吧！

🔧 项目资源

官方文档：README.md
安全指南：SECURITY.md
源码目录：chrome-extension/src/
开发工具：packages/

nanobrowser

Open-Source Chrome extension for AI-powered web automation. Run multi-agent workflows using your own LLM API key. Alternative to OpenAI Operator.

项目地址：https://gitcode.com/GitHub_Trending/na/nanobrowser

登录后查看全文

三步掌握智能驱动的网页自动化：Nanobrowser全功能使用指南

确认环境兼容性

选择合适的安装路径

快速部署：Chrome商店一键安装

手动部署：体验最新功能

源码构建：自定义开发

配置AI服务连接

打开设置面板

配置API密钥

智能体模型分配

验证功能完整性

排查常见运行故障

扩展无法加载怎么办？

智能体没有响应如何处理？

任务执行失败如何解决？

探索高级应用场景

自动化工作流示例

自定义开发资源

热门内容推荐

最新内容推荐

项目优选

三步掌握智能驱动的网页自动化：Nanobrowser全功能使用指南

确认环境兼容性

选择合适的安装路径

快速部署：Chrome商店一键安装

手动部署：体验最新功能

源码构建：自定义开发

配置AI服务连接

打开设置面板

配置API密钥

智能体模型分配

验证功能完整性

排查常见运行故障

扩展无法加载怎么办？

智能体没有响应如何处理？

任务执行失败如何解决？

探索高级应用场景

自动化工作流示例

自定义开发资源

相关内容推荐

热门内容推荐

最新内容推荐

项目优选