首页
/ 三步掌握智能驱动的网页自动化:Nanobrowser全功能使用指南

三步掌握智能驱动的网页自动化:Nanobrowser全功能使用指南

2026-04-20 12:20:14作者:平淮齐Percy

Nanobrowser是一款开源的多智能体浏览器自动化工具,通过内置Chrome扩展实现网页自动化操作。它采用先进的多智能体协作架构,能够模拟人类浏览行为,自动完成网页信息提取、表单填写、数据收集等重复性任务,让你从繁琐的网页操作中解放出来,专注于更有价值的工作。

Nanobrowser智能驱动界面

确认环境兼容性

在开始安装前,请确保你的环境满足以下要求:

  • 浏览器兼容性:Chrome 或 Edge 最新版
  • 网络环境:可访问互联网以下载扩展和依赖
  • 开发环境(可选):若需从源码构建,需安装Node.js v22.12.0+和pnpm v9.15.1+

选择合适的安装路径

快速部署:Chrome商店一键安装

  1. 访问 Chrome Web Store 中的 Nanobrowser 扩展页面
  2. 点击"添加到Chrome"按钮
  3. 在弹出的确认对话框中选择"添加扩展"

提示:安装完成后,扩展图标将出现在浏览器工具栏。若未显示,可点击工具栏右侧的"拼图"图标找到Nanobrowser并固定到工具栏。

手动部署:体验最新功能

如需体验最新开发版本,可手动安装:

  1. 从项目仓库下载最新发布的nanobrowser.zip文件
  2. 将下载的ZIP文件解压到任意文件夹(例如Documents/nanobrowser
  3. 打开Chrome浏览器,访问chrome://extensions/
  4. 开启右上角"开发者模式"开关
  5. 点击"加载已解压的扩展程序",选择之前解压的文件夹
  6. 确认添加扩展

源码构建:自定义开发

如果你是开发者,想自定义或贡献代码,可以从源码构建:

  1. 克隆仓库
git clone https://gitcode.com/GitHub_Trending/na/nanobrowser
cd nanobrowser
  1. 安装依赖
pnpm install
  1. 构建扩展
pnpm build

构建完成的扩展文件将生成在dist目录下,按照手动部署的步骤加载即可。开发模式下可使用热重载:

pnpm dev

配置AI服务连接

打开设置面板

点击浏览器工具栏的Nanobrowser图标打开侧边栏,然后点击右上角⚙️图标进入设置。

配置API密钥

在设置页面中,选择"LLM Providers"选项卡,添加你的API密钥。支持多种提供商:

方案 适用场景 配置难度
OpenAI API 追求稳定性和通用性 ⭐⭐
Anthropic API 需要长文本处理能力 ⭐⭐
Google Gemini API 偏好Google生态 ⭐⭐
兼容API(Ollama/Groq) 本地部署或特定优化 ⭐⭐⭐

智能体模型分配

Nanobrowser采用多智能体架构,建议为不同角色分配合适的模型:

智能体角色 推荐模型 功能说明
Planner Claude Sonnet 4 负责任务规划和策略制定
Navigator Claude Haiku 3.5 负责网页导航和元素交互

验证功能完整性

安装完成后,让我们测试一个简单任务:

  1. 打开任意网页(例如GitHub Trending)
  2. 在Nanobrowser侧边栏输入:帮我提取当前页面的前5个项目标题和链接
  3. 点击发送按钮,观察智能体如何自动浏览并提取信息

🛠️ 操作提示:首次使用时,系统会请求必要的网页访问权限,请在弹出的权限请求对话框中点击"允许"。

排查常见运行故障

扩展无法加载怎么办?

  • 确保已启用开发者模式
  • 检查扩展文件是否完整
  • 尝试重启浏览器后重新加载

智能体没有响应如何处理?

  • 验证API密钥是否正确配置
  • 检查网络连接是否正常
  • 确认所选模型是否支持当前地区访问

任务执行失败如何解决?

  • 尝试简化任务描述
  • 检查目标网站是否有反爬虫机制
  • 在设置中调整智能体的"思考深度"参数

探索高级应用场景

自动化工作流示例

  • 定期收集行业新闻并整理摘要
  • 自动填写重复性表单
  • 监控网页内容变化并发送通知

自定义开发资源

  • 多智能体协作原理:AGENTS.md
  • API文档:packages/storage/lib/
  • 贡献指南:CONTRIBUTING.md

通过本指南,你已掌握Nanobrowser的安装配置和基础使用方法。这款智能驱动的网页自动化工具将帮助你大幅提升工作效率,减少重复劳动。开始探索更多高级功能,打造属于你的自动化工作流吧!

🔧 项目资源

  • 官方文档:README.md
  • 安全指南:SECURITY.md
  • 源码目录:chrome-extension/src/
  • 开发工具:packages/
登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
466
kernelkernel
deepin linux kernel
C
32
16
atomcodeatomcode
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started
Rust
2.09 K
219
ops-nnops-nn
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
700
1.4 K
docsdocs
暂无描述
Dockerfile
780
5.08 K
pytorchpytorch
Ascend Extension for PyTorch
Python
759
968
flutter_flutterflutter_flutter
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
272
ops-transformerops-transformer
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
880
2.02 K
mindquantummindquantum
MindQuantum is a general software library supporting the development of applications for quantum computation.
Python
183
112
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.11 K
682