首页
/ browserbee 的项目扩展与二次开发

browserbee 的项目扩展与二次开发

2025-05-19 01:26:26作者:齐冠琰

项目的基础介绍

BrowserBee 是一个开源的 Chrome 扩展插件,它允许用户通过自然语言控制浏览器。该项目结合了大型语言模型(LLM)进行指令解析和规划,以及 Playwright 进行强大的浏览器自动化,以完成各种任务。BrowserBee 旨在保障用户隐私,因为它完全在浏览器内运行(除了 LLM),可以安全地与登录的网站交互,而无需后端基础设施。

项目的核心功能

  • 支持多种大型语言模型提供商,如 Anthropic、OpenAI、Gemini 和 Ollama。
  • 跟踪代币使用情况和价格,让用户了解每项任务的花费。
  • 提供多种浏览器工具,用于交互和理解浏览器状态。
  • 使用 Playwright 作为背景工具,它是一个强大的浏览器自动化工具。
  • 拥有记忆功能,捕捉有用的工具使用序列并本地存储,以便未来更高效地使用。
  • 代理知道何时征求用户的批准,例如进行购买或在社交媒体上发布更新。

项目使用了哪些框架或库?

  • Playwright:用于浏览器自动化的库。
  • 大型语言模型(LLM):如 Anthropic、OpenAI、Gemini 和 Ollama。
  • Chrome 扩展开发框架。

项目的代码目录及介绍

browserbee/
├── .github/
│   └── workflows/
├── docs/
├── public/
├── src/
│   ├── background/
│   ├── content/
│   ├── popup/
│   └── options/
├── .gitignore
├── .nojekyll
├── ARCHITECTURE.md
├── CONTRIBUTING.md
├── LICENSE
├── README.md
├── ROADMAP.md
├── package-lock.json
├── package.json
├── reattach-button.png
├── tailwind.config.js
└── tsconfig.json
  • src/:包含扩展的主要代码,分为背景脚本、内容脚本、弹出页面和选项页面。
  • public/:通常包含静态资源,如图片和样式表。
  • docs/:存放项目文档。
  • ARCHITECTURE.md:描述项目的架构设计。
  • ROADMAP.md:列出项目未来的功能和改进计划。

对项目进行扩展或者二次开发的方向

  1. 增强自然语言处理能力:可以通过集成更先进的自然语言处理模型,提高浏览器控制命令的理解和执行能力。
  2. 增加更多浏览器工具:扩展项目中支持的浏览器工具,提供更多自动化操作的可能性。
  3. 优化内存管理:改进内存功能,使其更智能地存储和检索用户的行为模式。
  4. 用户界面改进:提升用户界面的交互体验,使其更加直观和友好。
  5. 多语言支持:扩展项目以支持更多语言,使其成为全球用户的首选工具。
  6. 集成第三方服务:允许 BrowserBee 与其他第三方服务集成,如在线翻译、地图服务等。

通过上述扩展和二次开发,BrowserBee 可以成为一个更加完善和强大的浏览器自动化工具,为用户提供更优质的体验。

登录后查看全文
热门项目推荐