告别复杂配置!Page Assist让本地AI工具像浏览器插件一样简单
你是否曾因这些问题头疼:本地部署Ollama后不知如何与浏览器集成?切换OpenAI和本地模型时要反复修改配置?面对满屏代码教程望而却步?Page Assist(GitHub推荐项目精选)彻底解决了这些痛点,让普通用户也能一键玩转本地AI。
为什么选择Page Assist?
作为一款浏览器扩展(支持Chrome和Firefox),Page Assist实现了三大突破:
- 零代码集成:无需终端命令,鼠标点击即可完成Ollama/OpenAI模型配置
- 多模型无缝切换:本地Ollama与云端API在同一界面自由切换,模型管理可视化
- 浏览器级交互体验:侧边栏聊天界面与网页内容深度融合,支持截图分析、文档解析等特色功能
核心技术实现位于src/models/ChatOllama.ts和src/services/ollama.ts,通过模块化设计确保普通用户无需接触底层代码。
3分钟极速上手流程
1. 基础环境准备
| 环境要求 | 推荐配置 | 检查方法 |
|---|---|---|
| Ollama版本 | ≥0.1.26 | ollama --version |
| 浏览器 | Chrome 120+ / Firefox 115+ | 官方兼容性文档 |
| 最低内存 | 8GB(运行7B模型) | 任务管理器查看可用内存 |
提示:若未安装Ollama,可通过官方文档获取安装包,Windows用户建议使用WSL2后端获得最佳性能。
2. 三步骤完成初始配置
graph TD
A[安装扩展] --> B[检测Ollama服务]
B -->|自动发现| C[选择模型]
B -->|未检测到| D[手动输入Ollama地址]
C --> E[开始聊天]
D --> E
- 扩展安装:从浏览器应用商店搜索"Page Assist"或手动加载发布包
- 自动配置:首次启动时扩展会自动检测本地Ollama服务(默认地址
http://127.0.0.1:11434) - 模型选择:在侧边栏点击"模型"图标,从下拉列表选择已下载的Ollama模型(如llama2、mistral)
高级配置:如需添加远程Ollama实例,可在设置界面中添加多个服务端点
3. 多模型管理技巧
Page Assist创新的模型管理系统让多实例协作变得简单:
pie
title 模型使用场景分布
"本地Ollama(7B模型)" : 60
"OpenAI API" : 25
"LM Studio" : 10
"其他兼容服务" : 5
五大杀手级功能详解
1. 网页内容智能交互
选中任意网页文本,右键菜单会出现"Ask Page Assist"选项,支持:
- 复杂概念一键解释(如选中技术文档中的"向量数据库")
- 多语言即时翻译(内置18种语言支持,本地化文件)
- 表格数据快速分析(自动识别HTML表格,生成统计摘要)
核心实现位于src/parser/目录,通过DOM解析和内容提取算法实现网页智能理解。
2. 创新的模型拉取方式
Page Assist颠覆了传统模型下载流程,提供三种零命令方法:
- Ollama官网直拉:访问ollama.com模型页面时,右上角会出现"Pull"按钮,点击即可后台下载
- HuggingFace集成:在GGUF格式模型页面,通过"Use this model"→"Ollama"→"Pull from Page Assist"完成下载
- 内置模型市场:在扩展设置的模型标签页浏览热门模型,一键获取
下载进度会在浏览器工具栏图标动态显示,支持后台继续下载
3. 文档深度解析引擎
支持拖拽上传多种格式文档(PDF/CSV/TXT/DOCX),通过加载器模块实现:
4. 多模态交互体验
通过视觉模块实现:
- 截图分析:快捷键
Ctrl+Shift+U截取网页区域,模型自动生成描述 - 公式识别:支持LaTeX公式渲染和解释(基于katex)
- 图表理解:自动识别网页中的柱状图/折线图,生成数据解读
5. 隐私保护设计
作为本地优先的AI工具,隐私保护刻在基因里:
进阶技巧与常见问题
性能优化配置
| 参数 | 默认值 | 优化建议 | 调整位置 |
|---|---|---|---|
| 上下文窗口 | 2048 | 7B模型建议设为4096 | 模型设置 |
| 温度值 | 0.7 | 事实性问答设为0.3 | 聊天界面滑块 |
| 批处理大小 | 512 | GPU用户可增至1024 | 高级选项 |
疑难问题解决
Q: Ollama已启动但扩展显示未连接?
A: 检查连接故障排除指南,常见原因包括:Ollama服务未启动、端口被占用(默认11434)、防火墙阻止访问。
Q: 如何导入/导出聊天记录?
A: 使用导出工具生成JSON文件,路径在设置→数据管理→导出对话。
Q: 支持哪些模型的视觉能力?
A: 当前仅支持Llama 3 Vision、GPT-4V等模型,需在模型配置中启用"视觉模式"。
未来展望与社区贡献
Page Assist作为开源项目(MIT许可证),欢迎通过以下方式参与:
下期预告:Page Assist 2.0将支持本地函数调用和知识库持久化,敬请关注项目Release页面
现在就访问项目仓库获取安装包,开启你的本地AI之旅。如果觉得有用,请给项目点赞收藏,让更多人告别AI配置的烦恼!
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0153- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
LongCat-Video-Avatar-1.5最新开源LongCat-Video-Avatar 1.5 版本,这是一款经过升级的开源框架,专注于音频驱动人物视频生成的极致实证优化与生产级就绪能力。该版本在 LongCat-Video 基础模型之上构建,可生成高度稳定的商用级虚拟人视频,支持音频-文本转视频(AT2V)、音频-文本-图像转视频(ATI2V)以及视频续播等原生任务,并能无缝兼容单流与多流音频输入。00
auto-devAutoDev 是一个 AI 驱动的辅助编程插件。AutoDev 支持一键生成测试、代码、提交信息等,还能够与您的需求管理系统(例如Jira、Trello、Github Issue 等)直接对接。 在IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。Kotlin03
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0112