如何让浏览器变身本地AI工作站?开源工具Page Assist全解析
在数据隐私日益受到重视的今天,如何在不依赖云端服务的情况下,让AI能力无缝融入日常网页浏览?Page Assist这款开源浏览器扩展给出了答案——它将本地AI模型直接集成到浏览器侧边栏,让你在浏览网页时获得即时智能辅助,所有数据处理均在本地完成,真正实现"隐私保护"与"智能体验"的兼得。
发现本地AI的隐藏力量:重新定义浏览器体验
想象一下,当你正在阅读一篇复杂的技术文档时,无需切换窗口就能召唤AI解释专业术语;当你浏览研究论文时,本地模型可以帮你总结核心观点;当你处理工作邮件时,智能助手能实时提供写作建议。这正是Page Assist带来的变革——将强大的AI能力封装在浏览器侧边栏中,让你的日常网页浏览变得更高效、更智能。
作为一款开源工具,Page Assist的核心理念是"本地优先"。与传统依赖云端API的AI工具不同,它直接连接你电脑上运行的Ollama、LM Studio等本地AI服务,所有对话和数据处理都在本地完成,既保护了隐私,又避免了网络延迟。
3步激活本地AI助手:从安装到对话的无缝体验
准备你的AI工作环境
在开始探索Page Assist之前,需要确保你的系统已准备好两个核心组件:
- 现代浏览器:Chrome 110+、Firefox 109+、Edge 110+或其他基于Chromium的浏览器
- 本地AI服务:已安装并运行Ollama、LM Studio或其他OpenAI兼容API服务
如果你还没有安装本地AI服务,推荐使用Ollama,它提供了简单的命令行界面来管理和运行各种AI模型。
两种安装路径任你选择
方式一:应用商店一键安装(推荐)
- Chrome/Edge用户:在Chrome Web Store搜索"Page Assist"
- Firefox用户:在Firefox Add-ons商店搜索"Page Assist"
- 点击"添加至浏览器",几秒钟即可完成安装
方式二:从源码构建体验最新特性
# 克隆项目仓库
git clone https://gitcode.com/GitHub_Trending/pa/page-assist
cd page-assist
# 安装依赖
bun install
# 构建扩展
bun run build
构建完成后,在浏览器中开启"开发者模式",加载项目中的dist文件夹即可使用。
首次启动配置向导
安装完成后,首次点击浏览器工具栏中的Page Assist图标,会启动配置向导:
- 服务检测:自动扫描本地运行的AI服务,识别可用的模型
- 模型选择:从检测到的模型中选择默认对话模型
- 快捷键设置:配置唤起侧边栏的快捷键(默认为Ctrl+Shift+Y)
- 隐私设置:选择数据存储位置和知识库管理选项
完成这四个步骤后,你就可以通过快捷键或工具栏图标随时召唤Page Assist侧边栏了。
场景化解决方案:让AI成为你的网页浏览伴侣
智能侧边栏:不离开页面的AI对话
场景痛点:阅读网页时遇到疑问需要搜索,频繁切换标签页打断思路
解决方案:使用Page Assist侧边栏,在当前页面内获得AI即时解答
操作演示:
- 按下Ctrl+Shift+Y唤起侧边栏
- 在输入框中直接提问,AI会结合当前页面内容提供针对性回答
- 对话历史自动保存,可随时回顾之前的讨论
- 点击"固定"按钮可保持侧边栏始终可见,不影响网页浏览
侧边栏设计采用了简约但功能完整的界面,顶部显示当前对话主题,中间是消息区域,底部为输入框和功能按钮。消息区域支持Markdown格式显示,代码块会自动高亮,数学公式也能正确渲染。
网页内容理解:让AI读懂你正在看的页面
场景痛点:面对长篇文章或复杂报告,难以快速抓住核心要点
解决方案:启动"与网页对话"模式,让AI分析当前页面内容
操作演示:
- 在侧边栏点击"网页分析"图标(📄)
- 选择分析模式:"要点总结"、"详细解读"或"自定义问题"
- AI会自动处理页面内容,生成结构化分析结果
- 可针对分析结果进一步提问,深入探讨特定内容
这项功能特别适合学术研究、技术文档阅读和长篇文章理解。AI不仅能总结内容,还能解释专业术语、分析论证逻辑,甚至生成相关问题帮助你思考。
本地知识库:打造你的私人AI图书馆
场景痛点:需要频繁查阅的文档分散在各处,搜索和管理不便
解决方案:构建本地知识库,让AI帮你管理和查询个人文档
操作演示:
- 在侧边栏点击"知识库"图标(📁)
- 点击"添加文档"按钮上传PDF、DOCX、CSV等格式文件
- 文件处理完成后,直接向AI提问关于文档内容的问题
- 可创建多个知识文件夹,对文档进行分类管理
知识库存储在浏览器的IndexedDB中,最大支持200MB的单个文件。所有文档处理都在本地完成,确保敏感信息不会离开你的设备。
深度配置指南:打造个性化AI助手
AI模型管理中心
Page Assist支持同时配置多个AI模型,你可以根据不同任务选择合适的模型:
| 模型类型 | 推荐用途 | 资源需求 | 响应速度 |
|---|---|---|---|
| 轻量级模型(如Llama 2 7B) | 日常对话、快速问答 | 低(8GB内存足够) | 快 |
| 中量级模型(如Mistral 7B) | 文档分析、内容创作 | 中(16GB内存推荐) | 中 |
| 重量级模型(如Llama 2 13B) | 复杂推理、深度分析 | 高(32GB内存推荐) | 慢 |
配置多个模型后,你可以在侧边栏快速切换,或设置不同场景自动使用不同模型。
隐私与性能平衡设置
在"设置"面板中,你可以根据需求调整隐私和性能选项:
- 数据存储:选择对话历史保存位置(仅本地/加密同步)
- 模型缓存:设置模型响应缓存策略,平衡速度与新鲜度
- 资源使用:调整AI处理优先级,避免影响浏览器性能
- 内容过滤:配置敏感内容过滤级别
快捷键定制
Page Assist支持高度个性化的快捷键设置,让操作更符合你的习惯:
- 打开/关闭侧边栏:默认Ctrl+Shift+Y
- 发送当前选中文本:默认Alt+Q
- 切换对话模式:默认Ctrl+E
- 打开知识库:默认Ctrl+Shift+K
所有快捷键都可以在扩展设置中重新定义,找到最适合你的操作方式。
拓展应用:超越普通浏览的AI增强体验
学术研究工作流
Page Assist可以显著提升学术研究效率:
- 论文阅读:自动提取研究方法、实验结果和结论
- 术语解释:即时解释专业概念,无需切换到词典
- 跨文档关联:发现不同论文之间的关联和引用关系
- 笔记生成:根据阅读内容自动生成结构化笔记
编程学习助手
对于开发者来说,Page Assist是一个随叫随到的编程导师:
- 代码解释:解释网页上的代码示例,说明其工作原理
- API查询:帮助理解文档中的API用法和参数含义
- 错误分析:解释错误信息并提供可能的解决方案
- 最佳实践:针对代码示例提供改进建议
内容创作支持
无论是写邮件、报告还是社交媒体内容,Page Assist都能提供帮助:
- 大纲生成:根据主题快速创建内容大纲
- 风格调整:将文本转换为不同风格(正式、 casual、学术等)
- 语法检查:识别并建议修正语法错误和表达问题
- 创意拓展:提供相关话题和角度,拓展创作思路
未来演进路线:本地AI与浏览器的深度融合
Page Assist团队正在规划一系列令人期待的新功能:
- 多模态支持:未来版本将支持图像分析,让AI能"看到"网页中的图片并提供解读
- 离线语音交互:添加本地语音识别和合成,实现完全离线的语音对话
- 智能推荐系统:基于浏览习惯和兴趣,主动提供相关信息和工具
- 协作功能:允许安全地共享知识库和对话,支持团队协作
- 模型训练集成:让用户能基于个人数据微调本地模型,打造更个性化的AI助手
随着本地AI技术的不断进步,Page Assist有望成为连接用户与信息的智能桥梁,让浏览器不仅是信息获取工具,更成为个人知识管理和创造的中心。
通过将强大的本地AI模型与日常网页浏览无缝集成,Page Assist正在重新定义我们与信息交互的方式。它不仅保护了我们的隐私,还通过AI辅助提升了浏览效率和深度。无论你是研究者、开发者还是普通用户,这款开源工具都能为你打开一扇通往更智能、更私密的网络体验的大门。现在就尝试安装Page Assist,开始探索本地AI与浏览器结合的无限可能吧!
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00