WritingTools项目双平台重大更新:AI写作助手迎来v7.1/v3.1版本升级
项目概述
WritingTools是一款跨平台的AI辅助写作工具,旨在通过人工智能技术提升用户的写作效率和质量。该项目同时支持Windows和macOS两大操作系统,通过快捷键调用即可快速获得文本摘要、语法修正、内容改写等实用功能。最新发布的v7.1(Windows)和v3.1(macOS)版本带来了多项重要改进,使这款工具在功能性和用户体验上都达到了新的高度。
Windows v7.1版本核心更新
1. 完全可定制的功能按钮
本次更新最显著的改进是引入了完整的按钮自定义系统。用户现在可以:
- 自由添加、编辑和删除功能按钮
- 通过拖拽方式重新排列按钮顺序
- 一键恢复默认按钮配置 这个功能由社区贡献者momokrono开发后端架构,项目维护者theJayTea则负责实现图形界面部分,包括拖拽排序和重置功能。
2. 优化的弹出窗口UI
新版采用了更加简洁现代的弹出窗口设计,优化了初始高度设置,使界面更加紧凑高效。这种改进特别适合需要频繁调用工具的专业写作者。
3. 原生Ollama AI支持
v7.1版本集成了对Ollama API的原生支持,使得设置本地运行的Ollama模型变得更加简单。新增功能包括:
- 简化的Ollama配置流程
- 自定义模型在内存中保留时间的选项 这一功能同样由momokrono开发实现。
4. 增强的Gemini模型支持
针对Google的Gemini模型,新版提供了:
- 更多模型选项选择
- 更清晰的使用说明和解释
- 改进的速率限制错误提示
5. 新增暂停/恢复功能
考虑到用户可能需要临时禁用快捷键的情况,v7.1新增了暂停功能:
- 可随时暂停工具对热键的监听
- 需要时一键恢复工作 这一实用功能同样出自momokrono之手。
macOS v3.1版本核心更新
1. 全新的工具管理系统
macOS版本重构了工具管理架构,解决了之前版本中存在的一系列问题,提高了整体稳定性。
2. 本地LLM优化
针对不同硬件平台进行了特别优化:
- 在Intel芯片Mac上自动禁用本地LLM功能,防止崩溃
- 集成了Llama 3.2 3B模型,无需API密钥或Ollama即可工作
- 提供模型下载功能
3. 多语言支持
新增对德语和法语的支持,使工具能够服务更广泛的用户群体。
4. 用户体验改进
包括:
- 修复主题更新不正确的问题
- 优化设置、引导和弹出窗口的UI
- 支持ESC键关闭弹出窗口
技术实现亮点
跨平台架构
WritingTools采用原生开发方式,针对Windows和macOS平台分别优化,确保在各系统上都能提供最佳性能。Windows版本使用.NET技术栈,而macOS版本则充分利用了Apple生态系统特性。
AI提供者架构优化
v7.1版本对AI提供者架构进行了全面优化,特别是修复了OpenAI提供者的问题,使不同AI服务之间的切换更加流畅可靠。
本地模型集成
macOS版本创新的本地LLM集成方案,使用MLX框架运行Llama模型,在Apple Silicon芯片上表现出色。团队正在研究Core ML替代方案,以期未来支持Intel芯片Mac。
未来发展方向
根据开发路线图,WritingTools未来将重点关注以下方面:
- 多语言界面支持(已由momokrono完成框架搭建)
- 特定功能快捷键定制
- 推理标记优化(部分模型已支持)
- 文本差异对比功能
- 粘贴前窗口焦点验证
- 响应文本流式传输
- 多媒体内容支持(图片、视频等)
升级注意事项
对于Windows用户:
- 可保留旧版config.json文件迁移设置
- 首次启动可能因安全扫描导致延迟
对于macOS用户:
- 升级后可能需要重新配置辅助功能权限
- 本地LLM需要单独下载模型文件
结语
WritingTools v7.1/v3.1版本标志着该项目进入了一个更加成熟的发展阶段。通过社区贡献与核心开发的完美配合,这款工具在功能丰富性和用户体验上都取得了显著进步。特别是可定制按钮和本地模型支持等创新功能,使其在同类工具中脱颖而出。随着多语言支持和更多AI功能的持续加入,WritingTools有望成为写作者不可或缺的智能助手。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00