Cairo Desktop 0.4.407版本发布:现代化Shell界面的重要更新
项目简介
Cairo Desktop是一款开源的Windows Shell替代方案,它为用户提供了现代化的桌面体验。作为一个轻量级的桌面环境,Cairo Desktop不仅保留了Windows系统的核心功能,还引入了类似macOS的Dock栏、任务管理等创新特性,让Windows用户能够获得更高效、更美观的工作环境。
核心功能更新
窗口动画优化
0.4.407版本对窗口最小化/还原动画进行了重要改进。现在这些动画会基于Cairo任务栏按钮的位置来执行,当按钮出现在多个任务栏上时,系统会自动选择主任务栏作为动画参考点。这一改进使得窗口操作更加直观,视觉体验更加连贯。
Windows键行为自定义
对于将Cairo作为默认Shell使用的用户,新版本增加了禁用Windows键打开程序菜单的选项。这一功能特别适合那些习惯使用Windows键进行其他操作的高级用户,提供了更灵活的系统控制能力。
任务栏稳定性提升
本次更新重点修复了多个任务栏相关的稳定性问题:
-
解决了虚拟桌面切换时任务显示不正确的问题,现在任务栏能够准确反映当前虚拟桌面上的窗口状态。
-
修复了通过任务栏关闭任务时提示对话框无法置顶的问题,确保用户在关闭可能有未保存数据的应用时不会错过重要提示。
-
优化了任务栏对禁用窗口的处理逻辑,防止无法还原的窗口被错误地最小化。
-
改进了任务栏对多显示器环境的支持,解决了任务偶尔显示在错误任务栏上的问题。
显示与界面改进
新版本在多显示器支持方面做出了多项优化:
-
修正了在高DPI副屏上自动隐藏菜单栏和任务栏可能出现在屏幕外的问题。
-
解决了App Grabber在副屏上打开时窗口尺寸不正确的问题。
-
优化了菜单栏和任务栏在不同显示配置下的定位算法,防止出现重复显示或位置错误的情况。
系统兼容性增强
0.4.407版本提升了与不同Windows版本的兼容性:
-
修复了在Windows 11上可能错过新添加显示器的问题。
-
解决了在Windows 11上重启Explorer可能导致崩溃循环的问题。
-
针对ARM64架构进行了专门优化,确保更新器能够正确识别并下载对应版本。
性能与稳定性
本次更新包含了多项底层改进:
-
在Windows 8及更新版本上实现了性能提升。
-
修复了日志文件无法写入时的崩溃问题。
-
改进了全屏应用的处理逻辑,防止Cairo意外覆盖全屏应用。
-
优化了焦点管理机制,减少了Cairo意外窃取焦点的情况。
本地化支持
新版本增加了繁体中文支持,并对以下语言进行了改进:
- 巴西葡萄牙语
- 德语
- 俄语
这些本地化工作使得Cairo Desktop能够更好地服务于全球用户。
用户体验优化
-
移除了禁用任务栏时不能启用通知区域的限制,为用户提供了更灵活的界面配置选项。
-
修复了"登录时启动Cairo"选项工作不正常的问题。
-
改进了文件管理器中的隐藏文件显示逻辑,确保符合用户预期。
技术实现亮点
从技术角度看,0.4.407版本展示了开发团队对Windows Shell机制的深入理解:
-
窗口管理子系统经过重构,能够更精确地跟踪窗口状态变化。
-
多显示器处理逻辑更加健壮,能够适应各种复杂的显示配置变化。
-
系统钩子的使用更加谨慎,减少了与原生Windows组件的冲突。
-
内存管理得到优化,特别是在处理大量窗口对象时表现更稳定。
总结
Cairo Desktop 0.4.407版本是一次全面的质量提升更新,重点解决了用户反馈的稳定性问题,同时增强了多显示器环境下的使用体验。对于追求高效、美观桌面环境的Windows用户来说,这个版本标志着Cairo Desktop在成熟度上的重要进步。开发团队对细节的关注和对用户反馈的积极响应,使得Cairo Desktop正逐渐成为Windows Shell替代方案中的佼佼者。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00