Xpra项目v5.0.12版本发布:远程桌面体验全面升级
Xpra是一个开源的跨平台远程桌面工具,它允许用户将应用程序从远程服务器无缝地显示到本地计算机上,同时保持会话的持久性。与传统的远程桌面解决方案不同,Xpra提供了更灵活的应用级远程访问能力,特别适合需要长时间运行图形应用程序的场景。
平台构建与打包优化
本次发布的v5.0.12版本在平台兼容性和构建系统方面做出了多项改进。针对MSYS2 aarch64架构的构建问题得到了修复,同时改进了前缀检测机制。对于RPM打包系统,现在支持了针对不同架构的CUDA pkgconfig配置,使得在不同硬件平台上部署更加顺畅。
Windows平台的安装体验也得到了提升。EXE安装程序现在支持单独的升级步骤,避免了与残留文件的冲突问题。此外,构建脚本现在支持自定义参数,为开发者提供了更大的灵活性。针对某些Windows配置下刷新率检测异常的问题也得到了解决。
安全与认证增强
在安全方面,v5.0.12版本修复了一个SSL升级过程中选项丢失的问题,确保了加密连接的稳定性。QUIC连接现在被明确标记为适合认证场景使用,增强了安全性。同时,通过使用符号链接来防止SSH代理转发设置错误,进一步提升了连接的安全性。
网络与连接可靠性
网络连接稳定性是本版本的重点改进之一。修复了WebSocket连接在某些代理发送空负载时可能断开的问题。网络管理器API在某些环境下的错误也得到了处理,提高了网络检测的可靠性。此外,还优化了RDP连接尝试时的日志输出,减少了不必要的日志干扰。
桌面与窗口管理改进
桌面模式下的用户体验得到了显著提升。新版本改进了与某些窗口管理器在调整窗口大小时的兼容性,使得操作更加流畅。对于固定大小的桌面环境,现在能够正确处理显示设置。此外,还修复了键盘布局组相关的回归问题,确保多语言环境下的输入体验。
剪贴板功能完善
剪贴板功能是本版本的另一大改进点。现在当剪贴板内容更新时,系统会自动声明剪贴板选择,确保内容同步的及时性。当所有者变更时,也会立即更新对等端,保持剪贴板状态的一致性。默认设置现在允许所有剪贴板操作,同时修复了某些平台上远程剪贴板选项未被遵守的问题。
编码与图像处理优化
在图像编码方面,v5.0.12版本做出了多项性能优化。修复了批量延迟增加被复合计算的问题,避免了潜在的延迟累积。系统现在能更早地切换到完整帧编码,有效防止了损坏风暴的发生。对于10位每通道的高色深窗口,改进了透明度检测机制,并使用Pillow编码器进行更高效的处理。
RGB编码在特殊位深下的错误得到了修正,Pillow编码器的多个问题也得到了修复。当从系统托盘菜单将编码设置为"自动"时,现在能正确保留所有相关选项。系统托盘中的速度控制功能也得到了恢复,方便用户随时调整传输质量。
系统兼容性与稳定性
针对RHEL 10系统,新版本提供了专门的软件包列表和兼容性修复。包括为Weston和Xwayland提供包装脚本,并将其作为XVFB的替代选项。Pycairo的构建问题得到了解决,同时处理了缺少Pandoc或x264的情况。
系统稳定性方面,修复了可能导致远程日志循环的问题,以及Windows平台上的除零错误。NVJPEG编码器/解码器的构建开关中的拼写错误也得到了纠正,确保硬件加速功能正常启用。
用户体验与界面改进
在用户界面方面,代理错误信息的格式更加清晰易读。移除了多余的日志输出,避免信息过载。特别是移除了关于缺少numpy_formathandler的警告信息,减少了用户的困惑。图标全局查找不匹配的问题也得到了解决,确保界面元素显示正确。
Xpra v5.0.12版本通过上述多项改进,在性能、稳定性和用户体验方面都有显著提升,为远程桌面应用提供了更加可靠和高效的解决方案。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00