Box64 v0.3.4版本发布:跨平台x86_64模拟器迎来重大性能与兼容性升级
Box64是一款创新的动态二进制翻译工具,它允许x86_64架构的应用程序在非x86平台上运行,包括ARM64、RISC-V 64和LoongArch 64等架构。最新发布的v0.3.4版本带来了显著的性能提升和兼容性改进,特别是在RISC-V和ARM平台上的表现尤为突出。
核心架构优化
本次更新对RV64后端进行了深度优化,显著提升了执行效率。通过充分利用RVV 1.0和xThreadVector扩展指令集,现在能够更高效地模拟SSE/SSE2+指令集(虽然AVX支持尚未实现)。这种硬件加速的向量运算模拟大幅提升了多媒体应用的运行效率。
ARM64平台同样获得了重要改进,特别是在DRM(数字版权管理)支持方面。现在更多类型的DRM保护内容可以在ARM设备上顺利运行,为游戏和媒体应用打开了更广阔的可能性。
突破性功能:Windows系统调用模拟
v0.3.4版本引入了一项突破性功能——Windows系统调用模拟。这项功能需要配合Proton使用,并且目前要求48位地址空间支持。它为在Linux平台上运行Windows应用程序提供了更底层的支持,是兼容性方面的重要里程碑。
性能优化与调试增强
开发团队引入了多项性能优化措施,包括:
- BOX64_DYNAREC_DIRTY选项:提供了一种更快速(但安全性稍低)的方式来处理自修改代码
- 实验性GDBJIT支持:允许在ARM/RV64/LA64平台上以x86寄存器和指令视角调试程序
- Perf工具集成:提供了x86指令级别的性能分析能力
- CPUID处理重构:新增BOX64_CPUTYPE支持,可以选择模拟Intel或AMD处理器特性
动态二进制翻译改进
所有支持的架构后端(ARM64、RV64、LA64)都获得了大量改进:
- 标志位处理更加精确,更接近真实x86 CPU行为
- 新增对许多罕见指令的支持
- 内存跟踪和文件描述符支持的内存映射得到改进
- 针对REP MOVSB指令的优化实现
- RV64平台利用硬件扩展(如AES)提升加密操作性能
- LA64平台增加了对ABI 1.0的有限支持
Box32兼容性提升
Box64内置的32位兼容层Box32也获得了显著改进:
- 现在可以在ARM64后端上运行Steam客户端(RV64和LA64平台暂不支持)
- 大量pthreads相关问题的修复
- 更多函数和库的包装支持
- 高内存(超过32位)处理机制的改进
开发者工具与诊断增强
新版本在开发者体验方面也有重要提升:
- 跟踪日志系统重构,每条日志都带有可选颜色的BOX32或BOX64前缀
- 协仿真(cosim)系统改进,减少误报
- 运行时消息更加规范化
- 新增自动生成的USAGE.md和box64.pod文档
游戏兼容性优化
通过大量的游戏配置文件(RCFile)更新,许多游戏的运行速度和兼容性都得到了针对性优化。开发团队为多款热门游戏添加了专门的优化配置,包括但不限于《Sekiro》等。
构建与分发改进
CI系统现在不仅生成常规Linux构建,还会创建MiceWine的.rat存档和Winlator的.wcp存档,方便不同平台的用户使用。同时修复了多种构建环境下的问题,提高了跨平台构建的可靠性。
Box64 v0.3.4版本标志着这个项目在性能和兼容性方面又向前迈进了一大步。特别是对RISC-V和LoongArch架构的深度优化,为这些新兴平台运行x86_64应用提供了更强大的支持。Windows系统调用模拟的引入则为Wine/Proton的兼容性打下了更坚实的基础,展现了Box64在跨平台兼容性解决方案中的重要地位。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0113
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
omega-aiOmega-AI:基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多线程与GPU运算,GPU支持CUDA,CUDNN。Java04
llm-universe本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/Jupyter Notebook08