Mach引擎在Win32平台下的D3D12设备挂起问题分析

2025-06-17 03:21:54作者：秋泉律Samson

zig game engine & graphics toolkit

项目地址：https://gitcode.com/gh_mirrors/ma/mach

问题背景

Mach引擎是一个开源的图形引擎项目，近期在Windows 32位平台上出现了编译失败和运行时设备挂起的问题。该问题特别出现在D3D12渲染后端运行sprite示例时，当渲染到第2048帧时会发生设备移除错误。

错误现象

当在Win32平台上运行Mach引擎的sprite示例时，系统会报告以下D3D12错误：

D3D12 ERROR: ID3D12Device::RemoveDevice: Device removal has been triggered for the following reason (DXGI_ERROR_DEVICE_HUNG: The Device took an unreasonable amount of time to execute its commands, or the hardware crashed/hung. As a result, the TDR (Timeout Detection and Recovery) mechanism has been triggered.

问题特征

特定条件下触发：该错误只在特定条件下出现：
- 当垂直同步(VSync)禁用时
- 在Debug或非ReleaseFast优化模式下编译时
引入点明确：问题可以追溯到特定的代码提交，表明可能是由某些内存管理或同步机制的变更引起的。
设备挂起：错误类型表明图形设备因执行命令时间过长而被系统移除，这通常指向资源管理问题或竞态条件。

技术分析

可能的原因

内存管理问题：
- 在非优化构建中，内存访问检查更严格，可能暴露了潜在的内存越界或释放后使用问题
- 图形资源(如纹理、缓冲区)的生命周期管理可能存在缺陷
同步机制缺陷：
- 禁用VSync可能导致渲染循环运行过快，暴露了命令队列同步问题
- 可能存在命令列表/分配器的重用时机不当
32位特定问题：
- 指针截断或地址空间限制问题
- 内存对齐或打包差异

调试建议

启用D3D12调试层：可以获取更详细的错误信息，帮助定位问题资源
内存分析工具：使用专用工具检查内存访问违规
帧调试：在接近2048帧时逐步执行，观察资源状态变化

解决方案

开发团队已经实施了临时修复措施，并计划进行以下改进：

资源管理强化：审查所有图形资源的创建、使用和释放流程
同步机制优化：确保命令队列和交换链的同步正确性
平台适配性测试：加强在32位平台上的测试覆盖

结论

这类图形设备挂起问题通常与资源管理或同步机制有关，特别是在高负载情况下更容易暴露。Mach引擎团队已经识别出问题范围并开始修复工作，未来版本将提供更稳定的32位平台支持。开发者在使用Mach引擎时，如果遇到类似问题，可以考虑临时启用VSync或使用ReleaseFast构建配置作为变通方案。

zig game engine & graphics toolkit

项目地址：https://gitcode.com/gh_mirrors/ma/mach

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

flutter_flutter

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统