Mach图形库中的D3D12文本渲染内存泄漏问题分析

2025-06-17 02:20:45作者：田桥桑Industrious

在Mach图形库的D3D12后端实现中，我们发现了一个关于文本渲染的内存泄漏问题。这个问题特别出现在当没有实际文本需要渲染的情况下，系统仍然会创建不必要的命令编码器(CommandEncoder)资源，而这些资源没有被正确释放。

问题本质

问题的核心在于gfx.Text.updatePipeline函数中命令编码器的创建和释放机制。当场景中没有需要渲染的文本时（即num_texts和glyphs.items.len都为零），系统仍然会创建一个D3D12命令编码器。虽然代码中有defer encoder.release()语句，但这并不足以完全释放D3D12后端分配的所有资源。

技术细节

在D3D12的实现中，创建命令编码器时会同时创建两个关键资源：

命令缓冲区(CommandBuffer)
资源管理组件(ResourceManager)

资源管理组件负责追踪命令执行过程中使用的各种资源（如缓冲区等）。由于GPU命令的执行可能超出命令编码器的生命周期，资源管理组件会一直保持活跃，直到相关命令在GPU设备队列上执行完毕。

解决方案分析

针对这个问题，我们提出了两个层面的改进方案：

优化创建逻辑：在创建命令编码器前，先检查是否有实际需要渲染的文本。只有当num_texts和glyphs.items.len都不为零时，才创建命令编码器。这是最直接的修复方案。
完善释放机制：深入研究为什么仅调用release不足以释放未使用的编码器资源。我们发现，要完全释放资源，需要调用encoder.finish()并将生成的命令提交到队列。对于被取消的命令编码器，可以监控是否调用了finish，如果没有调用，则在释放时处理那些通常会在提交到设备队列后才释放的资源。

系统架构考量

值得注意的是，Mach图形库的sysgpu模块中有一个tick()函数，但当前实现中并未被调用。在D3D12实现中，资源管理组件实际上是在创建新的命令分配器(CommandAllocator)时，通过processQueuedOperations函数释放的。这种设计可能导致资源释放不够及时，也是内存泄漏的一个潜在原因。