MoltenVK项目中SSBO内存泄漏问题的技术分析与解决方案

2025-06-09 15:24:35作者：宗隆裙

MoltenVK is a Vulkan Portability implementation. It layers a subset of the high-performance, industry-standard Vulkan graphics and compute API over Apple's Metal graphics framework, enabling Vulkan applications to run on macOS, iOS and tvOS.

项目地址：https://gitcode.com/gh_mirrors/mo/MoltenVK

问题背景

在使用MoltenVK（Vulkan在macOS上的实现层）开发图形应用时，开发者发现当使用Shader Storage Buffer Object（SSBO）时，每次调用vkQueueSubmit都会导致约13GB的内存泄漏。这一问题在Apple M2硬件上尤为明显，且随着SSBO大小的增加，内存泄漏量也会相应增大。

问题现象

开发者通过vkGetPhysicalDeviceMemoryProperties2函数监控内存使用情况，发现以下异常模式：

首次调用vkQueueSubmit前，内存使用量约为470MB（正常）
首次调用vkQueueSubmit后，内存使用量激增至13.9GB
每次后续调用vkQueueSubmit，内存使用量都会再增加约13GB
最终导致系统因内存不足而崩溃

深入调查

经过深入分析，开发者发现了几个关键点：

SSBO相关性：问题仅在使用了SSBO时出现，且泄漏量与SSBO大小成正比
命令缓冲区管理：开发者最初频繁创建和销毁命令缓冲区，这可能加剧了内存问题
交换链同步问题：最初存在对vkAcquireNextImageKHR函数的误解，导致命令缓冲区队列不断增长

根本原因

最终确定问题由多个因素共同导致：

交换链同步不当：错误地认为vkAcquireNextImageKHR会等待GPU完成对交换链图像的使用，实际上它只等待垂直同步信号
命令缓冲区积累：当帧渲染时间超过16.7ms时，新的命令缓冲区会不断提交，而旧的尚未完成执行
中间缓冲区保留：特别是与曲面细分着色器相关的中间输出缓冲区未被及时释放

解决方案

开发者采取了以下措施解决问题：

正确同步交换链：
- 使用fence与vkAcquireNextImageKHR配合
- 在获取图像后立即等待fence信号
优化命令池管理：
- 使用VK_COMMAND_POOL_RESET_RELEASE_RESOURCES_BIT标志重置命令池
- 这一措施将内存使用从20GB降低到13GB
理解Metal资源管理：
- 认识到MoltenVK会将某些缓冲区标记为可清除(purgeable)
- 这些缓冲区在GPU内存不足时会被系统自动回收