MoltenVK项目中的GPU内存泄漏问题分析与修复

2025-06-09 11:28:01作者：彭桢灵Jeremy

MoltenVK is a Vulkan Portability implementation. It layers a subset of the high-performance, industry-standard Vulkan graphics and compute API over Apple's Metal graphics framework, enabling Vulkan applications to run on macOS, iOS and tvOS.

项目地址：https://gitcode.com/gh_mirrors/mo/MoltenVK

问题背景

在MoltenVK项目中，开发人员发现了一个严重的GPU内存泄漏问题。该问题主要影响搭载A12Z处理器的iPad Pro和第一代Apple TV 4K设备，而在较新的M2 Mac和iPhone 15 Pro上则不会出现。内存泄漏的速度约为每秒22MB，导致应用程序在大约三分钟后就会因内存耗尽而崩溃。

问题定位

通过深入的技术调查，开发人员发现这个内存泄漏问题始于特定的代码提交。使用性能跟踪工具MVK_CONFIG_PERFORMANCE_TRACKING和MVK_CONFIG_PERFORMANCE_LOGGING_FRAME_COUNT确认泄漏确实发生在"GPU memory allocated"部分，增长速率约为350KB/帧。

通过Metal System Trace工具分析，开发人员锁定了问题根源在于vkFreeMemory调用链中的特定路径。关键发现是当MVKImageMemoryBinding类的bindDeviceMemory方法被调用时，在某些特定条件下会导致内存泄漏。

技术分析

问题的核心在于MVKImage.mm文件中的一段条件判断逻辑。当_deviceMemory为nullptr时，usesTexelBuffer为false，但在受影响设备上_image->_isLinearForAtomics却为true。这种情况下，bindDeviceMemory方法被从析构函数调用，目的是模拟UNbindDeviceMemory操作，但却触发了不正确的内存处理路径。

具体来说，原始代码中的条件判断为：

if (usesTexelBuffer || _image->_isLinearForAtomics)

而实际上应该修改为：

if (_deviceMemory && _image->_isLinearForAtomics)

解决方案

修复方案相对简单但有效：在条件判断中增加对_deviceMemory的显式检查。这样修改后：

只有当_deviceMemory不为nullptr且_image->_isLinearForAtomics为true时，才会进入特定处理路径
避免了在内存释放过程中触发不必要的内存分配操作
解决了老款Apple设备上的GPU内存泄漏问题

影响范围

这个修复特别重要，因为它：

主要影响较老的Apple设备(A12Z处理器及更早版本)
不影响较新的Apple Silicon设备
解决了每帧都会发生的显著内存泄漏问题
提高了应用程序在受影响设备上的稳定性

技术启示

这个案例展示了几个重要的开发经验：

条件判断需要全面考虑所有可能的边界情况
内存管理代码在不同硬件平台上可能有不同表现
析构函数中的资源释放逻辑需要特别小心
性能跟踪工具对于诊断内存问题至关重要

通过这次问题的解决，MoltenVK项目在内存管理方面变得更加健壮，特别是在处理老款Apple设备时表现更加稳定。

MoltenVK

项目地址：https://gitcode.com/gh_mirrors/mo/MoltenVK

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781