nnUNet在Mac M系列芯片上的训练问题及解决方案

2025-06-02 07:22:47作者：温玫谨Lighthearted

项目地址：https://gitcode.com/gh_mirrors/nn/nnUNet

背景介绍

nnUNet作为医学图像分割领域广泛使用的深度学习框架，通常运行在Linux系统下的NVIDIA GPU环境中。然而，随着Apple Silicon芯片(M1/M2/M3系列)的普及，越来越多的开发者尝试在MacBook Pro等设备上运行nnUNet进行模型训练。

问题现象

当用户尝试在配备M3 Max芯片的MacBook Pro上使用nnUNet时，虽然可以使用CPU进行训练，但在尝试使用Metal Performance Shaders(MPS)设备时会遇到错误提示："Device mps not supported"。这是由于PyTorch的inductor后端目前不支持MPS设备导致的兼容性问题。

技术分析

PyTorch 2.0引入的torch.compile功能默认使用inductor后端进行优化，而该后端目前尚未实现对MPS设备的完整支持。当nnUNet尝试在MPS设备上启用编译优化时，就会触发这个兼容性问题。

解决方案

临时解决方案

环境变量设置法：通过设置环境变量nnUNet_compile=f来禁用torch.compile功能
```
export nnUNet_compile=f
```
然后再运行nnUNet训练命令
代码修改法：直接修改nnUNet源代码，将后端设置为'aot_eager'

官方最新解决方案

nnUNet开发团队已经更新了代码，现在会自动检测MPS设备并禁用torch.compile功能，用户无需再进行任何手动配置。

最佳实践建议

确保使用最新版本的nnUNet，以获得对MPS设备的自动兼容支持
在Mac设备上训练时，建议监控内存使用情况，因为M系列芯片的统一内存架构与传统的GPU显存管理方式不同
对于大型数据集，仍需考虑性能问题，Mac设备可能不适合超大规模模型的训练

总结

虽然Mac M系列芯片提供了强大的计算能力，但在深度学习框架支持方面仍存在一些兼容性问题。nnUNet团队已经积极跟进并解决了MPS设备的支持问题，使得在Mac设备上进行医学图像分割模型的训练变得更加便捷。用户只需确保使用最新版本的nnUNet，即可享受到这一改进带来的便利。

项目地址：https://gitcode.com/gh_mirrors/nn/nnUNet

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理