Torchmetrics 1.6.0版本在MPS设备上的性能回归问题分析

2025-07-03 07:56:03作者：庞队千Virginia

在深度学习模型评估过程中，性能指标的计算效率直接影响着开发者的工作效率。近期Torchmetrics 1.6.0版本在Apple M1芯片的MPS设备上出现了显著的性能下降问题，这引起了开发者社区的广泛关注。

问题现象

当用户在搭载M1 Pro芯片的MacBook Pro上使用Torchmetrics 1.6.0版本计算分割任务的多类指标时，发现计算速度出现了约10倍的下降。具体表现为：

这种性能差异在批量大小为2、输入尺寸为1024×1024、类别数为4的典型分割任务场景下尤为明显。

Torchmetrics作为PyTorch生态中的指标计算库，为各类机器学习任务提供了标准化的评估指标实现。在1.6.0版本中，库内部可能进行了某些影响MPS设备性能的改动：

经过开发者社区的分析，性能下降可能源于以下几个方面：

解决方案已通过PR提交，主要优化点包括：

对于遇到类似问题的开发者，可以采取以下临时解决方案：

性能优化是持续的过程，特别是在跨平台支持方面。Torchmetrics团队对这类问题的快速响应体现了开源社区的高效协作精神，也为其他跨平台深度学习工具的开发提供了宝贵经验。

登录后查看全文