Keras项目在MacOS MPS后端下的浮点精度问题解析

2025-04-30 19:57:19作者：农烁颖Land

Keras 3 是一个深度学习框架，支持 JAX、TensorFlow 和 PyTorch 多后端。轻松构建和训练图像识别、自然语言处理、音频处理等模型。加速开发流程，利用易于调试的运行时环境。实现最先进的性能，某些情况下比其他框架快 20% 至 350%。兼容从笔记本到大规模 GPU 或 TPU 集群的训练。已有近三百万开发者，包括初创企业和全球企业，信赖并使用 Keras 3。通过 `pip install keras` 即可安装，选择所需后端，开始您的高效深度学习之旅！

项目地址：https://gitcode.com/gh_mirrors/ker/keras

背景介绍

在深度学习框架Keras的最新版本中，开发者们遇到了一个与MacOS MPS(Metal Performance Shaders)后端相关的浮点精度兼容性问题。这个问题特别出现在使用Apple Silicon芯片(如M1/M2系列)的Mac设备上，当尝试将NumPy的64位浮点数组转换为PyTorch张量时。

问题本质

问题的核心在于硬件和软件栈之间的精度兼容性。具体表现为：

NumPy默认使用64位浮点数(float64)进行计算和存储
Apple的MPS后端目前仅支持32位浮点数(float32)
当Keras尝试在MPS设备上将NumPy数组转换为PyTorch张量时，由于精度不匹配导致转换失败

技术细节分析

在Keras的测试用例BackendUtilsTest.test_dynamic_backend_torch中，测试代码创建了一个随机NumPy数组：

x = np.random.uniform(size=[1, 2, 3])

这个数组默认使用float64精度。当测试尝试将这个数组通过PyTorch后端转换为张量时，在MPS设备上会抛出异常：

TypeError: Cannot convert a MPS Tensor to float64 dtype as the MPS framework doesn't support float64. Please use float32 instead.

解决方案探讨

针对这个问题，有几种可能的解决方案：

显式指定数据类型：在创建NumPy数组时明确指定float32精度

x = np.random.uniform(size=[1, 2, 3]).astype(np.float32)

后端适配：在Keras的PyTorch后端转换逻辑中自动处理精度降级

if x.dtype == np.float64 and get_device() == 'mps':
    x = x.astype(np.float32)

测试用例修改：针对MPS设备专门调整测试用例的精度要求

对开发者的启示

这个问题反映了跨平台深度学习开发中需要特别注意的几个方面：

硬件特性差异：不同硬件平台(CPU/GPU/TPU/MPS)支持的数值精度可能不同
默认行为陷阱：框架和库的默认行为(如NumPy的float64)可能与特定后端不兼容
测试覆盖：需要确保测试覆盖各种硬件配置和精度组合

最佳实践建议

对于在Apple Silicon设备上使用Keras和PyTorch的开发者，建议：

始终明确指定张量精度，避免依赖默认值
在MPS设备上工作时，优先使用float32精度
在涉及NumPy和PyTorch交互的代码中，显式处理精度转换
测试时考虑不同硬件后端的特性差异

总结

Keras在MacOS MPS后端下的浮点精度问题是一个典型的跨平台兼容性问题。通过理解硬件限制、框架默认行为和适当的精度管理，开发者可以避免这类问题，确保代码在各种设备上都能稳定运行。这也提醒我们在深度学习开发中需要更加关注底层硬件特性与上层框架的交互细节。

keras

项目地址：https://gitcode.com/gh_mirrors/ker/keras

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。

rainbond

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理