解决MacBook Pro M1上运行insanely-fast-whisper的NotImplementedError问题

2025-05-27 09:49:33作者：温玫谨Lighthearted

**瞬间加速语音转文字： insanley-fast-whisper** — 拥抱速度与效率的音频转录革命！利用transformers、Optimum及flash-attn的强大力量，这款CLI工具让你实现前所未有的快速转录体验。仅需不到98秒即可处理2.5小时的音频，彻底改变转录音频的时效标准。通过精心优化和闪存注意力机制，它在NVIDIA GPU或Mac上展现出惊人的性能，提供从大型模型到精简版的多种选项，满足不同需求。无需复杂操作，一条命令，即时启动，无论是研究人员还是日常用户都能轻松享受高效转录带来的便利。立即通过pipx安装，解锁你的终端机超高速转录能力，体验音频处理的新时代！🚀

项目地址：https://gitcode.com/gh_mirrors/in/insanely-fast-whisper

在MacBook Pro M1设备上部署和使用insanely-fast-whisper语音识别模型时，开发者可能会遇到一个特定的NotImplementedError错误。这个问题源于PyTorch对MPS(Metal Performance Shaders)设备的支持尚不完善。

问题现象

当在MacBook Pro M1(2020款)上运行insanely-fast-whisper进行语音转录时，系统会抛出NotImplementedError异常。错误信息明确指出PyTorch尚未实现aten::isin.Tensor_Tensor_out操作符对MPS设备的支持。

错误原因分析

这个问题的核心在于PyTorch对Apple Silicon芯片(M1/M2)的MPS后端支持仍在开发阶段。MPS是Apple提供的Metal Performance Shaders框架，允许在Apple芯片上高效运行机器学习计算。然而，PyTorch对MPS的支持尚未覆盖所有操作符，导致某些功能无法正常运行。

具体到insanely-fast-whisper项目，当模型尝试生成转录文本时，会调用一个用于检查特殊令牌(如结束符)是否存在于填充令牌中的isin操作，而这一操作目前尚未在MPS后端实现。

解决方案

目前有两种可行的解决方案：

临时解决方案：启用MPS回退机制

可以通过设置环境变量PYTORCH_ENABLE_MPS_FALLBACK=1来启用MPS回退机制。当遇到MPS不支持的操时，系统会自动回退到CPU执行。虽然这会降低性能，但可以保证功能正常。

PYTORCH_ENABLE_MPS_FALLBACK=1 insanely-fast-whisper --file-name audio.wav --device-id mps --task transcribe --language nl --min-speakers 2

长期解决方案：等待PyTorch更新

PyTorch团队正在积极完善对MPS的支持。开发者可以关注PyTorch的GitHub问题追踪页面，了解相关操作符的实现进度。当PyTorch更新支持该操作符后，问题将自然解决。

性能考量

虽然启用MPS回退机制可以解决问题，但需要注意：

回退到CPU执行会显著降低处理速度
对于长音频文件(如20分钟)，转录时间可能会明显增加
建议在开发/测试阶段使用此方案，生产环境考虑其他设备

最佳实践建议

对于MacBook Pro M1用户，建议：

对于短音频文件，使用回退方案即可
对于长音频处理，考虑使用云GPU服务
定期检查PyTorch更新，及时获取对MPS的完整支持
在性能要求高的场景下，考虑使用配备专用GPU的设备

通过以上分析和解决方案，开发者可以在MacBook Pro M1上顺利运行insanely-fast-whisper项目，同时了解相关技术限制和优化方向。

insanely-fast-whisper

项目地址：https://gitcode.com/gh_mirrors/in/insanely-fast-whisper

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理