ChatTTS项目在Mac M1/M2/M3芯片上的运行问题分析与解决方案
ChatTTS作为一款开源的文本转语音工具,在Mac设备上运行时可能会遇到一些兼容性问题。本文将深入分析这些问题的根源,并提供有效的解决方案。
问题现象分析
当用户在搭载Apple M系列芯片(M1/M2/M3)的Mac设备上运行ChatTTS时,主要会出现两类错误提示:
-
核心运行时错误:在执行
wavs = chat.infer(texts, use_decoder=True)时,系统抛出RuntimeError,提示INTERNAL ASSERT FAILED错误,具体指向PyTorch的二进制内核操作问题。 -
持续警告信息:运行过程中不断输出关于
torch._dynamo.convert_frame的警告,最终显示Device mps not supported的错误信息。
技术背景解析
这些问题的根源在于PyTorch框架对Apple M系列芯片的Metal Performance Shaders(MPS)后端支持尚不完善:
-
MPS后端限制:PyTorch的MPS后端目前对某些复杂运算(特别是涉及复数类型的操作)支持不完整,导致在音频处理流程中出现断言失败。
-
编译优化冲突:PyTorch的动态图编译优化(torch.compile)与MPS后端存在兼容性问题,无法正确生成针对M1/M2/M3芯片优化的代码。
解决方案
针对上述问题,我们推荐以下几种解决方案:
方案一:禁用动态编译优化
在初始化ChatTTS时,添加以下配置可避免大部分问题:
import torch
torch._dynamo.config.suppress_errors = True
方案二:强制使用CPU计算
虽然性能会有所下降,但可以确保稳定性:
import os
os.environ["PYTORCH_ENABLE_MPS_FALLBACK"] = "1"
方案三:使用特定版本的PyTorch
某些PyTorch版本对MPS支持更稳定,可以尝试:
pip install torch==2.1.0
性能优化建议
对于希望在Mac设备上获得更好性能的用户:
- 使用较小的batch size以减少内存压力
- 考虑使用半精度(fp16)计算
- 监控GPU内存使用情况,适当调整模型参数
未来展望
随着PyTorch对MPS后端支持的不断完善,预计这些问题将在未来的版本中得到解决。开发团队也在积极优化代码,以更好地适配Apple Silicon芯片。
对于技术爱好者,可以关注PyTorch的官方更新日志,及时了解MPS后端的改进情况。同时,ChatTTS项目团队也在持续优化模型架构,以提供更好的跨平台支持。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust098- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiMo-V2.5-ProMiMo-V2.5-Pro作为旗舰模型,擅⻓处理复杂Agent任务,单次任务可完成近千次⼯具调⽤与⼗余轮上 下⽂压缩。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00