AllTalk TTS 项目中的 CUDA 和 PyTorch 兼容性问题解决方案

2025-07-09 22:46:35作者：昌雅子Ethen

AllTalk is based on the Coqui TTS engine, similar to the Coqui_tts extension for Text generation webUI, however supports a variety of advanced features, such as a settings page, low VRAM support, DeepSpeed, narrator, model finetuning, custom models, wav file maintenance. It can also be used with 3rd Party software via JSON calls.

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

问题背景

在 AllTalk TTS 项目中，用户在使用 text-generation-webui 扩展时遇到了 CUDA 不可用的问题。系统显示 PyTorch 版本为 2.2.1+cpu，表明当前环境中 PyTorch 没有正确加载 CUDA 支持。这个问题尤其影响使用 NVIDIA GeForce RTX 4060 Ti 16GB 显卡的用户。

核心问题分析

PyTorch 与 CUDA 版本不匹配：项目需要 PyTorch 带有 CUDA 扩展支持，但当前安装的是 CPU 版本
Python 环境兼容性：text-generation-webui 目前仅验证支持 Python 3.11.x 环境
CUDNN 依赖问题：NVIDIA 官方仅提供了 Python 3.11.x 的 CUDNN 包

解决方案

标准解决方案（推荐）

确保使用正确的 Python 环境：
- 使用 text-generation-webui 提供的 start_windows.bat 安装和运行
- 在运行 atsetup.bat 前先执行 cmd_windows.bat
验证 PyTorch CUDA 支持：
```
pip show torch
```
确认输出中包含 +cuXXX（如 +cu121），表示已安装 CUDA 支持

强制安装 PyTorch 带 CUDA 支持

如果标准方法无效，可尝试以下步骤：

清除 pip 缓存：
```
pip cache purge
```

卸载现有 PyTorch：

pip uninstall torch torchaudio torchvision

安装指定版本的 PyTorch 带 CUDA 支持：

pip install torch==2.2.1+cu121 torchaudio>=2.2.1+cu121 torchvision --upgrade --force-reinstall --extra-index-url https://download.pytorch.org/whl/cu121

特殊情况处理

如果不需要使用微调(Fine-tuning)或 TTS 生成器的分析功能，可以：

编辑 requirements_textgen.txt 文件
移除 nvidia-cudnn-cu11>=9.0.0.312 依赖项

技术要点说明

PyTorch CUDA 版本：必须与安装的 CUDA 工具包版本匹配
CUDNN 与 CUDA 工具包：这是两个独立的组件，CUDNN 是用于深度神经网络加速的库
环境隔离：建议使用项目提供的标准环境，避免自定义环境带来的兼容性问题

验证方法

成功配置后，AllTalk 启动时应显示类似信息：

Current PyTorch Version: 2.2.1+cu121
Current CUDA Version   : 12.1

注意事项

目前 text-generation-webui 仅正式支持 PyTorch 2.2.1 版本
更高版本的 PyTorch 可能与部分模型加载器不兼容
自定义 Python 环境可能导致不可预见的依赖冲突

通过以上方法，大多数用户应该能够解决 CUDA 不可用的问题，使 AllTalk TTS 能够充分利用 GPU 加速功能。

AllTalk is based on the Coqui TTS engine, similar to the Coqui_tts extension for Text generation webUI, however supports a variety of advanced features, such as a settings page, low VRAM support, DeepSpeed, narrator, model finetuning, custom models, wav file maintenance. It can also be used with 3rd Party software via JSON calls.

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

登录后查看全文

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统