AllTalk TTS在Windows 11上的安装与问题解决指南

2025-07-09 12:59:51作者：郁楠烈Hubert

AllTalk is based on the Coqui TTS engine, similar to the Coqui_tts extension for Text generation webUI, however supports a variety of advanced features, such as a settings page, low VRAM support, DeepSpeed, narrator, model finetuning, custom models, wav file maintenance. It can also be used with 3rd Party software via JSON calls.

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

AllTalk TTS是一款基于Python的文本转语音工具，它支持多种TTS引擎和模型。本文将详细介绍在Windows 11系统上安装AllTalk TTS beta版本时可能遇到的问题及其解决方案。

环境准备

在开始安装前，请确保系统满足以下要求：

Windows 11操作系统
已安装NVIDIA显卡驱动（如需使用CUDA加速）
基本的Python环境配置经验

常见安装问题分析

1. 模块缺失错误

首次运行AllTalk TTS时，可能会遇到以下模块缺失错误：

inputimeout模块未找到
ffmpeg模块未找到
sounddevice模块未找到

这些错误表明安装过程中某些Python依赖包未能正确安装。

2. CUDA支持问题

默认的conda安装可能不会包含CUDA支持的PyTorch版本，这会导致无法利用GPU加速。

详细解决方案

步骤1：安装必要的Python模块

在激活AllTalk TTS的conda环境后，手动安装缺失的模块：

pip install inputimeout
pip install python-ffmpeg
pip install sounddevice

步骤2：安装支持CUDA的PyTorch

为了确保PyTorch能够使用GPU加速，需要安装特定版本的PyTorch：

pip install torch==2.2.1+cu121 torchvision==0.17.1+cu121 torchaudio==2.2.1+cu121 --index-url https://download.pytorch.org/whl/cu121

步骤3：验证安装

完成上述步骤后，重新运行start_alltalk.bat脚本。正常情况下，你应该能看到以下成功启动信息：

[AllTalk ENG] DeepSpeed version : 0.14.0+ce78a63
[AllTalk ENG] Python Version    : 3.11.0
[AllTalk ENG] PyTorch Version   : 2.2.1+cu121
[AllTalk ENG] CUDA Version      : 12.1
[AllTalk ENG] Model/Engine : xttsv2_2.0.3 loading into cuda

性能优化建议

启动时间优化：如果模型加载时间过长（超过240秒），可以编辑script.py文件，增加startup_wait_time参数值。
硬件配置：
- 使用SSD而非机械硬盘可以显著减少模型加载时间
- 确保PCIe总线带宽充足
- 对于老旧系统，考虑使用轻量级TTS引擎
内存管理：AllTalk TTS支持WAV文件自动删除功能，可在配置中启用以节省磁盘空间。

使用说明

成功启动后，可以通过以下方式访问AllTalk TTS：

API地址：127.0.0.1:7851
浅色主题界面：http://127.0.0.1:7852
深色主题界面：http://127.0.0.1:7852?__theme=dark

注意事项

退出时请使用Ctrl+C，否则可能有子进程在后台继续运行
首次运行时模型加载可能需要较长时间，请耐心等待
确保系统PATH中包含ffmpeg可执行文件路径

通过以上步骤，你应该能够在Windows 11系统上成功安装并运行AllTalk TTS beta版本。如果在使用过程中遇到其他问题，建议检查日志文件获取更详细的错误信息。

alltalk_tts

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781