推荐开源项目：AllTalk TTS —— 高效的文本转语音解决方案

2026-01-23 04:12:54作者：伍霜盼Ellen

AllTalk is based on the Coqui TTS engine, similar to the Coqui_tts extension for Text generation webUI, however supports a variety of advanced features, such as a settings page, low VRAM support, DeepSpeed, narrator, model finetuning, custom models, wav file maintenance. It can also be used with 3rd Party software via JSON calls.

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

项目介绍

AllTalk TTS 是一个功能强大的文本转语音（TTS）项目，特别适用于需要高质量语音生成的应用场景。该项目基于 Coqui_tts 扩展，经过精心优化和改进，提供了丰富的功能和灵活的配置选项。目前，AllTalk TTS 已推出版本 2 的 BETA 版本，相较于版本 1，带来了更多新特性和性能提升，是大多数用户的首选。

项目技术分析

AllTalk TTS 采用先进的技术架构，支持多种运行模式和扩展选项：

多平台支持：可在 Windows 和 Linux 系统上运行，提供简单易用的设置工具。
API 和第三方集成：通过 JSON 调用，轻松与其他应用程序集成。
模型微调：支持对特定语音进行微调，以获得更逼真的语音效果。
本地/自定义模型：支持使用 XTTSv2 模型，包括 API 本地和 XTTSv2 本地模式。
批量生成和编辑：可一次性生成长达数小时的语音文件。
DeepSpeed 加速：提供 2-3 倍的性能提升。
低 VRAM 模式：适合 GPU 内存较小的用户。
自定义启动设置：用户可根据需求调整默认启动设置。
旁白功能：支持为主角和旁白使用不同的语音。
可选的 WAV 文件管理：可配置删除旧的输出 WAV 文件。
完善的文档：提供内置网页文档，方便用户查阅。

项目及技术应用场景

AllTalk TTS 适用于多种应用场景，包括但不限于：

教育培训：用于制作有声教材和在线课程。
游戏开发：为游戏角色提供逼真的语音。
智能助手：集成到智能家居和语音助手设备中。
内容创作：用于生成视频解说和音频内容。
无障碍辅助：为视障用户提供语音阅读服务。

项目特点

易用性：提供快速设置脚本和详细的安装指南，用户可轻松上手。
高性能：通过 DeepSpeed 技术显著提升生成速度，满足高效需求。
灵活性：支持多种运行模式和自定义设置，适应不同用户需求。
社区支持：项目由热心开发者维护，提供社区讨论和问题解答。
开源免费：项目完全开源，用户可自由使用和修改。

截图展示

文本生成设置	设置工具	DeepSpeed	文本生成界面

设置和文档	微调1	微调2	SillyTavern

支持与捐赠

如果你觉得 AllTalk TTS 对你有帮助，可以通过 Ko-fi 页面进行捐赠，支持项目的持续开发和改进。

快速设置指南

Text-Generation-Webui 安装

下载 AllTalk 设置：
- 通过终端/控制台（推荐）：
```
cd \text-generation-webui\extensions\
git clone https://github.com/erew123/alltalk_tts
```
- 通过 Releases 页面：下载最新的 alltalk_tts.zip 并解压到 \text-generation-webui\extensions\alltalk_tts\。
启动 Python 环境：
- 在 text-generation-webui 文件夹中启动环境：
  - Windows: cmd_windows.bat
  - Linux: ./cmd_linux.sh
运行 AllTalk 设置脚本：
- 导航到 AllTalk 目录并执行设置脚本：
```
cd extensions
cd alltalk_tts
Windows: atsetup.bat
Linux: ./atsetup.sh
```
安装依赖：
- 按照屏幕提示安装必要的依赖。

独立安装

获取 AllTalk 设置：
- 通过终端/控制台（推荐）：
```
cd C:\myfiles\
git clone https://github.com/erew123/alltalk_tts
```
- 通过 Releases 页面：下载 alltalk_tts.zip 并解压到你的目录，例如 C:\myfiles\alltalk_tts\。
启动 AllTalk 设置：
- 打开终端/命令提示符，导航到 AllTalk 目录并运行设置脚本：
```
cd alltalk_tts
Windows: atsetup.bat
Linux: ./atsetup.sh
```
跟随设置提示：
- 选择独立安装并按照屏幕提示操作。

AllTalk TTS 是一个功能丰富且高效的文本转语音解决方案，无论是开发者还是普通用户，都能从中受益。立即尝试，体验其强大的语音生成能力吧！

alltalk_tts