AllTalk TTS 项目中的 XTTSv2 模型加载问题分析与解决方案

2025-07-09 12:32:25作者：毕习沙Eudora

AllTalk is based on the Coqui TTS engine, similar to the Coqui_tts extension for Text generation webUI, however supports a variety of advanced features, such as a settings page, low VRAM support, DeepSpeed, narrator, model finetuning, custom models, wav file maintenance. It can also be used with 3rd Party software via JSON calls.

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

问题背景

在 AllTalk TTS 项目中，用户报告了一个关于 XTTSv2 模型加载失败的常见问题。该问题表现为在全新安装的 text-generation-webui 环境中，AllTalk TTS 扩展无法成功加载 XTTSv2 语音合成模型，导致服务启动失败。

错误现象

系统日志显示的关键错误信息是 JSON 解码失败，具体表现为尝试读取模型配置文件时遇到了空文件或无效格式。错误堆栈表明系统在加载 config.json 文件时遇到了问题，提示"Expecting value: line 1 column 1 (char 0)"，这通常意味着文件内容为空或格式不正确。

根本原因分析

经过深入调查，发现问题根源在于模型文件下载不完整。正常情况下，XTTSv2 模型应该包含多个关键文件，包括：

config.json
model.pth
vocab.json
其他相关模型文件

但在问题案例中，这些文件虽然存在于指定目录，但大小异常（仅3KB），且实际内容为HTML文档而非模型数据。这表明模型下载过程出现了异常，可能由于网络问题或服务器端故障导致下载被重定向或中断。

解决方案

对于遇到类似问题的用户，可以按照以下步骤解决：

手动验证模型文件完整性检查 text-generation-webui/extensions/alltalk_tts/models/xttsv2_2.0.2 目录下的文件确认文件大小正常（非3KB）且内容正确
手动下载模型文件从官方模型仓库获取完整的模型文件确保下载所有必需文件并放置到正确目录
验证文件权限确保运行环境有权限访问这些文件检查文件路径中是否包含特殊字符或空格