AllTalk TTS项目中的Faiss错误分析与解决方案

2025-07-09 05:33:57作者：齐冠琰

AllTalk is based on the Coqui TTS engine, similar to the Coqui_tts extension for Text generation webUI, however supports a variety of advanced features, such as a settings page, low VRAM support, DeepSpeed, narrator, model finetuning, custom models, wav file maintenance. It can also be used with 3rd Party software via JSON calls.

项目地址：https://gitcode.com/gh_mirrors/al/alltalk_tts

问题背景

在使用AllTalk TTS与SillyTavern集成时，用户遇到了一个与Faiss库相关的运行时错误。该错误发生在音频生成的批处理过程中，具体表现为第一批量处理正常完成，但在第二批量处理时出现错误并中断音频生成。

错误现象

系统日志显示以下关键错误信息：

Error Runtime error in TTS generation: Error in void __cdecl faiss::Clustering::train_encoded(__int64,const unsigned char *,const struct faiss::Index *,struct faiss::Index &,const float *) at C:\Users\runneradmin\miniconda3\envs\test\conda-bld\faiss-pkg_1728491259681\work\faiss\Clustering.cpp:295: Error: 'nx >= k' failed: Number of training points (0) should be at least as large as number of clusters (1)

随后还出现了另一个相关错误：

Error loading embedding model: module 'torch.serialization' has no attribute 'add_safe_globals'

技术分析

Faiss库的作用

Faiss是Facebook AI Research开发的一个高效的相似性搜索和密集向量聚类库。在AllTalk TTS项目中，它被用于音频特征向量的处理和相似性搜索。

错误原因

Faiss聚类错误：错误信息表明在进行向量聚类时，训练点数(nx)小于聚类数(k)，违反了Faiss库的基本要求。这通常发生在：
- 输入数据为空或无效
- 批处理过程中数据流中断
- 特征提取环节出现问题
PyTorch序列化错误：第二个错误表明项目中使用的PyTorch版本与某些依赖组件不兼容，add_safe_globals属性在较新版本的PyTorch中已被移除或修改。

环境因素

从诊断日志可以看出：

操作系统：Windows 11
Python版本：3.11.11
PyTorch版本：2.2.1
CUDA版本：12.1
Faiss版本：1.9.0

解决方案

针对Faiss错误的解决

更新AllTalk TTS代码：执行start_environment.bat和git pull命令获取最新代码，特别是RVC Hubert加载器的更新。
检查输入数据：
- 确保音频输入数据完整有效
- 验证批处理过程中数据流连续性
- 检查特征提取环节是否正常
环境配置检查：
- 确认Faiss库正确安装
- 检查Python环境是否干净，避免版本冲突