CosyVoice项目中的音色选择问题分析与解决方案

2026-02-04 04:59:47作者：宣利权Counsellor

问题背景

在FunAudioLLM开源项目CosyVoice的使用过程中，部分用户遇到了一个常见的技术问题：当尝试使用预训练音色功能时，系统会抛出"Value: is not in the list of choices: []"的错误提示。这个问题主要出现在CosyVoice2-0.5B模型的使用场景中，表现为音色选择下拉框为空，无法选择任何预训练音色。

问题根源分析

经过深入的技术分析，我们发现这个问题的根本原因在于：

模型设计差异：CosyVoice2-0.5B作为基础模型，在设计上并没有包含预训练音色功能，因此移除了spk2info.pt文件。
文件依赖关系：系统在运行时需要读取spk2info.pt文件来获取可用的音色列表，当该文件缺失时，就会导致音色选择列表为空。
版本变更影响：在项目的历史版本中，spk2info.pt文件曾经存在于CosyVoice-300M和CosyVoice-300M-25Hz模型中，但在后续的代码更新中被移除。

解决方案

针对这一问题，我们提供以下两种解决方案：

方案一：使用SFT模型中的音色文件

从CosyVoice-300M-SFT模型中获取spk2info.pt文件
将该文件复制到pretrained_models/CosyVoice2-0.5B目录下
重新启动应用即可看到音色选择列表

方案二：从历史版本恢复文件

通过git历史记录查找包含spk2info.pt文件的版本
从历史版本中恢复该文件
将恢复的文件放置到pretrained_models/CosyVoice2-0.5B目录

技术要点说明

spk2info.pt文件作用：该文件存储了预训练音色的相关信息，包括音色特征、名称等元数据，是音色选择功能正常运行的关键。
模型功能差异：基础模型(CosyVoice2-0.5B)专注于语音生成的核心能力，而SFT模型(CosyVoice-300M-SFT)则增加了对多音色的支持。
目录结构要求：文件必须放置在正确的模型目录下，系统才会正确识别并加载音色信息。