CosyVoice项目在WSL2环境下的AMD显卡部署与问题分析

2025-05-17 10:07:55作者：尤辰城Agatha

背景介绍

CosyVoice是一个基于FunAudioLLM的开源语音合成项目，它利用深度学习技术实现高质量的语音生成。近期有用户在Windows Subsystem for Linux 2(WSL2)环境下使用AMD显卡成功部署了该项目，虽然能够正常进行推理，但在日志中观察到了若干警告信息。

用户使用的具体环境配置如下：

从日志中可以观察到几个值得注意的警告信息：

PyTorch与ROCm兼容性警告：日志显示PyTorch版本为2.3.1+rocm6.0，这表明系统正确识别了AMD的ROCm计算平台。但出现了"Torch was not compiled with memory efficient attention"的警告，这可能会影响模型的注意力机制计算效率。
权重归一化(Weight Norm)弃用警告：系统提示"torch.nn.utils.weight_norm is deprecated"，建议改用torch.nn.utils.parametrizations.weight_norm。这是一个框架更新带来的兼容性提示，不影响当前功能。
音频处理相关警告：

ONNX运行时警告：系统尝试使用CUDAExecutionProvider失败，回退到CPUExecutionProvider。这在AMD显卡环境下是预期行为，因为ONNX运行时对AMD显卡的支持有限。
Gradio界面相关警告：关于scale值应为整数的多个警告，这只会影响Web界面的布局显示。

虽然日志中出现了多个警告信息，但根据技术分析：

对于使用AMD显卡的用户，可以考虑以下优化措施：

在WSL2环境下使用AMD显卡部署CosyVoice项目是完全可行的，日志中出现的警告信息大多属于框架更新提示或特定硬件限制下的预期行为，不会影响核心的语音合成功能和质量。用户可以放心使用当前配置进行推理任务，同时保持对项目更新的关注以获得更好的性能和功能支持。

登录后查看全文