GPT-SoVITS项目中的WebUI服务调用问题与多卡训练解决方案

2025-05-01 02:55:44作者：傅爽业Veleda

GPT-SoVITS是一款革命性的语音转换与合成工具，支持零样本与少量样本的即时文本转语音，仅需5秒音频样本即可实现声音风格迁移。其特色包括跨语言支持、内置音轨分离等实用功能，让初学者也能轻松创建个性化语音模型。适用于英语、日语及中文，结合WebUI工具集，从数据预处理到模型训练全程助力。不论是AI新手还是专业人士，都能在此体验到语音技术的魅力。立即探索，开启你的声音魔法之旅！

项目地址：https://gitcode.com/GitHub_Trending/gp/GPT-SoVITS

问题背景

在使用GPT-SoVITS项目时，部分用户遇到了通过WebUI启动UVR5服务或训练微调模型时出现的报错问题。错误信息显示与pydantic和fastapi相关的核心模式生成失败，导致ASGI应用异常。同时，用户也关注如何在不使用WebUI的情况下开启GPT微调的多卡训练。

错误分析

从错误堆栈中可以清晰地看到，问题源于pydantic库在尝试为Starlette的Request类生成核心模式时失败。具体表现为：

系统尝试获取__pydantic_core_schema__属性失败
随后尝试通过schema生成器创建模式也失败
最终抛出PydanticSchemaGenerationError异常

这类问题通常出现在库版本不兼容的情况下，特别是当pydantic、fastapi和gradio等库的版本之间存在冲突时。

解决方案

经过项目贡献者的验证，可以通过以下步骤解决该问题：

完全卸载现有的pydantic、fastapi和pydantic-core库
将gradio升级到5.0之前的较新版本（推荐4.44.1）
让升级过程自动安装兼容的依赖库

这一解决方案已经得到多位用户的验证，确认可以有效解决WebUI服务调用失败的问题。

多卡训练配置

对于不使用WebUI直接进行多卡训练的情况，项目提供了以下配置方式：

SoVITS训练：
- 修改s2_train.py的配置文件tmp_s2.json
- 调整其中的gpu_numbers字段来指定使用的GPU数量
GPT微调训练：
- 目前s1_train.py的配置文件tmp_s1.yaml中未直接提供多卡配置选项
- 需要通过其他方式（如环境变量或命令行参数）来启用多卡支持

不使用WebUI的训练方法

对于希望直接运行训练脚本的用户，可以采用以下方式：

准备训练数据并配置好相应路径
根据需求修改训练配置文件
直接运行s1_train.py或s2_train.py脚本
通过命令行参数或环境变量控制训练参数

最佳实践建议

环境管理：
- 建议使用conda或venv创建隔离的Python环境
- 严格按照项目要求的版本安装依赖
版本控制：
- 记录所有库的版本信息以便复现
- 在升级前备份当前工作环境
训练监控：
- 即使不使用WebUI，也应设置适当的日志记录
- 监控GPU使用情况以确保多卡训练正常进行

通过以上方法，用户可以灵活选择适合自己需求的工作流程，无论是通过WebUI还是直接运行脚本，都能获得良好的训练体验。

GPT-SoVITS是一款革命性的语音转换与合成工具，支持零样本与少量样本的即时文本转语音，仅需5秒音频样本即可实现声音风格迁移。其特色包括跨语言支持、内置音轨分离等实用功能，让初学者也能轻松创建个性化语音模型。适用于英语、日语及中文，结合WebUI工具集，从数据预处理到模型训练全程助力。不论是AI新手还是专业人士，都能在此体验到语音技术的魅力。立即探索，开启你的声音魔法之旅！

项目地址：https://gitcode.com/GitHub_Trending/gp/GPT-SoVITS

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理