GPT-SoVITS预训练模型大全：下载/配置/更新全攻略

2026-02-05 04:54:31作者：舒璇辛Bertina

GPT-SoVITS是一款革命性的语音转换与合成工具，支持零样本与少量样本的即时文本转语音，仅需5秒音频样本即可实现声音风格迁移。其特色包括跨语言支持、内置音轨分离等实用功能，让初学者也能轻松创建个性化语音模型。适用于英语、日语及中文，结合WebUI工具集，从数据预处理到模型训练全程助力。不论是AI新手还是专业人士，都能在此体验到语音技术的魅力。立即探索，开启你的声音魔法之旅！

项目地址：https://gitcode.com/GitHub_Trending/gp/GPT-SoVITS

一、模型体系概览

GPT-SoVITS提供多版本预训练模型支持，覆盖从基础到专业级应用需求。通过GPT_SoVITS/configs/tts_infer.yaml配置文件可查看完整模型矩阵，主要版本特性如下：

模型版本	适用场景	核心文件
v1	轻量级部署	s2G488k.pth
v2	标准语音合成	gsv-v2final-pretrained/
v2Pro	情感语音优化	v2Pro/s2Gv2Pro.pth
v4	最新架构	gsv-v4-pretrained/s2Gv4.pth

二、模型下载指南

2.1 自动下载流程

通过WebUI触发模型下载：

启动WebUI：python webui.py
系统自动检测缺失模型并调用GPT_SoVITS/download.py执行下载
下载进度可在终端查看，默认存储路径：GPT_SoVITS/pretrained_models/

2.2 手动部署方法

当自动下载失败时，可手动放置模型文件：

# 创建模型目录
mkdir -p GPT_SoVITS/pretrained_models/gsv-v4-pretrained
# 放置文件（示例）
cp /path/to/s2Gv4.pth GPT_SoVITS/pretrained_models/gsv-v4-pretrained/

三、配置文件详解

3.1 核心配置项

GPT_SoVITS/configs/tts_infer.yaml关键参数说明：

v4:
  bert_base_path: GPT_SoVITS/pretrained_models/chinese-roberta-wwm-ext-large  # BERT预训练模型
  cnhuhbert_base_path: GPT_SoVITS/pretrained_models/chinese-hubert-base        # 语音编码器
  t2s_weights_path: GPT_SoVITS/pretrained_models/s1v3.ckpt                     # 文本转语音模型
  vits_weights_path: GPT_SoVITS/pretrained_models/gsv-v4-pretrained/s2Gv4.pth  # VITS解码器
  device: cpu                                                                   # 运行设备(cpu/cuda)
  is_half: false                                                                # 半精度模式

3.2 多版本切换

修改配置文件切换模型版本：

编辑tts_infer.yaml
修改custom.version字段为目标版本（如v4）
重启WebUI使配置生效

四、模型更新维护

4.1 版本检查

通过配置文件头部注释查看模型更新日志：

# 模型版本历史
# v4: 2024-08-15 新增情感迁移功能
# v2ProPlus: 2024-06-30 优化中文韵律

4.2 增量更新

当发布模型补丁时，只需更新对应权重文件：

# 示例：更新v4版本解码器
wget -O GPT_SoVITS/pretrained_models/gsv-v4-pretrained/s2Gv4.pth [补丁URL]

五、常见问题解决

5.1 路径错误

若出现FileNotFoundError，检查：

tts_infer.yaml中路径是否与实际文件匹配
模型文件权限是否正确（建议权限755）

5.2 版本兼容性

确保推理代码与模型版本匹配：

v3/v4模型需使用export_torch_script_v3v4.py导出
旧版本请使用v1专用导出脚本

GPT-SoVITS

项目地址：https://gitcode.com/GitHub_Trending/gp/GPT-SoVITS

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Dora SSR 是一款跨平台的游戏引擎，提供前沿或是具有探索性的游戏开发功能。它内置了Web IDE，提供了可以轻轻松松通过浏览器访问的快捷游戏开发环境，特别适合于在新兴市场如国产游戏掌机和其它移动电子设备上直接进行游戏开发和编程学习。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.36 K

772

GPT-SoVITS预训练模型大全：下载/配置/更新全攻略

一、模型体系概览

二、模型下载指南

2.1 自动下载流程

2.2 手动部署方法

三、配置文件详解

3.1 核心配置项

3.2 多版本切换

四、模型更新维护

4.1 版本检查

4.2 增量更新

五、常见问题解决

5.1 路径错误

5.2 版本兼容性

热门内容推荐

最新内容推荐

项目优选

GPT-SoVITS预训练模型大全：下载/配置/更新全攻略

一、模型体系概览

二、模型下载指南

2.1 自动下载流程

2.2 手动部署方法

三、配置文件详解

3.1 核心配置项

3.2 多版本切换

四、模型更新维护

4.1 版本检查

4.2 增量更新

五、常见问题解决

5.1 路径错误

5.2 版本兼容性

相关内容推荐

热门内容推荐

最新内容推荐

项目优选