【亲测免费】 so-vits-svc开源项目安装与配置指南

2026-01-30 04:24:31作者：羿妍玫Ivan

1. 项目基础介绍

so-vits-svc是一个基于歌声合成和音色转换的开源项目。它使用先进的深度学习技术，可以将一个人的歌声转换成另一个人的音色。该项目主要使用Python编程语言开发。

2. 项目使用的关键技术和框架

项目使用的关键技术包括：

VITS（Voice Injury Transformer with Singer Adaptation）：一种基于变换器的文本到语音合成模型，它能够生成高质量的歌声。
SoftVC：一种内容编码器，用于提取和转换语音特征。
NSF HiFiGAN：一种声码器，用于生成高质量的音频波形。

此外，项目使用了以下框架和工具：

PyTorch：一个流行的深度学习框架，用于构建和训练模型。
NumPy：一个强大的Python库，用于进行数值计算。
Librosa：一个用于音频处理的Python库。

3. 安装和配置准备工作

在开始安装之前，请确保您的系统满足以下要求：

Python版本：3.7及以上
硬件：具备至少一张支持CUDA的GPU，以加速模型训练

详细安装步骤

步骤 1：克隆项目仓库

打开终端（或命令提示符），运行以下命令来克隆项目仓库：

git clone https://github.com/innnky/so-vits-svc.git
cd so-vits-svc

步骤 2：安装依赖

项目使用requirements.txt文件列出了所需的Python依赖。使用以下命令安装这些依赖：

pip install -r requirements.txt

步骤 3：下载预训练模型

项目提供了一个预训练的模型，可以从以下链接下载：

下载后，将这些文件放置到项目相应的目录下：

wget -P hubert/ https://github.com/bshall/hubert/releases/download/v0.1/hubert-soft-0d54a1f4.pt
wget -P logs/32k/ https://huggingface.co/innnky/sovits_pretrained/resolve/main/G_0.pth
wget -P logs/32k/ https://huggingface.co/innnky/sovits_pretrained/resolve/main/D_0.pth

步骤 4：准备数据集

将您的数据集按照以下结构放置在dataset_raw目录下：

dataset_raw/
├───speaker0/
│   ├───xxx1-xxx1.wav
│   ├───...
│   └───Lxx-0xx8.wav
└───speaker1/
    ├───xx2-0xxx2.wav
    ├───...
    └───xxx7-xxx007.wav

步骤 5：数据预处理

运行以下脚本进行数据预处理：

python resample.py
python preprocess_flist_config.py
python preprocess_hubert_f0.py

步骤 6：训练模型

使用以下命令开始训练模型：

python train.py -c configs/config.json -m 32k

步骤 7：推理和测试

训练完成后，使用inference_main.py进行推理和测试。

以上步骤为您提供了从安装到配置该项目的基础指南。祝您使用愉快！

so-vits-svc

基于vits与softvc的歌声音色转换模型

项目地址：https://gitcode.com/gh_mirrors/sovit/so-vits-svc

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

986

246