10分钟上手跨平台变声神器：RVC全系统部署指南

2026-02-04 04:54:59作者：房伟宁

还在为找不到简单易用的变声工具烦恼？是否尝试过多种软件却卡在复杂的环境配置？本文将带你3步完成Retrieval-based-Voice-Conversion-WebUI（简称RVC）在Windows、Linux和MacOS系统的部署，让你轻松实现高质量语音转换。读完本文你将获得：

全平台环境搭建的详细步骤
常见错误的解决方案
两种启动模式的使用方法
官方资源的快速访问路径

项目简介

Retrieval-based-Voice-Conversion-WebUI是一款基于VITS的语音转换框架，具有以下特点：

即使在性能一般的显卡上也能快速训练模型
仅需10分钟低底噪语音数据即可训练出良好效果
提供直观易用的网页界面
支持人声与伴奏分离
支持A卡和I卡加速

官方文档：docs/cn/faq.md 项目许可证：LICENSE

环境配置

Windows系统

Windows用户可以通过以下两种方式安装依赖：

方法1：通过pip安装

# 安装Pytorch
pip install torch torchvision torchaudio

# 如果是Nvidia Ampere架构(RTX30xx)，需要指定cuda版本
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

# 根据显卡类型安装对应依赖
# N卡
pip install -r requirements.txt

# A卡/I卡
pip install -r requirements-dml.txt

方法2：使用整合包

下载并解压RVC-beta.7z
双击go-web.bat启动WebUI
双击go-realtime-gui.bat启动实时变声界面

Linux系统

通用方法

# 安装Pytorch
pip install torch torchvision torchaudio

# N卡
pip install -r requirements.txt

# A卡ROCM
pip install -r requirements-amd.txt

# I卡IPEX
pip install -r requirements-ipex.txt
source /opt/intel/oneapi/setvars.sh

AMD显卡额外配置

# Arch Linux安装驱动
pacman -S rocm-hip-sdk rocm-opencl-sdk

# 某些显卡可能需要的环境变量
export ROCM_PATH=/opt/rocm
export HSA_OVERRIDE_GFX_VERSION=10.3.0

# 将用户添加到相应组
sudo usermod -aG render $USERNAME
sudo usermod -aG video $USERNAME

MacOS系统

MacOS用户可以通过run.sh脚本快速安装依赖：

sh ./run.sh

预模型准备

RVC需要一些预模型才能进行推理和训练，你可以通过以下方式获取：

下载必要资产

使用工具文件夹中的脚本下载所需模型：

# 下载脚本位置
tools/download_models.py

需要下载的资产包括：

./assets/hubert/hubert_base.pt
./assets/pretrained
./assets/uvr5_weights

如果想使用v2版本模型，还需要下载：

./assets/pretrained_v2

安装ffmpeg

Ubuntu/Debian

sudo apt install ffmpeg

MacOS

brew install ffmpeg

Windows

下载ffmpeg.exe和ffprobe.exe并放置在根目录。

下载RMVPE模型

RMVPE是人声音高提取算法，需要下载对应的模型文件：

rmvpe.pt

A卡/I卡用户还需要下载：

rmvpe.onnx

启动应用

WebUI模式

这是最常用的模式，提供完整的训练和推理功能：

# 通用启动命令
python infer-web.py

# 使用Poetry
poetry run python infer-web.py

实时变声模式

该模式提供低延迟的实时语音转换：

# Windows直接双击
go-realtime-gui.bat

# 其他系统
python gui_v1.py

界面介绍

RVC提供了两种主要界面，分别适用于不同场景：

训练推理界面

通过go-web.bat启动，主要功能包括模型训练、语音转换等。

实时变声界面

通过go-realtime-gui.bat启动，实现低延迟的实时语音转换。目前已实现端到端170ms延迟，使用ASIO输入输出设备可达到90ms延迟。

常见问题解决

音频路径问题

ffmpeg读取路径带空格、()等特殊符号时可能出现错误，请确保音频文件路径不包含特殊字符。

显存不足

训练时可以缩小batch size，推理时可以调整config.py结尾的x_pad，x_query，x_center，x_max参数。

模型分享

用于分享的模型是weights文件夹下大小为60+MB的pth文件，而非logs文件夹下的大文件。

更多常见问题解答：docs/cn/faq.md

总结

Retrieval-based-Voice-Conversion-WebUI提供了跨平台的语音转换解决方案，无论你使用Windows、Linux还是MacOS系统，都能找到适合的部署方式。通过简单的配置，你就可以开始训练自己的语音模型或进行实时语音转换。

如果你在使用过程中遇到问题，可以查阅官方文档或加入社区寻求帮助。祝你的语音转换之旅愉快！

参考资源

Retrieval-based-Voice-Conversion-WebUI

Easily train a good VC model with voice data <= 10 mins!

项目地址：https://gitcode.com/GitHub_Trending/re/Retrieval-based-Voice-Conversion-WebUI

登录后查看全文

10分钟上手跨平台变声神器：RVC全系统部署指南

项目简介

环境配置

Windows系统

方法1：通过pip安装

方法2：使用整合包

Linux系统

通用方法

AMD显卡额外配置

MacOS系统

预模型准备

下载必要资产

安装ffmpeg

Ubuntu/Debian

MacOS

Windows

下载RMVPE模型

启动应用

WebUI模式

实时变声模式

界面介绍

训练推理界面

实时变声界面

常见问题解决

音频路径问题

显存不足

模型分享

总结

参考资源

热门内容推荐

最新内容推荐

项目优选

10分钟上手跨平台变声神器：RVC全系统部署指南

项目简介

环境配置

Windows系统

方法1：通过pip安装

方法2：使用整合包

Linux系统

通用方法

AMD显卡额外配置

MacOS系统

预模型准备

下载必要资产

安装ffmpeg

Ubuntu/Debian

MacOS

Windows

下载RMVPE模型

启动应用

WebUI模式

实时变声模式

界面介绍

训练推理界面

实时变声界面

常见问题解决

音频路径问题

显存不足

模型分享

总结

参考资源

相关内容推荐

热门内容推荐

最新内容推荐

项目优选