【亲测免费】 ClearerVoice-Studio安装与配置指南

2026-01-30 04:33:25作者：谭伦延

An AI-Powered Speech Processing Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Enhancement, Separation, and Target Speaker Extraction, etc.

项目地址：https://gitcode.com/gh_mirrors/cl/ClearerVoice-Studio

1. 项目基础介绍

ClearerVoice-Studio 是一个开源的、基于 AI 的语音处理工具包，旨在为研究人员、开发人员及终端用户提供语音增强、语音分离、语音超分辨率、目标说话人提取等功能。该工具包包含了先进的预训练模型，以及用于训练和推理的脚本。

主要编程语言

Python
Shell

2. 项目使用的关键技术和框架

语音处理: 包含语音增强、分离、超分辨率等技术。
深度学习框架: 使用 PyTorch 作为主要的深度学习框架。
预训练模型: 包含如 FRCRN（语音去噪）、MossFormer（语音分离）等先进的预训练模型。

3. 项目安装和配置的准备工作

在开始安装 ClearerVoice-Studio 之前，请确保您的系统已经安装了以下依赖项：

Python 3.6 或更高版本
pip（Python 包管理工具）
GCC 4.8 或更高版本
CMake 3.3.2 或更高版本
ffmpeg（用于音频编解码）

安装步骤

克隆项目仓库

打开命令行界面，执行以下命令以克隆项目仓库：

git clone https://github.com/modelscope/ClearerVoice-Studio.git
cd ClearerVoice-Studio

安装 Python 依赖

在项目根目录下，执行以下命令安装项目所需的 Python 依赖：
```
pip install -r requirements.txt
```
配置环境变量

根据您的操作系统，配置环境变量以确保命令行可以正确调用所需的依赖。

编译 ffmpeg（如果未安装）

如果您的系统中没有安装 ffmpeg，您需要从源代码编译安装。具体步骤如下：

cd ~
sudo apt update
sudo apt install -y libass-dev libfreetype6-dev libmp3lame-dev libtheora-dev libvorbis-dev libx11-dev xorg-dev
git clone https://git.ffmpeg.org/ffmpeg.git ffmpeg
cd ffmpeg
./configure --prefix=/usr/local
make
sudo make install

运行示例

在项目根目录下，运行以下命令以执行示例脚本：
```
python examples/speech_enhancement.py
```

以上步骤为您提供了 ClearerVoice-Studio 的基础安装和配置指南。您可以根据具体需求调整配置和运行其他脚本。

ClearerVoice-Studio