5分钟上手Demucs：一键消除人声，自制Karaoke伴奏从此不求人

2026-02-05 04:36:03作者：俞予舒Fleming

你是否曾想翻唱喜欢的歌曲，却苦于找不到纯净伴奏？尝试过各种在线工具，不是音质差就是收费高？现在，有了开源项目Demucs，只需一条命令就能将人声与伴奏完美分离，让你的翻唱作品媲美专业水准。本文将带你从零开始，掌握Demucs的Karaoke模式，轻松制作高品质伴奏。

Demucs简介：AI助力音乐分离

Demucs是一款基于深度学习的音乐源分离工具，能够将音频中的人声、鼓点、贝斯等元素精准分离。它采用Hybrid Transformer架构，结合了波形域和频谱域的优势，在MUSDB HQ测试集上实现了9.00 dB的SDR（信号失真比），远超传统方法。

Demucs的核心优势在于：

支持多种模型选择，从快速分离到高精度模式一应俱全
提供Karaoke专用模式，一键分离人声与伴奏
兼容Windows、macOS和Linux系统
完全免费开源，无需担心版权问题

快速开始：安装Demucs

系统要求

Python 3.8或更高版本
至少4GB内存（GPU加速需8GB以上显存）
支持Windows、macOS和Linux系统

安装步骤

对于普通用户，只需通过pip命令即可快速安装：

python3 -m pip install -U demucs

如果你需要最新开发版本，可以直接从Git仓库安装：

python3 -m pip install -U git+https://gitcode.com/gh_mirrors/de/demucs#egg=demucs

不同操作系统的详细安装指南：

Karaoke模式实战：3步制作伴奏

基础命令

Demucs的Karaoke模式通过--two-stems=vocals参数实现，只需一行命令即可分离人声和伴奏：

demucs --two-stems=vocals "你的音乐文件.mp3"

分离后的文件会保存在separated/模型名称/音乐文件名目录下，包含两个文件：

vocals.wav：人声部分
no_vocals.wav：伴奏部分

高级参数设置

选择模型

Demucs提供多种预训练模型，可通过-n参数指定：

# 使用高精度模型（推荐）
demucs -n htdemucs_ft --two-stems=vocals "音乐文件.mp3"

# 使用快速模型（适合低配电脑）
demucs -n mdx_q --two-stems=vocals "音乐文件.mp3"

常用模型对比：

模型名称	特点	适用场景
htdemucs_ft	最高精度，分离效果最佳	制作高质量伴奏
htdemucs	平衡精度和速度	日常使用
mdx_q	量化模型，体积小速度快	低配电脑或批量处理
mdx_extra_q	支持更多音乐风格	复杂音乐分离

输出MP3格式

默认输出为WAV格式，如需MP3格式，添加--mp3参数：

demucs --two-stems=vocals --mp3 --mp3-bitrate 320 "音乐文件.mp3"

处理大文件

处理长音频时，可使用--segment参数拆分处理，解决内存不足问题：

demucs --two-stems=vocals --segment 10 "长音频文件.mp3"

常见问题与解决方案

分离效果不佳怎么办？

尝试更高精度模型：

demucs -n htdemucs_ft --two-stems=vocals "音乐文件.mp3"

调整分离参数：

demucs --two-stems=vocals --shifts 5 "音乐文件.mp3"

检查音频质量：确保输入音频为320kbps以上的高质量文件

内存不足错误

如果遇到GPU内存不足错误，可尝试：

使用CPU处理：

demucs --two-stems=vocals -d cpu "音乐文件.mp3"

减小分段大小：

demucs --two-stems=vocals --segment 5 "音乐文件.mp3"

速度太慢

使用快速模型：

demucs -n mdx_q --two-stems=vocals "音乐文件.mp3"

启用多线程：

demucs --two-stems=vocals -j 4 "音乐文件.mp3"

高级应用：批量处理与API调用

批量处理多个文件

# 处理文件夹中所有MP3文件
demucs --two-stems=vocals /path/to/music/folder/*.mp3

# 处理不同格式的音频文件
demucs --two-stems=vocals /path/to/music/folder/*.{mp3,wav,flac}

Python API调用

对于开发者，可通过Python API集成Demucs功能：

import demucs.separate

# 分离人声和伴奏
demucs.separate.main([
    "--two-stems", "vocals",
    "-n", "htdemucs_ft",
    "--mp3",
    "input.mp3"
])

更多API用法请参考官方API文档。

总结与进阶

通过Demucs的Karaoke模式，我们只需简单几步就能将普通歌曲转换为专业伴奏。无论是翻唱、音乐制作还是舞蹈练习，都能轻松满足需求。

想要进一步提升？可以：

探索高级训练教程，训练专属模型
尝试GUI界面工具，简化操作流程
参与社区讨论，分享你的使用经验

现在，就用Demucs制作你的第一首伴奏，开启音乐创作之旅吧！

demucs

Code for the paper Hybrid Spectrogram and Waveform Source Separation

项目地址：https://gitcode.com/gh_mirrors/de/demucs

登录后查看全文