【免费下载】 Audio Slicer 安装和配置指南

2026-01-20 02:46:09作者：彭桢灵Jeremy

Python script that slices audio with silence detection

项目地址：https://gitcode.com/gh_mirrors/au/audio-slicer

1. 项目基础介绍和主要编程语言

项目介绍

Audio Slicer 是一个用于音频切片的开源项目，它能够通过检测音频中的静音部分来自动将音频文件分割成多个片段。该项目的主要目的是提供一个高效、易用的工具，帮助用户快速处理音频文件。

主要编程语言

该项目主要使用 Python 编程语言开发。

2. 项目使用的关键技术和框架

关键技术

音频处理：使用 RMS（均方根）技术来检测音频中的静音部分。
音频切片：根据检测到的静音部分将音频文件分割成多个片段。

框架

librosa：用于音频文件的读取和处理。
soundfile：用于音频文件的写入。

3. 项目安装和配置的准备工作和详细安装步骤

准备工作

在开始安装之前，请确保您的系统已经安装了以下软件：

Python 3.6 或更高版本
pip（Python 包管理工具）

详细安装步骤

步骤 1：克隆项目仓库

首先，您需要从 GitHub 上克隆 Audio Slicer 项目到本地。打开终端或命令提示符，运行以下命令：

git clone https://github.com/openvpi/audio-slicer.git

步骤 2：进入项目目录

克隆完成后，进入项目目录：

cd audio-slicer

步骤 3：安装依赖项

使用 pip 安装项目所需的依赖项。您可以通过以下命令安装所有依赖项：

pip install -r requirements.txt

如果您只需要安装部分依赖项，可以单独安装以下包：

pip install librosa
pip install soundfile

步骤 4：运行项目

安装完成后，您可以通过以下命令运行项目：

python slicer2.py

配置选项

在运行项目时，您可以通过命令行参数来配置音频切片的行为。以下是一些常用的配置选项：

--db_thresh：设置 RMS 阈值（以 dB 为单位），默认值为 -40。
--min_length：设置每个切片的最小长度（以毫秒为单位），默认值为 5000。
--min_interval：设置静音部分的最小长度（以毫秒为单位），默认值为 300。
--hop_size：设置每个 RMS 帧的长度（以毫秒为单位），默认值为 10。
--max_sil_kept：设置切片音频周围保留的最大静音长度（以毫秒为单位），默认值为 1000。

例如，如果您想将 RMS 阈值设置为 -30，可以运行以下命令：

python slicer2.py audio --db_thresh -30

通过以上步骤，您应该能够成功安装并配置 Audio Slicer 项目，并开始使用它来处理您的音频文件。

Python script that slices audio with silence detection

项目地址：https://gitcode.com/gh_mirrors/au/audio-slicer

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统