aubio 项目技术文档

2024-12-23 05:56:23作者：廉彬冶Miranda

1. 安装指南

1.1 系统要求

aubio 可以在 Linux、Mac OS X、Windows、Cygwin 和 iOS 系统上编译和运行。

1.2 编译安装

要编译 aubio，您可以简单地运行以下命令：

make

1.3 编译 Python 模块

要编译 aubio 的 Python 模块，请运行以下命令：

./setup.py build

1.4 安装

请参考 aubio 手册获取更多关于安装 aubio 的信息。

2. 项目使用说明

2.1 功能概述

aubio 是一个用于标记音乐和声音的库。它监听音频信号并尝试检测事件，例如鼓声的敲击、音符的频率或节奏旋律的节奏。

2.2 主要功能

起始检测：检测音频中的起始点。
音高检测：识别音频中的基本频率或音高。
节奏跟踪和节拍检测：检测音频中的节奏和节拍。
MFCC：计算梅尔频率倒谱系数。
FFT 和相位声码器：进行快速傅里叶变换和相位声码处理。
上/下采样：进行音频信号的采样率转换。
数字滤波器：提供低通、高通等滤波器。
频谱滤波：对音频信号进行频谱滤波处理。
瞬态/稳态分离：分离音频信号中的瞬态和稳态部分。
音频文件读写：提供音频文件的读写功能。
音乐应用数学工具：提供各种音乐应用的数学工具。

2.3 命令行工具

aubio 提供了多个命令行工具，包括：

aubio：从音频文件中提取信息。
aubiocut：在起始点或节拍时间戳处切割音频文件。
aubioonset：输出检测到的音符起始时间戳。
aubiopitch：尝试识别输入音频的基频或音高。
aubiomfcc：计算梅尔频率倒谱系数。
aubiotrack：输出检测到的节拍时间戳。
aubionotes：发出类似 MIDI 的音符，包括起始、音高和持续时间。
aubioquiet：提取安静和响亮的区域。

3. 项目 API 使用文档

3.1 Python 模块

aubio 提供了一个 Python 模块，详细的使用方法请参考 python/README.md 和 aubio 手册。

3.2 API 示例

以下是一个简单的 Python 示例，展示如何使用 aubio 进行音高检测：

import aubio

# 创建音高检测器
pitch_detector = aubio.pitch("default", 1024, 512, 44100)

# 读取音频文件
samplerate = 44100
source = aubio.source("sample.wav", samplerate, 512)

# 检测音高
pitches = []
while True:
    samples, read = source()
    pitch = pitch_detector(samples)[0]
    pitches.append(pitch)
    if read < 512:
        break

print(pitches)

4. 项目安装方式

4.1 源码安装

从 GitHub 下载源码并编译安装：

git clone https://github.com/aubio/aubio.git
cd aubio
make
sudo make install

4.2 Python 模块安装

使用 pip 安装 aubio 的 Python 模块：

pip install aubio

4.3 Conda 安装

使用 Conda 安装 aubio：

conda install -c conda-forge aubio

通过以上步骤，您可以成功安装并使用 aubio 项目。

aubio

a library for audio and music analysis

项目地址：https://gitcode.com/gh_mirrors/au/aubio

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271