5分钟上手！Buzz离线音频转录全攻略

2026-02-04 05:03:16作者：幸俭卉

你还在为会议录音转文字烦恼？还在担心在线转录泄露隐私？Buzz让你告别这些困扰！作为一款基于OpenAI Whisper的本地音频处理工具，它能在你的电脑上离线完成音频转录与翻译，无需联网即可保护数据安全。本文将带你从安装到实操，全面掌握Buzz的实时音频转录功能，让会议记录、访谈整理效率提升10倍！

项目概览：Buzz是什么？

Buzz是一款开源的本地音频转录工具，通过OpenAI Whisper模型实现离线语音转文字。它支持文件导入、实时录音、多语言翻译等功能，界面简洁易用，无需专业技术背景也能快速上手。项目核心代码位于buzz/目录，其中转录模块集中在buzz/transcriber/，包含多种转录器实现。

安装指南：3步完成本地部署

1. 获取项目源码

通过GitCode仓库克隆项目：

git clone https://gitcode.com/gh_mirrors/buz/buzz

2. 安装依赖

项目使用Poetry管理依赖，执行以下命令安装：

cd buzz && poetry install

3. 启动应用

直接运行主程序：

poetry run python main.py

详细安装说明可参考官方文档：docs/installation.md

实时转录核心功能解析

实时录音转录工作流

Buzz的实时转录功能由recording_transcriber.py实现，核心流程包括：

音频设备采集声音
实时音频流处理
Whisper模型本地推理
转录文本实时显示

模型选择与配置

在偏好设置中可选择不同大小的Whisper模型，平衡转录速度与精度：

tiny：最快，适合低配置电脑
base：平衡速度与质量
large：最高精度，适合专业场景

模型配置界面位于buzz/widgets/preferences_dialog/models_preferences_widget.py，可通过菜单栏【设置】→【偏好设置】打开：

高级功能：从转录到翻译的全流程

转录文本编辑与导出

转录完成后，可在文本查看器中编辑内容，支持分段调整与时间戳同步。文本编辑器实现于transcription_viewer_widget.py，支持导出为TXT、SRT等多种格式。

多语言翻译功能

Buzz内置翻译模块translator.py，可将转录文本实时翻译成30+种语言。翻译功能无需额外配置，在转录结果界面点击【翻译】按钮即可使用。

技术原理：离线处理的实现机制

本地模型部署

Buzz通过model_loader.py管理Whisper模型，首次使用时会自动下载选定模型并缓存到本地，实现完全离线运行。模型缓存路径可在cache.py中配置。

音频处理流水线

音频处理核心代码位于whisper_audio.py，采用以下技术优化实时性：

音频分块增量处理
推理结果流式输出
本地GPU加速（如支持）

常见问题与解决方案

转录延迟过高？

尝试切换至更小模型
关闭其他占用CPU的程序
在设置中调整音频采样率

中文识别准确率低？

确保使用large模型
在转录设置中指定语言为"中文"
更新至最新版本Buzz

更多问题可参考FAQ文档

总结与展望

Buzz通过本地化部署Whisper模型，实现了安全高效的音频转录方案。无论是会议记录、访谈整理还是学习笔记，都能显著提升工作效率。项目持续迭代中，未来将支持更多音频格式与高级编辑功能。

立即下载体验：README.md
贡献代码或反馈问题：CONTRIBUTING.md

提示：定期同步项目更新可获得最新功能，执行git pull即可更新源码。

buzz

Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.

项目地址：https://gitcode.com/GitHub_Trending/buz/buzz

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

413

339

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

5分钟上手！Buzz离线音频转录全攻略

项目概览：Buzz是什么？

安装指南：3步完成本地部署

1. 获取项目源码

2. 安装依赖

3. 启动应用

实时转录核心功能解析

实时录音转录工作流

模型选择与配置

高级功能：从转录到翻译的全流程

转录文本编辑与导出

多语言翻译功能

技术原理：离线处理的实现机制

本地模型部署

音频处理流水线

常见问题与解决方案

转录延迟过高？

中文识别准确率低？

总结与展望

热门内容推荐

最新内容推荐

项目优选

5分钟上手！Buzz离线音频转录全攻略

项目概览：Buzz是什么？

安装指南：3步完成本地部署

1. 获取项目源码

2. 安装依赖

3. 启动应用

实时转录核心功能解析

实时录音转录工作流

模型选择与配置

高级功能：从转录到翻译的全流程

转录文本编辑与导出

多语言翻译功能

技术原理：离线处理的实现机制

本地模型部署

音频处理流水线

常见问题与解决方案

转录延迟过高？

中文识别准确率低？

总结与展望

相关内容推荐

热门内容推荐

最新内容推荐

项目优选