5个步骤掌握百聆：从0到1的开源语音助手本地部署指南

2026-03-09 05:32:35作者：裘旻烁

百聆是一个类似GPT-4o的语音对话机器人，通过ASR+LLM+TTS实现，集成DeepSeek R1等优秀大模型，接入openClaw，真正的个人语音助手，时延低至800ms，Mac等低配置也可运行，支持打断

项目地址：https://gitcode.com/gh_mirrors/ba/bailing

想拥有一个无需高端设备就能流畅运行的语音助手吗？百聆作为一款开源语音对话机器人，通过ASR+LLM+TTS技术实现，端到端时延低至800ms，即使在Mac等低配置设备上也能本地部署，让你轻松体验自然流畅的智能语音交互。本文将带你通过5个简单步骤，从环境准备到实际对话，快速上手这款强大的语音助手。

如何理解百聆的工作原理？

百聆就像一个"语音翻译官+智能大脑+语音播报员"的组合体。当你说话时，它首先通过VAD（语音活动检测）判断你何时开始说话，就像秘书判断你是否开始发言；然后ASR（语音转文本）将你的语音转换成文字，如同翻译将口语转为书面语；接着LLM（大语言模型）理解并生成回应，相当于大脑思考如何回答；最后TTS（文本转语音）将文字变回自然语音，就像播报员读出答案。

这个流程中，"Robot"模块扮演着指挥中心的角色，协调各个组件高效工作，确保从你说话到听到回应的整个过程在800ms内完成，比大多数同类产品快30%以上。

如何在普通电脑上部署百聆？

准备工作

确保你的电脑已安装Python 3.12或更高版本和pip包管理器。如果没有，可以通过官网下载安装。

执行命令

# 1. 获取项目代码
git clone https://gitcode.com/gh_mirrors/ba/bailing
cd bailing

# 2. 安装核心依赖
pip install -r requirements.txt

# 3. 安装第三方组件依赖
pip install -r third_party/OpenManus/requirements.txt

# 4. 生成开发环境证书
openssl req -x509 -newkey rsa:4096 -keyout key.pem -out cert.pem -days 365 -nodes

# 5. 启动服务器
python server.py

验证方法

打开浏览器访问http://localhost:8000，如果看到百聆的Web界面，说明部署成功。

如何开始第一次语音对话？

成功启动后，你会看到百聆的Web界面，它简洁直观，主要包含状态显示区、控制按钮和对话记录区。

使用步骤：

点击"开始对话"按钮：启动语音监听
对着麦克风说话：百聆会自动识别你的语音，无需按键
等待回应：百聆会快速处理并播放回应
需要打断时：直接说话即可中断百聆的回应

适用场景：日常闲聊、信息查询、设置提醒等。相比传统语音助手，百聆的响应速度更快，对话更自然，还支持随时打断，就像和真人聊天一样。

如何解决百聆的核心功能使用问题？

如何使用天气查询功能？

适用场景：出门前了解天气情况操作示例："今天上海天气怎么样？" 效果对比：无需打开天气App，语音直接获取结果，比手动查询快5倍

如何设置日程提醒？

适用场景：需要记住重要事项时操作示例："明天上午10点提醒我参加会议" 效果对比：语音设置比手动输入快3倍，且支持自然语言理解

如何进行雅思口语练习？

适用场景：备考雅思口语时操作示例："帮我练习雅思口语Part 2" 效果对比：随时可用的练习伙伴，比等待真人练习更灵活

这些功能都由plugins/functions/目录下的插件实现，你可以根据需要扩展更多功能。

常见问题速查

Q: 为什么启动服务器后无法访问网页？ A: 请检查Python版本是否符合要求（3.12+），端口是否被占用，以及证书文件是否生成成功。

Q: 语音识别不准确怎么办？ A: 可以尝试在安静环境下使用，或在config/config.yaml中调整ASR相关参数，也可以尝试更换其他ASR模型。

Q: 如何更换对话模型？ A: 打开config/config.yaml文件，修改LLM相关配置，支持DeepSeek、OpenAI、Qwen等多种模型。

Q: 低配置电脑运行卡顿怎么办？ A: 可以在配置文件中降低模型参数或使用更小的模型，百聆针对低配置设备做了专门优化。

Q: 如何添加自定义功能？ A: 参考plugins/functions/目录下的现有插件格式，创建新的Python文件实现功能，然后在function_calls_config.json中注册。

进阶探索路径图

插件开发指南：plugins/functions/
配置优化文档：config/config.yaml
模型替换教程：models/README.md

通过以上步骤，你已经掌握了百聆的基本使用方法。随着使用深入，你可以探索更多高级功能和自定义选项，让这个开源语音助手更好地满足你的需求。

百聆是一个类似GPT-4o的语音对话机器人，通过ASR+LLM+TTS实现，集成DeepSeek R1等优秀大模型，接入openClaw，真正的个人语音助手，时延低至800ms，Mac等低配置也可运行，支持打断

项目地址：https://gitcode.com/gh_mirrors/ba/bailing

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%如何高效获取教育资源？这款工具让教材下载效率提升80%5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%7天精通流放之路智能规划：新手必备的角色构筑神器指南零基础完美黑苹果安装教程：非苹果硬件运行macOS从入门到精通解构Tianshou：PyTorch强化学习框架的实战图谱重构你的阅读体验：ReadCat打造无干扰沉浸式小说阅读环境如何一键安装HS2-HF Patch：终极Honey Select 2优化与汉化完整指南 DS3控制器重生：DsHidMini驱动解决方案与跨平台游戏适配指南【数字记忆保鲜术】如何安全备份你的社交平台珍贵内容？完整指南

项目优选

收起

Ascend Extension for PyTorch

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

昇腾LLM分布式训练框架