vui 的项目扩展与二次开发

2025-06-10 22:17:32作者：仰钰奇

Real-time voice assistant — WebRTC streaming, faster-whisper ASR, local LLM, Vui Nano (300M) TTS. OpenAI Realtime API compatible. Voice cloning, barge-in, ~9× realtime on a 4090. Apache 2.0.

项目地址：https://gitcode.com/gh_mirrors/vui6/vui

项目的基础介绍

vui（Small Conversational speech models that can run on device）是一个基于设备的简易对话语音模型，它可以实现小型的会话功能。该项目由Harry Coultas Blum开发，采用MIT协议开源，可以在GitHub上获取源代码和文档。

项目的核心功能

vui的核心功能是提供能够在设备上运行的对话语音模型，它支持以下几种模型：

Vui.BASE：基于40,000小时音频对话训练的基础检查点。
Vui.ABRAHAM：单个说话人模型，具有上下文意识回复能力。
Vui.COHOST：包含两个说话人的检查点，能够相互对话。

此外，vui还支持语音克隆功能，允许用户使用基础模型进行一定程度的语音模仿。

项目使用了哪些框架或库？

vui项目主要使用Python语言开发，涉及以下框架或库：

Python：作为主要的编程语言。
Jupyter Notebook：用于开发过程中的数据处理和模型展示。

项目的代码目录及介绍

项目的代码目录如下：

vui/
├── src/
│   ├── vui/
│   ├── .gitignore
│   ├── demo.py
│   ├── inference.ipynb
│   ├── inference.py
│   ├── pyproject.toml
│   └── readme.md
└── LICENSE

src/：包含项目的核心代码。
demo.py：用于展示项目功能的示例代码。
inference.ipynb和inference.py：模型的推理和演示代码。
pyproject.toml：项目配置文件。
readme.md：项目说明文档。
LICENSE：项目使用的MIT协议许可证文件。

对项目进行扩展或者二次开发的方向

模型优化：可以基于现有的模型进一步训练，提高语音识别和生成的准确性。
功能增强：增加更多的对话模型，支持更多场景下的对话功能。
跨平台支持：优化代码，使其可以在更多的平台和操作系统上运行。
界面交互：开发图形用户界面（GUI），提供更加友好的用户交互体验。
集成API：开发RESTful API，使得其他应用程序可以轻松集成vui的功能。
性能优化：优化算法和数据处理流程，提高模型在设备上的运行效率。
多语言支持：扩展模型以支持多种语言，扩大用户群和应用场景。

通过这些扩展和二次开发的方向，vui项目将能够为更多的开发者提供价值，并在开源社区中发挥更大的作用。

vui

Real-time voice assistant — WebRTC streaming, faster-whisper ASR, local LLM, Vui Nano (300M) TTS. OpenAI Realtime API compatible. Voice cloning, barge-in, ~9× realtime on a 4090. Apache 2.0.

项目地址：https://gitcode.com/gh_mirrors/vui6/vui

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

395

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.68 K

989

vui 的项目扩展与二次开发

项目的基础介绍

项目的核心功能

项目使用了哪些框架或库？

项目的代码目录及介绍

对项目进行扩展或者二次开发的方向

热门内容推荐

最新内容推荐

项目优选

vui 的项目扩展与二次开发

项目的基础介绍

项目的核心功能

项目使用了哪些框架或库？

项目的代码目录及介绍

对项目进行扩展或者二次开发的方向

相关内容推荐

热门内容推荐

最新内容推荐

项目优选