LocalVocal：让直播字幕更简单的本地化AI工具

2026-05-03 11:24:45作者：邬祺芯Juliet

LocalVocal是一款基于AI技术的OBS插件，提供本地化语音识别与实时字幕生成功能。无需联网即可处理音频，保护隐私安全；支持多语言互译，轻松打破语言障碍；完全开源免费，让每位创作者都能享受专业级字幕效果。

解决直播创作的三大痛点

数据隐私安全隐患

传统在线字幕工具需要上传音频至云端处理，存在内容泄露风险。LocalVocal采用本地计算模式，所有语音数据在设备内完成处理，确保商业机密和个人内容绝对安全。

多语言沟通障碍

国际直播时，单一语言字幕难以满足全球观众需求。LocalVocal内置多语言翻译引擎，支持中文、英文、日语等主流语言实时互译，让跨语言交流变得简单。

复杂设置与高昂成本

专业字幕软件往往价格昂贵且操作复杂。LocalVocal作为开源项目，零成本使用，界面简洁直观，新手也能快速上手。

四大核心功能，提升直播质量

实现实时语音转文字

集成Whisper AI模型，将直播音频实时转换为文字字幕。根据设备性能可选择不同模型：Tiny模型适合低配置设备的实时场景，Base模型平衡速度与精度，Small/Medium模型则提供更高识别准确率。

LocalVocal插件界面展示，包含模型选择、字幕参数调节和实时预览窗口

打造多语言翻译字幕

支持语音输入语言与字幕显示语言独立设置。例如主播说中文，观众可实时看到英文、日文等多语言字幕，极大扩展直播的国际影响力。

定制个性化字幕样式

提供丰富的字幕样式调整选项，包括字体、颜色、大小、背景透明度和屏幕位置。支持样式保存功能，一键切换不同场景的字幕风格。

优化音频处理流程

内置VAD(语音活动检测)技术，智能识别有效语音，减少背景噪音干扰。支持音频输入增益调节，确保最佳识别效果。

三步完成专业字幕设置

准备项目源码

git clone https://gitcode.com/gh_mirrors/ob/obs-localvocal

编译插件文件

进入项目目录，使用CMake配置并构建适合您系统的插件文件。支持Windows、macOS和Linux三大操作系统。

配置OBS插件

将编译好的插件文件复制到OBS的插件目录，重启OBS后即可在滤镜设置中找到LocalVocal插件。

五个实用场景案例

提升教育直播体验

为在线课程添加实时字幕，帮助听力障碍学生跟上课程进度，同时方便非母语学生理解专业内容。

增强游戏直播互动

游戏主播无需分心打字，自动生成的字幕让观众不会错过关键解说，提升直播互动率。

优化远程会议沟通

跨国团队会议中，实时翻译字幕打破语言障碍，让不同母语的成员都能顺畅交流。

改进产品演示效果

产品发布会直播时，专业字幕提升品牌形象，同时让观众更清晰地了解产品特性。

丰富线下活动传播

讲座、研讨会等活动添加实时字幕，不仅方便现场观众，录制后的视频也更易于传播和理解。

四个实用技巧提升使用体验

选择合适的模型

根据设备性能和直播需求选择模型：直播建议使用Tiny/Base模型保证实时性，录制视频可选用Medium模型获得更高准确率。

优化录音环境

使用外接麦克风并减少背景噪音，能显著提升识别准确率。安静环境下，识别错误率可降低40%以上。

调整字幕显示参数

根据直播场景调整字幕大小和位置：游戏直播建议小字体避免遮挡画面，教育内容则可增大字体提高可读性。

定期更新模型文件

项目会持续更新优化模型文件，定期更新可获得更好的识别效果和更多语言支持。

开始使用LocalVocal

无论您是经验丰富的直播主还是初次尝试的新手，LocalVocal都能帮助您轻松实现专业级实时字幕。立即下载项目源码，按照文档指引完成安装，开启无障碍的直播创作之旅。更多详细教程和技术支持，请参考项目内的docs目录文档。

obs-localvocal

OBS plugin for local speech recognition and captioning using AI

项目地址：https://gitcode.com/gh_mirrors/ob/obs-localvocal

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

517

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

285