首页
/ LiveCaptions 项目下载及安装教程

LiveCaptions 项目下载及安装教程

2024-12-05 09:26:45作者:舒璇辛Bertina

1. 项目介绍

LiveCaptions 是一个为 Linux 桌面环境提供的实时字幕应用程序。它能够为桌面或麦克风音频提供实时字幕,且音频数据不会被发送到任何外部服务。该应用程序不依赖于任何专有服务或库,用户可以调整字体、字体大小和文本大小写,并支持基于 token 级别的置信度文本淡化功能。

2. 项目下载位置

要下载 LiveCaptions 项目,请使用以下命令进行递归克隆:

git clone --recursive https://github.com/abb128/LiveCaptions.git

如果忘记使用 --recursive 选项,可以通过以下命令初始化子模块:

git submodule update --init --recursive

3. 项目安装环境配置

3.1 系统要求

LiveCaptions 项目需要以下依赖项:

  • pulseaudio
  • libadwaita
  • meson
  • ninja

3.2 配置 ONNXRuntime

3.2.1 Linux 系统

首先,下载 ONNXRuntime v1.14.1 (Linux),并将其解压到某个目录。然后设置环境变量以指向 ONNXRuntime:

export ONNX_ROOT=/path/to/onnxruntime-linux-x64-1.14.1/
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/path/to/onnxruntime-linux-x64-1.14.1/lib

3.2.2 macOS 系统

下载 ONNXRuntime v1.14.1 (Mac OS x86),并将其解压到某个目录。然后设置环境变量并复制库文件:

export ONNX_ROOT=/path/to/onnxruntime-osx-x86_64-1.14.1/
cp /path/to/onnxruntime-osx-x86_64-1.14.1/lib/libonnxruntime.1.14.1.dylib /usr/local/lib/libonnxruntime.1.14.1.dylib
cp /path/to/onnxruntime-osx-x86_64-1.14.1/lib/libonnxruntime.dylib /usr/local/lib/libonnxruntime.dylib

3.3 配置 PulseAudio(仅限 macOS)

在 macOS 上,可能需要运行以下命令以确保 PulseAudio 作为后台服务运行:

brew services restart pulseaudio

要停止服务,请将 restart 替换为 stop

4. 项目安装方式

4.1 使用 GNOME Builder 安装(简单)

  1. 克隆项目后,打开 GNOME Builder。
  2. 在 GNOME Builder 中打开项目目录。
  3. 如果系统提示下载 SDK,请下载并安装。
  4. 点击“播放”按钮以构建并运行项目。

4.2 从终端安装(稍复杂)

  1. 设置构建环境:

    meson setup builddir
    meson devenv -C builddir
    
  2. 下载模型并设置环境变量:

    wget https://aprilasr.net/april-english-dev-01110_en.april
    export APRIL_MODEL_PATH=`pwd`/april-english-dev-01110_en.april
    
  3. 构建并运行应用程序:

    ninja -C builddir
    src/livecaptions
    

5. 项目处理脚本

LiveCaptions 项目的主要处理脚本位于 src/ 目录下。主要的可执行文件是 livecaptions,它负责实时字幕的生成和显示。

5.1 主要脚本

  • src/livecaptions: 主应用程序脚本,负责实时字幕的生成和显示。

5.2 配置文件

  • meson.build: 构建配置文件,定义了项目的构建规则和依赖项。

5.3 模型文件

  • april-english-dev-01110_en.april: 预训练的语音识别模型文件,用于实时字幕的生成。

通过以上步骤,您可以成功下载、配置并安装 LiveCaptions 项目,并开始使用其提供的实时字幕功能。

登录后查看全文
热门项目推荐

热门内容推荐

最新内容推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
261
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
861
511
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
596
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K