首页
/ video-subtitle-master 项目使用教程

video-subtitle-master 项目使用教程

2026-02-06 04:22:19作者:劳婵绚Shirley

video-subtitle-master 是一个功能强大的桌面应用程序,专门用于批量生成视频字幕并将其翻译成其他语言。该项目基于开源项目 VideoSubtitleGenerator 开发,提供了图形用户界面,操作更加便捷。

项目介绍

video-subtitle-master 是一个跨平台的视频字幕处理工具,支持 Windows 和 macOS 系统。它集成了 whisper.cpp 语音识别技术,能够快速准确地将视频中的语音转换为字幕,并支持多种翻译服务进行字幕翻译。

主要特性

  • 图形用户界面:直观易用的操作界面
  • 批量处理:支持批量处理视频、音频和字幕文件
  • 多语言支持:生成源语言字幕并翻译成目标语言
  • 多种翻译服务:支持火山引擎、百度翻译、DeepLX、Ollama 本地模型等
  • 集成 whisper.cpp:对 Apple Silicon 芯片进行优化,处理速度快
  • 内置 ffmpeg:无需单独安装 ffmpeg
  • 模型管理:支持手动下载和导入模型文件

安装方法

普通用户安装

  1. 前往项目发布页面下载对应操作系统的安装包
  2. 双击安装包进行安装
  3. 启动应用程序

开发者安装

  1. 克隆项目到本地
git clone https://gitcode.com/gh_mirrors/vi/video-subtitle-master
  1. 安装依赖
cd video-subtitle-master
yarn install
  1. 启动开发环境
yarn start

使用教程

1. 配置翻译服务

在使用翻译功能前,需要先配置相应的翻译服务:

  • 百度翻译:需要申请 API Key 和 Secret Key
  • 火山引擎翻译:需要申请相应的 API 密钥
  • DeepLX:免费使用,但批量翻译可能被限流
  • Ollama:本地模型翻译,需要安装 Ollama
  • OpenAI 风格 API:支持 DeepSeek 等服务

2. 处理视频文件

  1. 打开应用程序,进入主界面

  2. 点击"添加文件"按钮选择要处理的视频文件

  3. 在右侧配置面板中设置参数:

    • 源语言:选择视频中使用的语言
    • 目标语言:选择要翻译成的语言
    • 模型:选择使用的语音识别模型
    • 翻译服务:选择要使用的翻译服务
  4. 点击"开始处理"按钮启动任务

3. 模型管理

如果通过软件下载模型困难,可以手动下载并导入:

  1. 访问模型下载地址:

    • 国内镜像源:https://hf-mirror.com/ggerganov/whisper.cpp/tree/main
    • 官方源:https://huggingface.co/ggerganov/whisper.cpp/tree/main
  2. 下载所需的模型文件

  3. 在应用程序的"模型管理"页面中点击"导入模型"

  4. 选择下载的模型文件进行导入

项目结构

video-subtitle-master 采用 Electron + Next.js 架构开发,主要目录结构如下:

video-subtitle-master/
├── main/           # Electron 主进程代码
├── renderer/       # 渲染进程代码(Next.js)
├── extraResources/ # 额外资源文件
├── public/         # 静态资源文件
└── package.json    # 项目配置

核心模块

  • main/background.ts:Electron 主进程入口文件
  • main/helpers/:主进程辅助工具
  • renderer/components/:React 组件
  • renderer/pages/:Next.js 页面

常见问题

应用程序无法打开(macOS)

如果在 macOS 上提示应用程序已损坏,可以在终端中执行:

sudo xattr -dr com.apple.quarantine /Applications/Video\ Subtitle\ Master.app

模型下载失败

建议使用手动下载方式获取模型文件,然后通过导入功能添加到应用中。

翻译服务配置

各类翻译服务需要相应的 API 密钥,请按照服务提供商的指引申请和配置。

技术特点

  • 使用 TypeScript 开发,类型安全
  • 采用 React + Next.js 构建用户界面
  • 集成 whisper.cpp 进行语音识别
  • 支持多线程并发处理任务
  • 提供完整的国际化支持

开发指南

如需参与项目开发,请先熟悉项目结构,然后按照以下步骤:

  1. 克隆项目并安装依赖
  2. 启动开发服务器
  3. 修改代码并测试
  4. 提交 Pull Request

项目采用 MIT 许可证,欢迎贡献代码和改进建议。

登录后查看全文
热门项目推荐
相关项目推荐