【亲测免费】卡卡字幕助手（VideoCaptioner）使用教程

2026-01-30 04:49:25作者：鲍丁臣Ursa

🎬 卡卡字幕助手 | VideoCaptioner - 基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！视频字幕生成、断句、校正、字幕翻译全流程。让字幕制作简单高效！

项目地址：https://gitcode.com/gh_mirrors/vi/VideoCaptioner

1. 项目目录结构及介绍

卡卡字幕助手（VideoCaptioner）项目的目录结构如下：

VideoCaptioner/
├── runtime/                    # 运行环境目录
├── resources/               # 软件资源文件目录（二进制程序、图标等，以及下载的faster-whisper程序）
├── work-dir/               # 工作目录，处理完成的视频和字幕文件保存在这里
├── AppData/                    # 应用数据目录
├── cache/              # 缓存目录，缓存转录、大模型请求的数据。
├── models/              # 存放 Whisper 模型文件
├── logs/               # 日志目录，记录软件运行状态
├── settings.json          # 存储用户设置
├── cookies.txt           # 视频平台的 cookie 信息（下载高清视频时需要）
└── VideoCaptioner.exe      # 主程序执行文件

runtime/：存放运行时需要的文件。
resources/：包含程序运行所需的资源文件，如二进制程序、图标以及下载的faster-whisper程序。
work-dir/：所有处理完成的视频和字幕文件都会保存在这个目录。
AppData/：存储应用程序的数据文件。
cache/：用于缓存转录和大模型请求的数据。
models/：Whisper模型文件存放的地方。
logs/：记录软件运行状态的日志文件。
settings.json：存储用户的配置设置。
cookies.txt：存储视频平台下载高清视频所需的cookie信息。
VideoCaptioner.exe：主程序执行文件，用于运行软件。

2. 项目的启动文件介绍

项目的启动文件是VideoCaptioner.exe。这是主程序执行文件，用户可以通过双击该文件来启动卡卡字幕助手。启动后，软件将提供图形界面供用户操作，包括视频字幕生成、断句、校正、翻译等功能。

3. 项目的配置文件介绍

项目的配置文件是settings.json。这个文件存储了用户的配置设置，包括但不限于以下内容：

LLM API 配置：包括API的base_url和api_key，用于字幕断句、校正和翻译。
翻译配置：选择是否启用翻译以及翻译服务的类型。
语音识别接口配置：选择使用的语音识别接口和语言。
本地Whisper模型配置：选择和下载合适的Whisper模型用于语音识别。
字幕样式调整：包括字幕样式模板和多种格式字幕视频的配置。

用户可以根据自己的需求修改settings.json文件中的配置项，以适应不同的使用场景和需求。在修改配置后，重新启动软件以应用新的配置设置。

🎬 卡卡字幕助手 | VideoCaptioner - 基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！视频字幕生成、断句、校正、字幕翻译全流程。让字幕制作简单高效！

项目地址：https://gitcode.com/gh_mirrors/vi/VideoCaptioner

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

ohos_react_native

React Native鸿蒙化仓库