AutoCut完全指南：从结构到实战

2026-03-10 05:21:44作者：农烁颖Land

AutoCut是一款创新的视频剪辑工具，它允许用户通过文本编辑器标记字幕文件来实现视频剪切，极大简化了视频编辑流程。本文将从核心功能、模块关联到配置实战，全面解析AutoCut的使用方法。

📌 核心功能速览 AutoCut通过文本标记实现视频精准剪辑，主要包含音频转文字、字幕编辑和视频裁剪三大核心功能，支持批量处理和自动化操作。

一、功能模块解析

1. 音频转录模块

核心作用：将视频中的音频转换为文字字幕，支持多种语言识别。 关键代码路径：transcribe.py、whisper_model.py

该模块基于Whisper模型实现音频转文字功能，通过package_transcribe.py整合相关依赖，支持不同大小的模型选择，满足不同精度和速度需求。

2. 视频裁剪模块

核心作用：根据字幕文件中的标记信息，自动剪切视频片段。 关键代码路径：cut.py

通过分析字幕文件中的时间戳和标记信息，该模块能够精确提取需要保留的视频片段，实现自动化视频剪辑。

3. 后台服务模块

核心作用：监控指定文件夹，自动处理新增视频文件。 关键代码路径：daemon.py

实现了文件夹监听功能，当有新视频文件加入时，自动触发转录和剪辑流程，适合批量处理场景。

4. 命令行交互模块

核心作用：提供用户交互接口，接收命令参数并执行相应操作。 关键代码路径：main.py、main.py

作为程序入口，解析用户输入的命令行参数，调用相应功能模块完成视频处理任务。

二、文件模块关联

📌 模块协作流程 用户通过命令行调用main.py，指定视频文件或目录 → transcribe.py生成字幕 → 用户编辑字幕文件标记需保留内容 → cut.py根据标记剪切视频 → 输出最终结果。

上图展示了AutoCut的工作界面，左侧为标记后的字幕文件列表，右侧为视频预览窗口，用户可以直观地标记需要保留的句子，系统将根据标记自动剪切视频。

三、实战配置指南

基础配置项

参数名	默认值	说明
model_size	small	Whisper模型大小，可选：tiny, base, small, medium, large
language	auto	识别语言，默认自动检测
output_format	srt	字幕输出格式，支持srt, vtt等
video_quality	medium	输出视频质量，可选：low, medium, high

[!TIP] 对于中文视频，建议将language显式设置为"zh"以提高识别准确率。

高级调优参数

参数名	默认值	说明
beam_size	5	解码束大小，增大可提高识别准确率但降低速度
temperature	0.0	温度参数，0表示确定性输出，值越大随机性越强
word_timestamps	False	是否生成单词级时间戳
cpu_threads	4	CPU处理线程数，根据机器配置调整

常用命令示例

处理单个视频文件：

python main.py -t ./test/media/test001.mp4 --model medium --output_format srt

python main.py -d ./test/media --daemon --model small --language zh

仅生成字幕文件：

python main.py -t ./test/media/test001.mp4 --transcribe_only --output ./subtitles

四、快速上手步骤

克隆项目仓库：

git clone https://gitcode.com/GitHub_Trending/au/autocut

安装依赖：

cd autocut
pip install -r requirements.txt

处理视频文件：

python main.py -t your_video.mp4

在生成的字幕文件中标记需要保留的内容
执行视频剪切：

python main.py -c your_video.srt -o output_video.mp4

通过以上步骤，您可以快速体验AutoCut的核心功能，实现通过文本编辑进行视频剪辑的高效工作流。根据实际需求，可进一步调整配置参数以获得最佳效果。

autocut

用文本编辑器剪视频

项目地址：https://gitcode.com/GitHub_Trending/au/autocut

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

472

482

jiuwenswarm

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.05 K

277