VidStab 技术文档

2024-12-20 22:39:09作者：鲍丁臣Ursa

本文档将详细介绍如何安装、使用 VidStab 项目，以及如何使用其提供的 API。VidStab 是一个视频稳定库，可以与 Ffmpeg 和 Transcode 集成使用。

1. 安装指南

系统要求

基于Linux的系统
ffmpeg 源代码
Cmake

默认构建与安装

安装 VidStab 库

cd 路径/to/vid.stab/dir/
cmake .
make
sudo make install

安装 ffmpeg

cd 路径/to/ffmpeg/dir/
./configure --enable-gpl --enable-libvidstab <其他配置选项>
make
sudo make install

自定义目录安装

安装 VidStab 库

cd 路径/to/vid.stab/dir/
cmake -DCMAKE_INSTALL_PREFIX:PATH=路径/to/install_dir/
make
sudo make install

安装 ffmpeg

cd 路径/to/ffmpeg/dir/
PKG_CONFIG_PATH="路径/to/install_dir/lib/pkgconfig" \
./configure --enable-gpl --enable-libvidstab <其他可选配置选项>
make
sudo make install

在首次运行 ffmpeg 之前，确保设置 LD_LIBRARY_PATH 指向 VidStab 库，例如：

export LD_LIBRARY_PATH=路径/to/install_dir/lib:$LD_LIBRARY_PATH

2. 使用说明

当前，使用 ffmpeg 时，VidStab 库必须以双通道模式运行。第一次通道使用 vidstabdetect 过滤器，第二次通道使用 vidstabtransform 过滤器。

Vidstab 过滤器选项

第一次通道（vidstabdetect 过滤器）

result：设置用于写入变换信息的文件路径。默认值为 transforms.trf。
shakiness：设置输入视频的抖动程度或相机的快速移动程度。接受 1-10 范围内的整数，1 表示轻微抖动，10 表示强烈抖动。默认值为 5。
accuracy：设置检测过程的准确性。必须是 1-15 范围内的值。1 表示低准确性，15 表示高准确性。默认值为 15。
stepsize：设置搜索过程的步长。最小值周围的区域以 1 像素分辨率进行扫描。默认值为 6。
mincontrast：设置最小对比度。低于此值的所有测量场将被丢弃。必须是 0-1 范围内的浮点数。默认值为 0.3。
tripod：设置三脚架模式的参考帧编号。如果启用，帧的运动将与过滤流中的参考帧进行比较。默认值为 0，表示禁用。
show：在结果帧中显示字段和变换，以便进行视觉分析。接受 0-2 范围内的整数。默认值为 0，禁用任何可视化。

第二次通道（vidstabtransform 过滤器）

input：设置用于读取变换的文件路径。默认值为 transforms.trf。
smoothing：设置用于低通滤波相机运动的帧数（value*2 + 1）。默认值为 10。
optalgo：设置相机路径优化算法。接受 gauss（高斯核低通滤波）和 avg（变换平均）。
maxshift：设置最大像素数以平移帧。默认值为 -1，表示无限制。
maxangle：设置旋转帧的最大角度（弧度）。默认值为 -1，表示无限制。
crop：指定如何处理因运动补偿而缩小的空白帧边界。接受 keep（保持前帧图像信息）和 black（填充黑色边界）。
invert：如果设置为 1，则反转变换。默认值为 0。
relative：如果设置为 1，则将变换视为相对于前一个帧，绝对值为 0。默认值为 0。
zoom：设置缩放百分比。正值表示放大，负值表示缩小。默认值为 0（无缩放）。
optzoom：设置最优缩放以避免空白边界。接受 0（禁用）、1（确定最优静态缩放值）和 2（确定最优自适应缩放值）。
zoomspeed：设置每帧最大缩放百分比（当 optzoom 设置为 2 时启用）。范围从 0 到 5，默认值为 0.25。
interpol：指定插值类型。接受 no（无插值）、linear（仅水平线性）、bilinear（双向线性，默认）和 bicubic（双向立方，速度慢）。
tripod：如果设置为 1，则启用虚拟三脚架模式。默认值为 0。
debug：如果设置为 1，则增加日志详细程度，并写入临时文件 global_motions.trf。默认值为 0。