VidStab 技术文档
2024-12-20 22:39:09作者:鲍丁臣Ursa
本文档将详细介绍如何安装、使用 VidStab 项目,以及如何使用其提供的 API。VidStab 是一个视频稳定库,可以与 Ffmpeg 和 Transcode 集成使用。
1. 安装指南
系统要求
- 基于Linux的系统
- ffmpeg 源代码
- Cmake
默认构建与安装
安装 VidStab 库
cd 路径/to/vid.stab/dir/
cmake .
make
sudo make install
安装 ffmpeg
cd 路径/to/ffmpeg/dir/
./configure --enable-gpl --enable-libvidstab <其他配置选项>
make
sudo make install
自定义目录安装
安装 VidStab 库
cd 路径/to/vid.stab/dir/
cmake -DCMAKE_INSTALL_PREFIX:PATH=路径/to/install_dir/
make
sudo make install
安装 ffmpeg
cd 路径/to/ffmpeg/dir/
PKG_CONFIG_PATH="路径/to/install_dir/lib/pkgconfig" \
./configure --enable-gpl --enable-libvidstab <其他可选配置选项>
make
sudo make install
在首次运行 ffmpeg 之前,确保设置 LD_LIBRARY_PATH 指向 VidStab 库,例如:
export LD_LIBRARY_PATH=路径/to/install_dir/lib:$LD_LIBRARY_PATH
2. 使用说明
当前,使用 ffmpeg 时,VidStab 库必须以双通道模式运行。第一次通道使用 vidstabdetect 过滤器,第二次通道使用 vidstabtransform 过滤器。
Vidstab 过滤器选项
第一次通道(vidstabdetect 过滤器)
result:设置用于写入变换信息的文件路径。默认值为transforms.trf。shakiness:设置输入视频的抖动程度或相机的快速移动程度。接受 1-10 范围内的整数,1 表示轻微抖动,10 表示强烈抖动。默认值为 5。accuracy:设置检测过程的准确性。必须是 1-15 范围内的值。1 表示低准确性,15 表示高准确性。默认值为 15。stepsize:设置搜索过程的步长。最小值周围的区域以 1 像素分辨率进行扫描。默认值为 6。mincontrast:设置最小对比度。低于此值的所有测量场将被丢弃。必须是 0-1 范围内的浮点数。默认值为 0.3。tripod:设置三脚架模式的参考帧编号。如果启用,帧的运动将与过滤流中的参考帧进行比较。默认值为 0,表示禁用。show:在结果帧中显示字段和变换,以便进行视觉分析。接受 0-2 范围内的整数。默认值为 0,禁用任何可视化。
第二次通道(vidstabtransform 过滤器)
input:设置用于读取变换的文件路径。默认值为transforms.trf。smoothing:设置用于低通滤波相机运动的帧数(value*2 + 1)。默认值为 10。optalgo:设置相机路径优化算法。接受gauss(高斯核低通滤波)和avg(变换平均)。maxshift:设置最大像素数以平移帧。默认值为 -1,表示无限制。maxangle:设置旋转帧的最大角度(弧度)。默认值为 -1,表示无限制。crop:指定如何处理因运动补偿而缩小的空白帧边界。接受keep(保持前帧图像信息)和black(填充黑色边界)。invert:如果设置为 1,则反转变换。默认值为 0。relative:如果设置为 1,则将变换视为相对于前一个帧,绝对值为 0。默认值为 0。zoom:设置缩放百分比。正值表示放大,负值表示缩小。默认值为 0(无缩放)。optzoom:设置最优缩放以避免空白边界。接受 0(禁用)、1(确定最优静态缩放值)和 2(确定最优自适应缩放值)。zoomspeed:设置每帧最大缩放百分比(当optzoom设置为 2 时启用)。范围从 0 到 5,默认值为 0.25。interpol:指定插值类型。接受no(无插值)、linear(仅水平线性)、bilinear(双向线性,默认)和bicubic(双向立方,速度慢)。tripod:如果设置为 1,则启用虚拟三脚架模式。默认值为 0。debug:如果设置为 1,则增加日志详细程度,并写入临时文件global_motions.trf。默认值为 0。
3. 项目 API 使用文档
请参考 VidStab 的 GitHub 仓库和维基页面以获取详细的 API 文档和使用示例。
4. 项目安装方式
请遵循上述安装指南中的步骤进行安装。确保在安装过程中使用正确的路径和配置选项。安装完成后,您可以使用 ffmpeg 命令行工具与 VidStab 库一起使用。
登录后查看全文
热门项目推荐
相关项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0193- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
awesome-zig一个关于 Zig 优秀库及资源的协作列表。Makefile00
热门内容推荐
最新内容推荐
pi-mono自定义工具开发实战指南:从入门到精通3个实时风控价值:Flink CDC+ClickHouse在金融反欺诈的实时监测指南Docling 实用指南:从核心功能到配置实践自动化票务处理系统在高并发抢票场景中的技术实现:从手动抢购痛点到智能化解决方案OpenCore Legacy Patcher显卡驱动适配指南:让老Mac焕发新生7个维度掌握Avalonia:跨平台UI框架从入门到架构师Warp框架安装部署解决方案:从环境诊断到容器化实战指南突破移动瓶颈:kkFileView的5层适配架构与全场景实战指南革新智能交互:xiaozhi-esp32如何实现百元级AI对话机器人如何打造专属AI服务器?本地部署大模型的全流程实战指南
项目优选
收起
deepin linux kernel
C
27
12
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
601
4.04 K
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
69
21
Ascend Extension for PyTorch
Python
441
531
AscendNPU-IR是基于MLIR(Multi-Level Intermediate Representation)构建的,面向昇腾亲和算子编译时使用的中间表示,提供昇腾完备表达能力,通过编译优化提升昇腾AI处理器计算效率,支持通过生态框架使能昇腾AI处理器与深度调优
C++
112
170
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.46 K
824
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
922
770
暂无简介
Dart
846
204
React Native鸿蒙化仓库
JavaScript
321
375
openGauss kernel ~ openGauss is an open source relational database management system
C++
174
249