GIM 项目使用与启动教程

2026-01-30 05:21:59作者：柏廷章Berta

1. 项目介绍

GIM（Generalizable Image Matcher）是一个开源项目，旨在从互联网视频学习通用的图像匹配技术。该技术通过分析互联网上的视频资源，训练出能够广泛应用于不同场景下的图像匹配模型。GIM项目的核心是开发出能够适应多样化环境、无需额外训练即可匹配的图像匹配算法。

2. 项目快速启动

环境准备

首先，您需要在您的机器上设置Python环境。以下是创建新环境的命令：

conda create -n gim python=3.9

接着，安装所需的依赖库：

conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch -c conda-forge
conda install xformers -c xformers
pip install albumentations==1.0.1 --no-binary=imgaug,albumentations
pip install colour-demosaicing==0.2.2
pip install pytorch-lightning==1.5.10
pip install opencv-python==4.5.3.56
pip install imagesize==1.2.0
pip install kornia==0.6.10
pip install einops==0.3.0
pip install loguru==0.5.3
pip install joblib==1.0.1
pip install yacs==0.1.8
pip install h5py==3.1.0
pip install matplotlib
pip install omegaconf
pip install triton

克隆项目

使用以下命令克隆项目到本地：

git clone https://github.com/xuelunshen/gim.git
cd gim

下载模型权重

您需要从提供的Google Drive或OneDrive链接下载模型权重文件，并将其放置在项目中的weights文件夹下。

运行示例

项目中的demo.py脚本提供了一个使用GIM模型进行图像匹配的示例。以下是如何运行它的命令：

python demo.py --model gim_roma

或者选择其他模型：

python demo.py --model gim_dkm
# 或者
python demo.py --model gim_loftr
# 或者
python demo.py --model gim_lightglue

运行上述命令后，模型将会匹配assets/demo文件夹中的a1.png和a2.png，并输出a1_a2_match.png和a1_a2_warp.png。

3. 应用案例和最佳实践

GIM项目的应用案例广泛，包括但不限于：

视频帧之间的像素级对应关系建立
3D重建中的图像匹配
无需额外训练的通用图像匹配任务

最佳实践建议：

使用高质量的视频数据进行训练，避免编辑、转场和特效等影响匹配质量的因素。
在模型训练前，使用video_preprocessor.py对视频进行预处理，以获取可靠的像素级对应关系。

4. 典型生态项目

GIM项目可以作为以下典型生态项目的一部分：

视频分析工具箱
机器人视觉系统
自动驾驶中的图像匹配模块

以上是GIM项目的使用与启动教程，希望对您的开发工作有所帮助。

gim

GIM: Learning Generalizable Image Matcher From Internet Videos (ICLR 2024 Spotlight)

项目地址：https://gitcode.com/gh_mirrors/gim1/gim

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理

GIM 项目使用与启动教程

1. 项目介绍

2. 项目快速启动

环境准备

克隆项目

下载模型权重

运行示例

3. 应用案例和最佳实践

4. 典型生态项目

热门内容推荐

最新内容推荐

项目优选

GIM 项目使用与启动教程

1. 项目介绍

2. 项目快速启动

环境准备

克隆项目

下载模型权重

运行示例

3. 应用案例和最佳实践

4. 典型生态项目

相关内容推荐

热门内容推荐

最新内容推荐

项目优选