首页
/ GNT项目使用与启动教程

GNT项目使用与启动教程

2025-04-18 07:08:36作者:余洋婵Anita

1. 项目介绍

GNT(Generalizable NeRF Transformer)是一个基于Transformer架构的开源项目,旨在高效地重建神经辐射场(NeRFs)。与传统的方法不同,GNT通过两个Transformer阶段来实现场景表示和渲染的通用性:第一个阶段是视图Transformer,利用多视图几何作为归纳偏置进行场景表示;第二个阶段是射线Transformer,通过射线行进和注意机制直接解码采样点特征来渲染新视图。GNT在多种数据集上展示了优越的性能,并且能够从注意图中推断出深度和遮挡信息。

2. 项目快速启动

环境准备

在开始之前,请确保您的系统已安装以下依赖:

  • Python 3.8
  • CUDA 11.1
  • PyTorch 1.10.1
  • torchvision
  • ConfigArgParse
  • imageio
  • matplotlib
  • numpy
  • opencv_contrib_python
  • Pillow
  • scipy
  • imageio-ffmpeg
  • lpips
  • scikit-image

克隆仓库

首先,克隆GNT的GitHub仓库:

git clone https://github.com/MukundVarmaT/GNT.git
cd GNT/

数据集准备

接下来,下载并准备所需的数据集。数据集应下载到项目文件夹内的data/目录下,并按照以下结构组织:

data/
├── ibrnet_collected_1/
├── ibrnet_collected_2/
├── real_iconic_noface/
├── spaces_dataset/
├── RealEstate10K-subset/
├── google_scanned_objects/
├── nerf_synthetic/
├── nerf_llff_data/

具体的数据集准备方法请参考项目README文件。

训练模型

使用以下命令启动单个场景的训练:

python3 train.py --config configs/gnt_blender.txt --train_scenes drums --eval_scenes drums

或者启动跨场景的训练:

python3 train.py --config configs/gnt_full.txt

评估模型

单个场景评估的命令如下:

python3 eval.py --config configs/gnt_llff.txt --eval_scenes orchids --expname gnt_orchids --chunk_size 500 --run_val --N_samples 192

跨场景评估的命令如下:

python3 eval.py --config configs/gnt_full.txt --expname gnt_full --chunk_size 500 --run_val --N_samples 192

渲染视频

要渲染平滑相机路径的实时视频,请使用以下命令:

python3 render.py --config configs/gnt_llff.txt --eval_dataset llff_render --eval_scenes orchids --expname gnt_orchids --chunk_size 500 --N_samples 192

3. 应用案例和最佳实践

GNT项目在多个应用案例中展示了其强大的场景重建和渲染能力。以下是一些最佳实践:

  • 在训练前确保数据集的质量和多样性。
  • 使用合适的超参数来优化模型的性能。
  • 在评估模型时,使用与训练时相同的配置和参数以确保一致性。

4. 典型生态项目

GNT项目是基于IBRNet项目的代码库构建的,因此与IBRNet相关的项目生态可以视为GNT的典型生态。此外,任何涉及神经辐射场和Transformer架构的项目都可以与GNT项目形成生态关系。

登录后查看全文
热门项目推荐