PIDNet 项目使用教程

2024-09-16 22:50:44作者：胡唯隽

1. 项目目录结构及介绍

PIDNet 项目的目录结构如下：

PIDNet/
├── configs/
│   ├── cityscapes/
│   └── camvid/
├── data/
│   ├── cityscapes/
│   └── camvid/
├── datasets/
├── figs/
├── models/
│   ├── speed/
├── pretrained_models/
│   ├── cityscapes/
│   └── camvid/
├── samples/
├── tools/
├── utils/
├── LICENSE
└── README.md

目录介绍：

configs/: 包含项目的配置文件，分为 cityscapes 和 camvid 两个子目录，分别用于不同的数据集配置。
data/: 存放数据集文件，包括 cityscapes 和 camvid 数据集。
datasets/: 数据集处理相关的代码。
figs/: 存放项目相关的图片文件。
models/: 包含模型的定义和实现，其中 speed/ 目录用于速度测试。
pretrained_models/: 存放预训练模型，分为 cityscapes 和 camvid 两个子目录。
samples/: 存放自定义输入的图片文件。
tools/: 包含项目的工具脚本，如训练、评估和自定义输入处理等。
utils/: 包含项目中使用的各种实用工具函数。
LICENSE: 项目的许可证文件。
README.md: 项目的介绍和使用说明。

2. 项目的启动文件介绍

PIDNet 项目的启动文件主要集中在 tools/ 目录下，以下是主要的启动文件及其功能介绍：

train.py: 用于训练模型的脚本。可以通过配置文件指定训练参数，如数据集、模型类型、批处理大小等。
eval.py: 用于评估模型的脚本。可以加载预训练模型并评估其在验证集或测试集上的性能。
custom.py: 用于处理自定义输入的脚本。可以将自定义图片输入到模型中进行预测。

使用示例：

训练 PIDNet-S 模型：

python tools/train.py --cfg configs/cityscapes/pidnet_small_cityscapes.yaml GPUS (0,1) TRAIN_BATCH_SIZE_PER_GPU 6

评估 PIDNet-S 模型：

python tools/eval.py --cfg configs/cityscapes/pidnet_small_cityscapes.yaml TEST_MODEL_FILE pretrained_models/cityscapes/PIDNet_S_Cityscapes_val.pt

处理自定义输入：

python tools/custom.py --a 'pidnet-l' --p 'pretrained_models/cityscapes/PIDNet_L_Cityscapes_test.pt' --t '.png'

3. 项目的配置文件介绍

PIDNet 项目的配置文件位于 configs/ 目录下，分为 cityscapes 和 camvid 两个子目录，分别对应不同的数据集。

配置文件示例：

configs/cityscapes/pidnet_small_cityscapes.yaml:

DATASET:
  NAME: 'cityscapes'
  ROOT: 'data/cityscapes'
  TRAIN_SET: 'list/cityscapes/train.lst'
  VAL_SET: 'list/cityscapes/val.lst'
  TEST_SET: 'list/cityscapes/test.lst'

MODEL:
  NAME: 'pidnet_small'
  PRETRAINED: 'pretrained_models/imagenet/PIDNet_S.pt'

TRAIN:
  BATCH_SIZE_PER_GPU: 6
  NUM_EPOCHS: 120
  LR: 0.01
  MOMENTUM: 0.9
  WEIGHT_DECAY: 0.0005

TEST:
  MODEL_FILE: 'pretrained_models/cityscapes/PIDNet_S_Cityscapes_val.pt'