ViTDet 项目使用教程

2026-01-17 09:23:10作者：苗圣禹Peter

1. 项目的目录结构及介绍

ViTDet 项目的目录结构如下：

ViTDet/
├── configs/
│   ├── _base_/
│   │   ├── datasets/
│   │   ├── models/
│   │   └── schedules/
│   ├── COCO-Detection/
│   └── COCO-InstanceSegmentation/
├── datasets/
├── detectron2/
├── tools/
│   ├── train_net.py
│   └── test_net.py
├── README.md
└── requirements.txt

目录结构介绍

configs/: 包含项目的配置文件，分为基础配置和特定任务的配置。
- _base_/: 基础配置文件，包括数据集、模型和训练计划。
- COCO-Detection/: 针对 COCO 目标检测任务的配置文件。
- COCO-InstanceSegmentation/: 针对 COCO 实例分割任务的配置文件。
datasets/: 存放数据集的目录。
detectron2/: 包含 Detectron2 框架的代码。
tools/: 包含训练和测试脚本。
- train_net.py: 训练模型的脚本。
- test_net.py: 测试模型的脚本。
README.md: 项目说明文档。
requirements.txt: 项目依赖的 Python 包列表。

2. 项目的启动文件介绍

项目的启动文件主要位于 tools/ 目录下：

train_net.py: 用于启动训练过程的脚本。可以通过命令行参数指定配置文件和其他训练参数。
test_net.py: 用于启动测试过程的脚本。可以通过命令行参数指定配置文件和其他测试参数。

使用示例

# 训练模型
python tools/train_net.py --config-file configs/COCO-Detection/vitdet_config.yaml

# 测试模型
python tools/test_net.py --config-file configs/COCO-Detection/vitdet_config.yaml --model-weights path/to/model_weights.pth

3. 项目的配置文件介绍

配置文件位于 configs/ 目录下，主要分为基础配置和特定任务的配置。

基础配置

基础配置文件位于 configs/_base_/ 目录下：

datasets/: 定义数据集的配置。
models/: 定义模型的配置。
schedules/: 定义训练计划的配置。

特定任务配置

特定任务的配置文件位于 configs/COCO-Detection/ 和 configs/COCO-InstanceSegmentation/ 目录下：

vitdet_config.yaml: 针对 ViTDet 模型的配置文件，包含数据集、模型和训练计划的详细配置。

配置文件示例

# configs/COCO-Detection/vitdet_config.yaml
_BASE_: "../_base_/models/vitdet.yaml"
DATASETS:
  TRAIN: ("coco_2017_train",)
  TEST: ("coco_2017_val",)
SOLVER:
  IMS_PER_BATCH: 16
  BASE_LR: 0.001
  MAX_ITER: 10000