RT-DETR 开源项目教程

2026-01-16 10:29:15作者：咎岭娴Homer

1. 项目目录结构及介绍

以下是RT-DETR项目的基本目录结构：

.
├── benchmark                # 性能基准测试代码
│   ├── benchmark_rtdetr.py  
│   └── ...
├── rtdetr_paddle            # PaddlePaddle实现的RT-DETR代码
│   ├── config.py            
│   ├── train.py             
│   ├── eval.py              
│   └── ...
├── rtdetr_pytorch           # PyTorch实现的RT-DETR代码
│   ├── config.py            
│   ├── train.py             
│   ├── eval.py              
│   └── ...
└── ...                       # 其他相关文件和子目录

benchmark: 包含用于性能基准测试的脚本。
rtdetr_paddle: 使用PaddlePaddle框架的RT-DETR实现，包括训练、评估的脚本以及配置文件。
rtdetr_pytorch: 利用PyTorch实现的RT-DETR版本，同样包含了训练和评估的相关代码。

2. 项目的启动文件介绍

2.1 训练文件

对于PaddlePaddle:

在rtdetr_paddle目录下，启动训练的命令是：

python train.py --config config.yaml --use_gpu True --log_dir logs

这将使用config.yaml中的配置进行训练，并将日志保存到logs目录。

对于PyTorch:

在rtdetr_pytorch中，执行训练的命令类似：

python train.py --cfg config.yaml --device cuda:0

它会使用config.yaml配置文件，并选择GPU设备（在这里是GPU 0）进行训练。

2.2 评估文件

对于PaddlePaddle:

在rtdetr_paddle目录，进行模型评估可以使用：

python eval.py --config config.yaml --use_gpu True --ckpt_path path/to/checkpoint.pdparams

这里，path/to/checkpoint.pdparams替换为你的检查点文件路径。

对于PyTorch:

对于PyTorch版本，在rtdetr_pytorch目录下执行评估：

python eval.py --cfg config.yaml --device cuda:0 --model_path path/to/model.pth

将path/to/model.pth替换为要评估的模型权重文件路径。

3. 项目的配置文件介绍

配置文件通常位于rtdetr_paddle/config.py或rtdetr_pytorch/config.py，这些文件定义了模型架构、数据加载器、优化器、学习率策略等关键参数。例如：

model:
  arch: 'rt_detr'  # 模型架构名称
  backbone: 'resnet18'  # 主干网络
  num_classes: 80  # 目标类别数
  encoder_dim: 256  # 编码器特征维度
  decoder_dim: 256  # 解码器特征维度
  hidden_dim: 256  # 隐藏层维度
  attention_dropout: 0.1  # 注意力机制的丢弃率
  dropout: 0.1  # 常规dropout率

optimizer:
  name: 'AdamW'  # 优化器类型
  learning_rate: 0.0001  # 初始学习率
  weight_decay: 0.0001  # 权重衰减

scheduler:
  name: 'LinearWarmupCosineAnnealingLR'  # 学习率调度器
  warmup_epochs: 10  # 温暖-up周期
  total_epochs: 100  # 总训练周期
  min_lr: 0.00001  # 最小学习率

data:
  dataset: 'coco'  # 数据集类型
  img_size: 512  # 图像尺寸
  batch_size: 8  # 批次大小
  num_workers: 4  # 数据预处理线程数