DAB-DETR 开源项目使用教程

2024-09-25 16:43:15作者：傅爽业Veleda

1. 项目介绍

DAB-DETR（Dynamic Anchor Boxes are Better Queries for DETR）是一个基于Transformer的目标检测框架，由IDEA-Research团队开发。该项目在ICLR 2022上发表，旨在改进原始DETR（DEtection TRansformer）的性能和训练收敛速度。DAB-DETR通过使用动态锚框作为查询，显著提高了目标检测的准确性和效率。

2. 项目快速启动

2.1 环境准备

首先，确保你的环境中已经安装了Python 3.7.3、PyTorch 1.9.0和CUDA 11.1。你可以通过以下命令安装PyTorch和torchvision：

conda install -c pytorch pytorch torchvision

2.2 克隆项目

使用Git克隆DAB-DETR项目到本地：

git clone https://github.com/IDEA-Research/DAB-DETR.git
cd DAB-DETR

2.3 安装依赖

安装项目所需的依赖包：

pip install -r requirements.txt

2.4 编译CUDA操作符（可选）

如果你计划使用DAB-Deformable-DETR，需要手动编译可变形注意力操作符：

cd models/dab_deformable_detr/ops
python setup.py build install

2.5 数据准备

下载COCO 2017数据集，并按照以下结构组织数据：

COCODIR/
├── train2017/
├── val2017/
└── annotations/
    ├── instances_train2017.json
    └── instances_val2017.json

2.6 运行示例

使用预训练模型进行推理和评估：

# 使用DAB-DETR进行推理
python main.py -m dab_detr \
    --output_dir logs/DABDETR/R50 \
    --batch_size 1 \
    --coco_path /path/to/your/COCODIR \
    --resume /path/to/our/checkpoint \
    --eval

# 使用DAB-Deformable-DETR进行推理
python main.py -m dab_deformable_detr \
    --output_dir logs/dab_deformable_detr/R50 \
    --batch_size 2 \
    --coco_path /path/to/your/COCODIR \
    --resume /path/to/our/checkpoint \
    --transformer_activation relu \
    --eval