Scene Graph Benchmark 项目教程

2024-08-17 08:34:58作者：苗圣禹Peter

1. 项目的目录结构及介绍

Scene Graph Benchmark 项目的目录结构如下：

scene_graph_benchmark/
├── configs/
│   ├── R-50-FPN.yaml
│   └── ...
├── scene_graph_benchmark/
│   ├── modeling/
│   │   ├── detector.py
│   │   └── ...
│   ├── data/
│   │   ├── datasets/
│   │   └── ...
│   ├── engine/
│   │   ├── trainer.py
│   │   └── ...
│   ├── utils/
│   │   ├── misc.py
│   │   └── ...
│   ├── config.py
│   └── ...
├── tools/
│   ├── train_net.py
│   └── ...
├── README.md
└── ...

目录结构介绍

configs/: 包含项目的配置文件，如模型配置、数据集配置等。
scene_graph_benchmark/: 项目的主要代码目录。
- modeling/: 包含模型的定义和实现。
- data/: 包含数据处理和加载的相关代码。
- engine/: 包含训练和评估的引擎代码。
- utils/: 包含各种工具函数和辅助类。
- config.py: 配置文件的解析和处理。
tools/: 包含项目的启动脚本，如训练和评估脚本。
README.md: 项目的说明文档。

2. 项目的启动文件介绍

项目的启动文件主要位于 tools/ 目录下，其中最主要的启动文件是 train_net.py。

`train_net.py`

train_net.py 是用于训练模型的主要脚本。它接受配置文件作为输入，并根据配置文件中的参数进行模型训练。

# tools/train_net.py

import argparse
import os

from scene_graph_benchmark.config import cfg
from scene_graph_benchmark.engine.trainer import Trainer

def main():
    parser = argparse.ArgumentParser(description="Train a model")
    parser.add_argument("--config-file", default="", metavar="FILE", help="path to config file")
    args = parser.parse_args()

    cfg.merge_from_file(args.config_file)
    cfg.freeze()

    output_dir = cfg.OUTPUT_DIR
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)

    trainer = Trainer(cfg)
    trainer.train()

if __name__ == "__main__":
    main()

使用方法

python tools/train_net.py --config-file configs/R-50-FPN.yaml

3. 项目的配置文件介绍

项目的配置文件主要位于 configs/ 目录下，其中最主要的配置文件是 R-50-FPN.yaml。

`R-50-FPN.yaml`

R-50-FPN.yaml 是一个示例配置文件，定义了模型的各种参数，包括数据集路径、模型结构、训练参数等。

# configs/R-50-FPN.yaml

MODEL:
  META_ARCHITECTURE: "GeneralizedRCNN"
  BACKBONE:
    CONV_BODY: "R-50-FPN"
  RPN:
    USE_FPN: True
  ROI_HEADS:
    USE_FPN: True
  ROI_BOX_HEAD:
    POOLER_RESOLUTION: 7
    POOLER_SCALES: [0.25, 0.125, 0.0625, 0.03125]
    POOLER_TYPE: "ROIAlignV2"
    FEATURE_EXTRACTOR: "FPN2MLPFeatureExtractor"
    PREDICTOR: "FPNPredictor"
  ROI_RELATION_HEAD:
    USE_GT_BOX: True
    USE_GT_OBJECT_LABEL: True
    DATA_UPSAMPLE_BATCH: 1
    DATA_UPSAMPLE_REL: 1
    POOLER_RESOLUTION: 14

登录后查看全文