【亲测免费】 AI-TOD: 高空微小对象检测的基准与工具包

2026-01-16 10:12:35作者：韦蓉瑛

项目介绍

AI-TOD 是一个专为高空图像设计的微小对象检测数据集及配套工具包。该项目旨在解决在航空图像中检测微小目标的挑战，这些目标因像素数量极少而给现有的物体检测算法带来了极大难题。AI-TOD提供了约700,621个跨越八大类别的物体实例，分布于28,036张航空图像中。相较于其他空中图像中的物体检测数据集，AI-TOD的物体平均尺寸约为12.8像素，显著更小。为了改善标签分配时对微小物体位置偏差的敏感性，研究团队提出了标准化瓦斯蒂安距离(Normalized Wasserstein Distance, NWD)作为新度量，并结合定制化的基于排名的训练样本分配策略(RKA)。

项目快速启动

步骤 1: 获取源码与数据

首先，通过Git克隆AI-TOD项目仓库到本地：

git clone https://github.com/jwwangchn/AI-TOD.git
cd AI-TOD

接着，你需要下载xView训练集和AI-TOD的部分数据。xView的训练集可以从其官方网站获取，而AI-TOD的数据部分可以通过OneDrive下载。下载完成后，还需通过提供的脚本合成完整的AI-TOD数据集。

步骤 2: 数据准备与环境设置

按照以下结构组织你的文件，并安装必要的Python环境和依赖：

├── aitod
│   ├── annotations
│   ├── images
│   ├── ...
├── aitod_xview
├── xview
└── generate_aitod_imgs.py

确保Python版本为3.7，并安装mmcv以及项目特定的依赖项：

pip install -r requirements.txt

步骤 3: 合成AI-TOD图像集

运行脚本以生成完整的AI-TOD数据集：

python generate_aitod_imgs.py

这可能需要大约一个小时。完成后，可以在aitod文件夹找到处理后的完整图像集合。

应用案例与最佳实践

在AI-TOD上，推荐的做法是利用其提供的基准和新提出的NWD-RKA方法进行模型训练。用户可以调整现有检测框架，如Faster R-CNN或YOLO系列，采用NWD作为损失函数的一部分，并应用RKA策略来优化训练过程，以提升微小对象的检测精度。详细实验配置和超参数调整需参考项目文档或论文实现细节。

典型生态项目

AI-TOD不仅是独立存在，它构成了高空微小物体检测领域的一个重要里程碑，鼓励社区开发更多的相关工具和算法。例如，项目不仅可用于基础的检测任务，还可以作为测试床探索新的物体检测算法对于极端条件（微小物体）的适应性和性能极限。此外，NWD和RKA的概念可以被引入到其他领域的物体检测任务中，尤其是在那些面临相似尺度挑战的场景下，如医疗影像分析中的细胞检测或卫星图像分析。

以上就是AI-TOD项目的简介、快速启动指南、应用案例概述以及其在生态系统中的地位。通过这个项目，开发者和研究人员能够深入探索并提升在高空图像中微小目标的检测能力。

AI-TOD

Official code for "Tiny Object Detection in Aerial Images".

项目地址：https://gitcode.com/gh_mirrors/ai/AI-TOD

登录后查看全文