Co-Mixup 开源项目使用教程

2024-09-14 21:28:21作者：吴年前Myrtle

1. 项目介绍

Co-Mixup 是一个用于深度学习的数据增强方法，旨在提高神经网络的泛化性能和鲁棒性。该项目由 JangHyun Kim、Wonho Choo、Hosan Jeong 和 Hyun Oh Song 开发，并在 ICLR 2021 会议上进行了口头报告。Co-Mixup 通过最大化数据显著性度量并鼓励超模多样性，提出了一种新的批量混合方法，从而在多个基准数据集上取得了最先进的性能。

2. 项目快速启动

2.1 环境准备

首先，确保你的环境中安装了以下依赖：

Python 3.7.6
PyTorch 1.7.0
torchvision 0.8.1
CUDA 11.1
cuDNN 7.6.3

此外，还需要安装 gco-wrapper：

pip install gdown
pip install gco-wrapper

2.2 下载项目

使用 Git 克隆项目到本地：

git clone https://github.com/snu-mllab/Co-Mixup.git
cd Co-Mixup

2.3 下载预训练模型

下载预训练模型并解压到指定目录：

gdown https://drive.google.com/uc?id=1awBkSLxQKHUry-jkbDB1aMRBgIn5aT3F -O ./checkpoint/cifar100_preactresnet18_eph300_comixup/checkpoint.pth.tar

2.4 测试模型

运行以下命令测试模型：

python main.py --evaluate --log_off --parallel False --resume ./checkpoint/cifar100_preactresnet18_eph300_comixup/checkpoint.pth.tar --data_dir ./data/cifar100/

3. 应用案例和最佳实践

3.1 CIFAR-100 数据集上的应用

在 CIFAR-100 数据集上使用 Co-Mixup 进行训练：

python main.py --dataset cifar100 --data_dir ./data/cifar100/ --root_dir ./experiments/cifar100 --labels_per_class 500 --arch preactresnet18 --learning_rate 0.2 --epochs 300 --schedule 100 200 --gammas 0.1 0.1 --comix True --parallel True --m_part 20 --m_block_num 4 --mixup_alpha 2.0 --clean_lam 1.0 --m_beta 0.32 --m_gamma 1.0 --m_thres 0.83 --m_eta 0.05 --m_omega 0.001

3.2 Tiny-ImageNet-200 数据集上的应用

在 Tiny-ImageNet-200 数据集上使用 Co-Mixup 进行训练：

python main.py --dataset tiny-imagenet-200 --data_dir ./data/tiny-imagenet-200 --root_dir ./experiments/tiny --labels_per_class 500 --arch preactresnet18 --learning_rate 0.2 --epochs 1200 --schedule 600 900 --gammas 0.1 0.1 --workers 8 --comix True --parallel True --m_part 20 --m_block_num 4 --mixup_alpha 2.0 --clean_lam 1.0 --m_beta 0.32 --m_gamma 1.0 --m_thres 0.83 --m_eta 0.05 --m_omega 0.001