MIRNet 开源项目教程

2024-09-18 01:45:05作者：乔或婵

1. 项目介绍

MIRNet（Multi-scale Image Restoration and Enhancement Network）是一个用于图像恢复和增强的开源项目。该项目在 ECCV 2020 上发布，旨在通过学习丰富的特征来恢复高质量的图像内容。MIRNet 在图像去噪、超分辨率和图像增强等任务上取得了最先进的结果。

主要特点

多尺度特征提取：通过并行的多分辨率卷积流提取多尺度特征。
信息交换：在多分辨率流之间进行信息交换，以增强特征的上下文信息。
注意力机制：使用空间和通道注意力机制来捕捉上下文信息。
多尺度特征聚合：基于注意力的多尺度特征聚合，以保持高分辨率的空间细节。

2. 项目快速启动

安装依赖

首先，确保你已经安装了 Python 3.7 和 PyTorch 1.1.0。然后，按照以下步骤安装其他依赖项：

sudo apt-get install cmake build-essential libjpeg-dev libpng-dev
conda create -n pytorch1 python=3.7
conda activate pytorch1
conda install pytorch=1.1 torchvision=0.3 cudatoolkit=9.0 -c pytorch
pip install matplotlib scikit-image opencv-python yacs joblib natsort h5py tqdm

下载数据集

下载 SIDD-Medium 数据集并生成图像补丁：

python generate_patches_SIDD.py --ps 256 --num_patches 300 --num_cores 10

训练模型

使用默认参数训练模型：

python train_denoising.py

评估模型

下载预训练模型并进行评估：

python test_denoising_sidd.py --save_images

3. 应用案例和最佳实践

图像去噪

MIRNet 在图像去噪任务中表现出色。以下是一个使用预训练模型对 SIDD 数据集进行去噪的示例：

python test_denoising_sidd.py --save_images

图像超分辨率

MIRNet 也可以用于图像超分辨率任务。以下是一个使用预训练模型对图像进行超分辨率的示例：

python test_super_resolution.py --save_images --scale 3

图像增强

MIRNet 在图像增强任务中同样表现优异。以下是一个使用预训练模型对 LOL 数据集进行图像增强的示例：

python test_enhancement.py --save_images --input_dir /datasets/lol/ --result_dir /results/enhancement/lol/ --weights /pretrained_models/enhancement/model_lol.pth