Kornia项目中RandAugment默认策略列表的重要修正

2025-05-22 13:26:50作者：邵娇湘

Kornia是为PyTorch打造的可微计算机视觉库，提供处理图像变换、几何投影、深度估计和低级别图像处理等任务的模块和算法。利用PyTorch的自动差异化能力，轻松实现复杂功能的梯度计算。无论你是科研还是商业用户，加入我们，一起推动这个项目的创新和发展。安装简单，支持从PyPI或GitHub源码安装。在你的研究中使用Kornia，请考虑引用相关论文，并参与到我们的贡献者行列，共同塑造计算机视觉的未来！

项目地址：https://gitcode.com/gh_mirrors/kor/kornia

在计算机视觉和图像处理领域，数据增强是提高模型泛化能力的关键技术之一。Kornia作为一个基于PyTorch的计算机视觉库，提供了丰富的图像增强功能，其中RandAugment是一种流行的自动化数据增强方法。

问题背景

在Kornia的RandAugment实现中，开发者发现了一个重要的策略列表配置错误。默认的策略列表中，"translate_x"（水平平移）操作被意外地列出了两次，而对应的"translate_y"（垂直平移）操作却完全缺失。这种不平衡的配置可能导致模型训练时在垂直方向上的数据增强不足，影响最终模型的性能表现。

技术细节分析

RandAugment的核心思想是通过随机选择和应用一系列图像变换操作来增强训练数据。这些操作包括但不限于：

自动对比度调整(auto_contrast)
直方图均衡化(equalize)
图像反色(invert)
旋转(rotate)
色调分离(posterize)
曝光调整(solarize)
颜色/对比度/亮度/锐度调整
剪切变换(shear_x/shear_y)
平移变换(translate_x/translate_y)

在原始实现中，策略列表的最后一个条目错误地重复了水平平移变换，而遗漏了垂直平移变换。这种配置偏差可能导致模型在训练过程中无法充分学习垂直方向上的不变性特征。

修正方案

正确的策略列表应该包含以下16种变换操作，每种操作都有其合理的参数范围：

default_policy = [
    [("auto_contrast", 0, 1)],
    [("equalize", 0, 1)],
    [("invert", 0, 1)],
    [("rotate", -30.0, 30.0)],
    [("posterize", 0.0, 4)],
    [("solarize", 0.0, 1.0)],
    [("solarize_add", 0.0, 0.43)],
    [("color", 0.1, 1.9)],
    [("contrast", 0.1, 1.9)],
    [("brightness", 0.1, 1.9)],
    [("sharpness", 0.1, 1.9)],
    [("shear_x", -0.3, 0.3)],
    [("shear_y", -0.3, 0.3)],
    [("translate_x", -0.1, 0.1)],
    [("translate_y", -0.1, 0.1)]
]