Kornia图像仿射变换warp_affine的正确使用方法

2025-05-22 15:31:30作者：伍霜盼Ellen

Kornia是为PyTorch打造的可微计算机视觉库，提供处理图像变换、几何投影、深度估计和低级别图像处理等任务的模块和算法。利用PyTorch的自动差异化能力，轻松实现复杂功能的梯度计算。无论你是科研还是商业用户，加入我们，一起推动这个项目的创新和发展。安装简单，支持从PyPI或GitHub源码安装。在你的研究中使用Kornia，请考虑引用相关论文，并参与到我们的贡献者行列，共同塑造计算机视觉的未来！

项目地址：https://gitcode.com/gh_mirrors/kor/kornia

在使用Kornia进行图像处理时，许多开发者可能会遇到warp_affine函数输出结果不符合预期的问题。本文将从技术角度深入分析这一常见问题的原因，并提供正确的使用方法。

问题现象

当开发者尝试使用Kornia的warp_affine函数对图像进行仿射变换时，输出的结果与OpenCV的warpAffine函数相比存在明显差异。具体表现为变换后的图像出现异常变形或内容丢失。

根本原因分析

经过深入研究发现，这一问题的主要原因是输入张量的维度顺序不符合Kornia的要求。Kornia作为PyTorch生态中的计算机视觉库，遵循PyTorch的通道优先(Channel-first)约定，要求输入图像张量的维度顺序必须是[B, C, H, W]（批次、通道、高度、宽度）。

而许多开发者习惯使用OpenCV等库处理图像，这些库通常采用通道最后(Channel-last)的格式[H, W, C]。当直接将这种格式的数据输入Kornia的warp_affine函数时，函数不会报错但会产生错误的变换结果。

正确使用方法

要正确使用Kornia的warp_affine函数，必须确保：

输入张量的维度顺序为[B, C, H, W]
对于单张图像，需要添加批次维度
数据类型应为torch.Tensor

以下是正确的代码示例：

import torch
import kornia as K
import kornia.geometry.transform as KT

# 假设image是numpy数组，形状为[H, W, C]
image_tensor = torch.from_numpy(image).permute(2, 0, 1).float()  # 转换为[C, H, W]
image_tensor = image_tensor.unsqueeze(0)  # 添加批次维度 [1, C, H, W]

# 创建仿射变换矩阵
B, C, H, W = image_tensor.shape
center = torch.tensor([[W/2, H/2]]).repeat(B, 1)  # 中心点
affine_matrix = KT.get_rotation_matrix2d(center, angle=0, scale=torch.tensor([[0.5, 0.5]]))

# 执行仿射变换
transformed_image = KT.warp_affine(image_tensor, affine_matrix, (512, 512))