理解卷积神经网络中的平移等变性：以udlbook项目为例

2025-05-30 06:36:55作者：盛欣凯Ernestine

卷积神经网络(CNN)作为深度学习领域的重要模型，其核心特性之一就是平移等变性(translation equivariance)。本文将深入探讨这一概念，并通过数学推导帮助读者理解其本质。

卷积运算与平移等变性

平移等变性是指当输入信号发生平移时，经过卷积运算后的输出也会发生相应的平移。用数学表达式可以表示为：

f(t(x)) = t(f(x))

其中f代表卷积运算，t代表平移操作。这意味着对输入进行平移后再卷积，与先卷积再平移得到的结果是相同的。

数学证明

考虑一维信号x[n]和卷积核h[n]，卷积运算定义为：

(x∗h)[n] = ∑x[k]h[n−k]

定义平移算子S_c(x[n]) = x[n - c]。我们可以证明：

S_c((x∗h)[n]) = S_c(∑x[k]h[n - k]) = ∑x[k]h[n - c - k]

通过变量替换k = k' - c，上式变为：

∑x[k' - c]h[n - k'] = ∑S_c(x[k'])h[n - k'] = (S_c(x)∗h)[n]

这证明了f(S_c(x)) = S_c(f(x))，即卷积运算确实具有平移等变性。

实际应用中的考虑

在实际应用中，我们需要注意几个关键点：

有限边界问题：理论上卷积是在无限信号上定义的，但实际图像和滤波器都有有限尺寸。在边界处，等变性可能不完全成立，因此可以说CNN在图像内部是"近似"等变的。
卷积与互相关的区别：严格来说，CNN中常用的是互相关(cross-correlation)运算，但习惯上仍称为卷积。两者在等变性上的表现是相似的。
维度扩展：上述证明针对一维信号，但可以自然地扩展到二维图像情况。

常见误解澄清

初学者常犯的一个错误是将卷积运算与简单的点积混淆。点积运算确实不具备平移等变性，因为：

f(x) = w·x f(t(x)) = w·(x + c) = w·x + w·c t(f(x)) = w·x + c

显然w·x + c ≠ w·x + w·c（除非w=1），这说明点积不是等变运算。这强调了理解卷积运算特殊性的重要性。

结论

平移等变性是CNN能够有效处理图像数据的关键特性之一。通过数学推导，我们清晰地看到卷积运算如何保持这种等变关系。理解这一特性有助于我们更好地设计和使用卷积神经网络，特别是在需要考虑空间不变性的计算机视觉任务中。在实际应用中，虽然有限边界会带来一些限制，但CNN仍然表现出良好的平移等变特性。

udlbook

Understanding Deep Learning - Simon J.D. Prince

项目地址：https://gitcode.com/gh_mirrors/ud/udlbook

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch