Gaussian Splatting项目中反向梯度计算的数学原理分析

2025-05-13 09:23:49作者：伍希望

引言

在3D高斯泼溅(Gaussian Splatting)渲染技术中，反向传播梯度计算是实现可微分渲染的关键环节。本文将深入分析该项目中关于2D协方差矩阵反向梯度计算的数学原理，特别是针对非对角元素梯度计算系数的争议点进行详细解释。

对称矩阵梯度计算的特殊性

在Gaussian Splatting项目中，协方差矩阵是一个对称矩阵。对于对称矩阵的梯度计算，存在两种等效但形式不同的数学表达方式：

矩阵元素视角：将对称矩阵视为独立元素的集合，此时非对角元素实际上是两个相同元素的组合
矩阵结构视角：考虑矩阵的对称性，将非对角元素视为一个整体

这两种视角会导致梯度计算公式在形式上有所不同，但最终计算结果是一致的。

具体实现分析

在代码实现中，对于2D协方差矩阵的反向梯度计算，非对角元素的梯度计算采用了0.5的系数。这一设计源于以下数学考虑：

设损失函数L关于高斯核G的导数为dL_dG，那么对于协方差矩阵的非对角元素b，其梯度计算可以表示为：

dL/db = -0.5 * (gdx * d.y) * dL_dG

其中gdx和d.y是与像素坐标相关的项。这里的0.5系数来自于对称矩阵的数学性质。

两种视角的等价性

虽然代码中直接使用了0.5系数，但项目在后续处理中通过乘以2来"补偿"这一系数。这种处理方式实际上对应于上述两种数学视角的转换：

如果采用矩阵元素视角，非对角元素的梯度需要乘以2（因为影响两个对称位置）
如果采用矩阵结构视角，则直接使用0.5系数

两种方法最终得到的梯度值是相同的，只是中间计算步骤的表达方式不同。

实现细节的一致性

值得注意的是，项目中不同部分的代码采用了不同的视角：

在计算dL_dconic2D时采用了矩阵结构视角（使用0.5系数）
而在后续计算dL_da、dL_db、dL_dc时又采用了矩阵元素视角（使用2倍系数）

这种混合使用虽然从数学上是正确的，但在代码可读性上可能会造成一定的混淆。理解这一设计需要深入掌握对称矩阵梯度计算的数学原理。

结论

Gaussian Splatting项目中的梯度计算实现虽然在不同部分采用了不同的数学视角，但从数学原理和最终结果来看都是正确的。这一设计反映了计算机图形学中在数学严谨性和实现效率之间的权衡。理解这一设计需要掌握：

对称矩阵的数学性质
反向传播的基本原理
不同数学表达形式的等价性

对于开发者而言，重要的是保持实现逻辑的一致性，确保梯度计算的正确性，而不必拘泥于特定的实现形式。

gaussian-splatting

Original reference implementation of "3D Gaussian Splatting for Real-Time Radiance Field Rendering"

项目地址：https://gitcode.com/gh_mirrors/ga/gaussian-splatting

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

1.13 K

271