TorchMetrics中LPIPS指标返回负值问题的分析与修复

2025-07-03 09:39:05作者：瞿蔚英Wynne

Torchmetrics - Machine learning metrics for distributed, scalable PyTorch applications.

项目地址：https://gitcode.com/gh_mirrors/to/torchmetrics

问题背景

在深度学习领域，图像质量评估是一个重要课题。Learned Perceptual Image Patch Similarity (LPIPS)是一种基于深度学习的图像相似度度量方法，它通过预训练的神经网络提取特征并计算感知相似度。TorchMetrics作为PyTorch Lightning生态系统中的指标计算库，提供了LPIPS的实现。

问题现象

在使用TorchMetrics v1.3.0版本时，开发者发现LPIPS指标在某些情况下会返回负值。这与理论预期不符，因为LPIPS通常应该返回0到1之间的正数，表示两幅图像从感知角度上的相似程度。

根本原因分析

经过深入调查，发现问题出在LPIPS实现中的线性层参数设置上。在当前的实现中，线性层的requires_grad属性没有被显式设置为False，这导致以下两个问题：

在训练过程中，优化器会错误地更新LPIPS网络的参数，改变了预训练模型的特征提取能力
梯度会在多个batch间累积，直到验证阶段才会被重置

这种行为违背了LPIPS指标的初衷——作为一个固定的感知相似度度量工具，其网络参数应该是冻结的，不应该在训练过程中被修改。

解决方案

修复方案相对简单直接：

在LPIPS网络初始化时，显式将所有线性层的requires_grad属性设置为False
确保整个LPIPS网络的参数都不会被包含在优化器的参数列表中

这样修改后，LPIPS网络将保持其预训练状态，仅作为特征提取器使用，不会再参与参数更新。

影响与建议

这个修复对于以下场景尤为重要：

使用LPIPS作为损失函数进行图像生成任务
在模型训练过程中监控感知相似度指标
需要稳定、可重复的LPIPS测量结果的研究工作

建议开发者在以下情况下检查自己的代码：

使用LPIPS指标时出现异常低或负值
训练过程中LPIPS值出现不合理的波动
优化器意外地包含了LPIPS网络参数

总结

这个问题的发现和修复体现了深度学习实践中一个常见但容易被忽视的原则：当使用预训练模型作为特征提取器或度量工具时，必须确保其参数被正确冻结。TorchMetrics团队及时响应并修复了这个问题，保证了LPIPS指标在图像处理任务中的可靠性和稳定性。

Torchmetrics - Machine learning metrics for distributed, scalable PyTorch applications.

项目地址：https://gitcode.com/gh_mirrors/to/torchmetrics

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

ohos_react_native

React Native鸿蒙化仓库

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。