TorchMetrics中Pearson相关系数计算数值稳定性问题分析

2025-07-03 05:02:17作者：盛欣凯Ernestine

在机器学习评估指标库TorchMetrics中，PearsonCorrCoef模块在处理数值范围较小的数据时会出现返回NaN的问题。本文将深入分析该问题的技术背景、产生原因以及解决方案。

问题现象

当输入数据的数值范围较小时（例如1e-4量级），TorchMetrics的Pearson相关系数计算结果会变为NaN，而相同数据在SciPy的pearsonr函数中却能正常计算。这种现象表明当前实现在数值稳定性方面存在不足。

技术背景

Pearson相关系数是衡量两个变量线性相关程度的统计量，计算公式为：

r = cov(X,Y) / (σ_X * σ_Y)

其中cov表示协方差，σ表示标准差。当数据值很小时，计算过程中会出现以下数值稳定性问题：

平方运算导致数值急剧缩小
浮点数精度限制下的舍入误差累积
除零或接近零的除法导致数值不稳定

问题根源分析

当前TorchMetrics实现直接基于原始公式计算，没有考虑以下因素：

未对输入数据进行适当的数值缩放处理
累积计算过程中没有考虑数值范围变化
缺乏对极端小数值的保护机制

解决方案建议

针对数值稳定性问题，可以引入以下改进措施：

动态缩放技术：在计算过程中维护运行时的最大值估计，根据数据范围动态调整计算尺度
数值规范化：在计算前对数据进行归一化处理，将数值调整到合理范围
高精度计算：在关键计算步骤使用更高精度的数据类型
数值保护：添加微小常数防止除零错误

实现考虑

改进实现时需要平衡：

计算效率：保持Tensor运算的并行优势
内存占用：避免引入过多中间变量
数值精度：确保在各种数据范围内都能稳定计算
API兼容性：保持现有接口不变

结论

数值稳定性是统计计算中的常见挑战。通过引入适当的数值处理技术，可以显著提升TorchMetrics中Pearson相关系数计算的鲁棒性，使其能够正确处理各种数值范围的数据。这类改进不仅适用于当前模块，也为其他统计量计算提供了参考模式。

对于开发者而言，理解浮点数计算的特性并在实现中考虑数值稳定性，是开发高质量数值计算库的重要技能。

torchmetrics

Torchmetrics - Machine learning metrics for distributed, scalable PyTorch applications.

项目地址：https://gitcode.com/gh_mirrors/to/torchmetrics

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781