MONAI项目中softplus函数精度问题的分析与解决

2025-06-03 04:16:33作者：鲍丁臣Ursa

背景介绍

在医学影像分析领域，MONAI作为一个基于PyTorch的开源框架，提供了丰富的图像处理工具。近期在测试过程中发现了一个关于softplus函数的精度问题，该问题影响了ClipIntensityPercentiles转换器的测试稳定性。

问题现象

在测试ClipIntensityPercentiles转换器时，发现soft_clipping_one_sided_high_2测试用例失败。具体表现为使用NumPy和PyTorch实现的softplus函数（基于logaddexp）计算结果存在微小差异：

最大绝对差异：0.00011533
最大相对差异：0.00107984
所有8192个元素均不匹配

技术分析

根本原因

经过深入分析，发现问题根源在于：

NumPy的logaddexp和PyTorch的logaddexp实现存在细微差异
MONAI的ClipIntensityPercentiles转换器内部会将输入数据转换为MetaTensor
测试用例中直接比较了NumPy实现和PyTorch实现的结果

解决方案探讨

团队提出了几种可能的解决方案：

统一实现方式：强制在NumPy路径下也使用PyTorch的logaddexp实现
调整测试容差：根据PyTorch官方测试标准放宽比较阈值
修改测试逻辑：确保测试比较在相同计算路径下进行

最终解决方案

经过讨论，团队决定采用以下方案：

修改测试用例，确保比较的是相同计算路径下的结果
明确不要求NumPy和PyTorch实现必须产生完全一致的结果
接受框架内部的微小数值差异，只要不影响实际应用

这种方案基于以下考虑：

PyTorch本身已经对数值计算进行了充分的内部一致性测试
医学影像处理对这类微小差异通常不敏感
保持代码简洁性比强制统一两种实现更重要

技术启示

这个问题给我们带来了一些有价值的启示：

框架设计：在混合使用NumPy和PyTorch时，数值计算的一致性需要特别关注
测试策略：对于数值计算，应该设置合理的比较阈值而非追求完全一致
工程权衡：在精度和工程实用性之间需要做出合理平衡

总结

MONAI团队通过这个问题深入探讨了深度学习框架中数值计算一致性的重要性，并做出了合理的工程决策。这种处理方式既保证了框架的稳定性，又避免了过度工程化，体现了成熟开源项目的技术决策智慧。

MONAI

AI Toolkit for Healthcare Imaging

项目地址：https://gitcode.com/GitHub_Trending/mo/MONAI

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。

rainbond

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理