SHAP库中使用Logit链接函数时出现NaN值的分析与解决方案

2025-05-08 01:15:40作者：温艾琴Wonderful

背景介绍

在机器学习模型解释性领域，SHAP（SHapley Additive exPlanations）是一种广泛使用的解释工具。它基于合作理论中的Shapley值概念，为每个特征分配一个重要性值，解释模型对单个预测的贡献。在使用SHAP进行模型解释时，选择合适的链接函数（link function）是一个重要考虑因素。

问题现象

当使用SHAP的KernelExplainer进行模型解释，并设置link="logit"参数时，可能会遇到以下两种情况：

SHAP值计算结果中出现NaN值
在某些情况下程序会直接抛出"ZeroDivisionError: float division by zero"错误

这种现象特别容易发生在分类任务中，当模型的predict_proba方法输出概率值为0或1的极端情况时。

数学原理分析

Logit链接函数的数学定义为：

\text{logit}(p) = \ln\left(\frac{p}{1 - p}\right)

从数学角度看，当p=0或p=1时，这个表达式会出现以下问题：

当p=0时，分母1-p=1，但分子为0，导致0/1=0，然后ln(0)无定义
当p=1时，分母1-p=0，导致1/0无定义

这正是SHAP计算中出现NaN值和除以零错误的根本原因。

解决方案探讨

针对这个问题，可以考虑以下几种解决方案：

1. 概率裁剪法

在应用logit变换前，对概率值进行裁剪，确保它们不会达到0或1的极端值：

@staticmethod
def f(x, eps=1e-15):
    x = np.clip(x, eps, 1 - eps)
    return np.log(x / (1 - x))

这种方法简单有效，但需要注意：

裁剪阈值eps的选择需要谨慎，太小可能仍会导致数值不稳定，太大会影响结果的准确性
这种方法相当于对模型的原始输出进行了微小调整，理论上会引入一定的偏差

2. 使用其他链接函数

如果不需要特定的logit尺度解释，可以考虑使用其他链接函数：

link="identity"：直接使用概率尺度解释
link="log"：使用对数尺度解释

3. 增加背景样本数量

在某些情况下，增加背景样本的数量可以降低出现极端概率值的可能性，从而避免这个问题。

实际应用建议

在实际应用中，建议：

首先明确是否需要logit尺度的解释。如果只是为了特征重要性排序，identity链接可能就足够了
如果确实需要logit尺度，建议采用概率裁剪法，并记录使用的eps值
对于关键应用，可以比较不同链接函数的结果差异，确保解释的稳定性
考虑模型的校准性，极端概率值可能表明模型需要校准

结论

SHAP库中使用logit链接函数时出现的NaN值问题，源于logit变换在概率边界处的数学特性。通过合理的数值处理技术，如概率裁剪法，可以有效解决这个问题。理解这一现象的数学本质，有助于我们在模型解释工作中做出更明智的技术选择，确保解释结果的可靠性和稳定性。

shap

A game theoretic approach to explain the output of any machine learning model.

项目地址：https://gitcode.com/gh_mirrors/sh/shap

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140