解读《可解释机器学习》中影响函数权重的数学修正

2025-06-10 10:14:40作者：董灵辛Dennis

在《可解释机器学习》项目中的10.5.2章节，关于影响函数(IF)的数学表达式中出现了一个需要修正的权重因子问题。这个问题最初由Koh和Liang在2017年的论文中提出，并在论文的第二个版本(v2)中进行了修正。

原始问题描述

原书中给出的表达式为：

θ̂_ε,z = argmin_θ∈Θ (1-ε)(1/n)∑L(z_i,θ) + εL(z,θ)

这个表达式用于计算当训练集中某个点z的权重被上调ε倍时，模型参数θ的估计值。其中：

L(z_i,θ)表示在参数θ下数据点z_i的损失
ε是上调权重因子
n是训练集大小

修正后的表达式

根据Koh和Liang论文v2版本的修正，正确的表达式应该是：

θ̂_ε,z = argmin_θ∈Θ (1/n)∑L(z_i,θ) + εL(z,θ)

关键区别在于移除了(1-ε)这个权重因子。这个修正反映了更合理的数学表达，因为：

第一项(1/n)∑L(z_i,θ)代表原始训练集的平均损失
第二项εL(z,θ)代表对特定点z的损失进行加权
两部分的权重是独立的，不需要在第一项上施加(1-ε)的补偿

技术背景

影响函数是鲁棒统计学中的重要工具，用于衡量单个数据点对模型参数的影响。其核心思想是通过对目标函数进行微小扰动(perturbation)，观察模型参数的变化。

在机器学习中，影响函数的计算通常涉及：

定义原始目标函数(如经验风险最小化)
对特定数据点进行加权扰动
计算扰动后目标函数的最小值点
通过泰勒展开近似参数变化

为什么修正很重要

原始表达式中的(1-ε)因子会导致：

数学推导不一致：当ε→0时，虽然表达式会收敛到原始解，但中间推导步骤会出现问题
实际计算偏差：在计算影响函数时，这个额外因子会影响梯度和海森矩阵的计算
理论解释困难：难以与经典的鲁棒统计学理论保持一致

修正后的表达式更符合影响函数的理论基础，确保了：

当ε=0时，完全恢复原始问题
当ε增加时，只增加特定点的影响
与一阶、二阶导数的计算保持一致

实际影响

这个修正虽然看似微小，但对于：

实现影响函数计算时很重要
保证理论推导的正确性
确保数值实验的准确性

特别是在计算影响函数的实际应用中，如：

模型调试
异常检测
数据重要性评估
对抗样本分析

都需要使用正确的目标函数表达式。

总结

这个数学修正提醒我们，在将理论研究转化为实际应用时，需要仔细验证每个数学表达式的准确性。即使是看似微小的权重因子差异，也可能对最终结果产生重要影响。对于使用影响函数进行模型分析的研究者和实践者，应当采用修正后的表达式来确保结果的正确性。

interpretable-ml-book

Book about interpretable machine learning

项目地址：https://gitcode.com/gh_mirrors/in/interpretable-ml-book

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

986

248