首页
/ Captum v0.8.0发布:模型可解释性工具的重大升级

Captum v0.8.0发布:模型可解释性工具的重大升级

2025-06-11 01:38:19作者:管翌锬

项目简介

Captum是PyTorch生态系统中的一个重要工具库,专注于为深度学习模型提供可解释性分析。作为模型解释领域的专业工具,Captum通过多种算法帮助研究人员和开发者理解模型决策背后的原因,包括特征重要性分析、神经元贡献度计算等。最新发布的v0.8.0版本带来了多项重要改进,特别是在数据归因和特征归因方面有显著增强。

数据归因新功能:影响力函数

v0.8.0版本引入了两种计算"无穷小"影响力分数的新实现,这是理解模型预测与训练数据关系的重要工具。

理论基础

影响力分数近似回答了这样一个问题:如果在训练过程中对某个训练样本进行微小权重调整并重新训练模型,那么给定测试样本的损失会如何变化。数学上,这个影响力分数表示为∇θL(x)'H⁻¹∇θL(z),其中∇θL(x)是训练样本x的损失梯度,H是模型参数的Hessian矩阵。

两种实现方式

  1. NaiveInfluenceFunction:精确但计算较慢的实现,适合需要"基准"结果的研究场景。它通过显式计算Hessian矩阵及其特征向量来获得结果。

  2. ArnoldiInfluenceFunction:基于Schioppa等人论文的高效实现,使用Arnoldi迭代在不显式构建Hessian矩阵的情况下计算top-k特征值/特征向量,显著提高了计算效率。

这两种实现都采用了低秩近似技术来避免数值问题,并生成低维的"影响力嵌入",使得计算影响力分数变得高效。对于大型模型,这种方法比传统的LISSA方法快几个数量级。

特征归因功能增强

异步计算支持

新版本为多个特征归因方法添加了异步计算支持,利用PyTorch的futures机制实现,包括:

  • FeatureAblation
  • FeaturePermutation
  • ShapleyValueSampling
  • ShapleyValues

这一改进使得这些方法在大规模数据上的计算更加高效。

大语言模型(LLM)归因增强

针对当前热门的LLM解释需求,v0.8.0版本增加了:

  1. 新的梯度归因方法支持:
    • LayerGradientXActivation
    • LayerGradientShap
  2. 支持"键值"缓存的扰动归因
  3. 梯度参数传递支持,允许更灵活的梯度计算配置

可视化与教程

新增了LLM归因教程(Llama2_LLM_Attribution.ipynb),并改进了归因结果的可视化效果,提升了文本可读性和美学表现。

类型注解全面升级

v0.8.0版本对全库的类型注解进行了大规模改进,全面支持最新版本的pyre和mypy类型检查。这一改进使得:

  • 代码静态分析更加准确
  • IDE智能提示更加完善
  • 开发者体验显著提升

其他重要改进

  1. 设备支持:修复了MPS后端在IntegratedGradients中的支持问题,增强了跨设备兼容性。

  2. 代码质量

    • 采用了最新版black代码格式化工具
    • 大幅提升了测试覆盖率
    • 优化了多个函数的复杂度
  3. 性能优化:在LLM归因调用间释放自动微分图,减少内存占用。

  4. 教程修复:修正了Titanic基础解释教程中的数据类型问题。

环境要求变更

随着版本更新,Captum v0.8.0调整了环境要求:

  • 不再支持Python 3.8以下版本
  • 不再支持PyTorch 1.10以下版本
  • 计划在下个主要版本中弃用Captum Insights功能

总结

Captum v0.8.0作为模型可解释性工具的重要更新,在数据归因、特征归因特别是LLM解释方面带来了显著增强。新引入的影响力函数为理解训练数据对模型预测的影响提供了有力工具,而全面的类型注解改进则提升了开发体验。这些改进使得Captum在深度学习可解释性领域继续保持领先地位,为研究人员和开发者提供了更加强大、易用的分析工具。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
163
2.05 K
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
8
0
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
199
279
leetcodeleetcode
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
60
16
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
951
557
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
96
15
apintoapinto
基于golang开发的网关。具有各种插件,可以自行扩展,即插即用。此外,它可以快速帮助企业管理API服务,提高API服务的稳定性和安全性。
Go
22
0
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Python
77
71
giteagitea
喝着茶写代码!最易用的自托管一站式代码托管平台,包含Git托管,代码审查,团队协作,软件包和CI/CD。
Go
17
0