首页
/ 探索透明化的模型解释:OpenXAI——你的AI可解释性评估利器

探索透明化的模型解释:OpenXAI——你的AI可解释性评估利器

2024-05-30 06:42:32作者:农烁颖Land

官方网站 | 论文预印本

OpenXAI 是首个轻量级的通用库,专注于系统性地评估基于特征解释方法的模型解释质量。这个开源项目支持新数据集(合成与现实世界)和解释方法的开发,强调在可复现、透明的评价中推动AI可解释性研究的进步。

OpenXAI 提供了丰富多样的高风险数据集、模型以及评估指标,并通过简单易用的API接口,使研究人员和实践者只需几行代码即可进行解释方法的基准测试和比较。

更新动态

  • 0.0.0: OpenXAI 正式上线!现在,你可以提交结果,用于对比后验解释方法在特定评价指标上的表现。查看 快速入门指南
  • OpenXAI 的白皮书已发布于 arXiv

OpenXAI 独特特性

  • 跨领域的XAI研究: 包含7种最先进的特征归因方法以及22个量化性能的指标。此外,提供了灵活的合成数据生成器,可以生成各种规模、复杂度和维度的数据集,以构造地面真实解释。
  • 数据功能: 提供广泛的数据函数,包括数据评估器、有意义的数据分割、解释方法和评价指标。
  • 排行榜: 提供第一个公共的AI解释排行榜,促进透明度,让用户轻松比较多个解释方法的表现。
  • 开源倡议: 开源项目,易于扩展。

安装

使用 pip 可以轻松安装 OpenXAI 到本地环境:

pip install -e .

OpenXAI 设计理念

OpenXAI 是一个开放源代码生态系统,包括为XAI准备的数据集、状态-of-the-art的解释方法实现、评价指标、排行榜和文档,旨在推动解释方法的透明和比较。它能够用来基准测试新的解释方法,并将其整合到框架和排行榜中。通过系统化且高效地评估现有和新的解释方法,OpenXAI 能够指导并加速AI可解释性领域的研究进展。

OpenXAI 数据加载器

OpenXAI 提供 DataLoader 类,用于加载内置或自定义的数据集,确保它们对XAI就绪。具体来说,该类接受现有的OpenXAI数据集名称或.csv文件名作为输入,输出可供训练模型的训练集,生成模型局部解释的测试集,以及如果有的话,地面真实解释。如果数据集已经预设了训练和测试切分,它将从这些切分加载。否则,它会随机将整个数据集分为70%的训练集和30%的测试集。用户还可以自定义训练/测试拆分的比例。

以下示例说明如何导入 DataLoader 类并加载现有的OpenXAI数据集:

from openxai.dataloader import return_loaders
loader_train, loader_test = return_loaders(data_name='german', download=True)
# 获取测试数据集中一个输入实例
inputs, labels = iter(loader_test).next()

OpenXAI 预训练模型

我们还预训练了两类预测模型(例如,不同复杂程度的深度神经网络和逻辑回归模型),并将它们集成到OpenXAI框架内,以便用于基准测试解释方法。以下代码片段展示了如何使用我们的 LoadModel 类加载OpenXAI的预训练模型:

from openxai import LoadModel
model = LoadModel(data_name= 'german', ml_model='ann', pretrained=True)

向OpenXAI框架添加更多预训练模型很简单,只需上传关于模型架构和参数详细信息的特定模板文件。用户也可以填写简单的表单,提供有关模型架构和参数的详细信息,请求将自定义预训练模型集成到OpenXAI框架中。

OpenXAI 解释器

所有包含在OpenXAI中的解释方法都可通过 Explainer 类直接访问,用户只需要指定方法名称,就可以调用相应的方法生成解释。用户可以通过扩展 Explainer 类并在 get_explanations 函数中包含他们的方法代码,轻松将自己的自定义解释方法集成到OpenXAI框架中。

from openxai import Explainer
exp_method = Explainer(method= 'lime',model=model, dataset_tensor=inputs)
explanations= exp_method.get_explanation(inputs, labels)

用户可以通过填写表格,提供他们方法的GitHub链接和方法概述,请求将自定义方法纳入OpenXAI库。

OpenXAI 评估

使用评估指标进行基准测试非常简单。以下代码片段描述了如何调用RIS指标。用户可以通过填写表格,提供其指标的GitHub链接和指标概述,轻松将自定义评估指标纳入OpenXAI。请注意,代码应以接受数据实例、相应模型预测、它们的解释、OpenXAI的模型对象作为输入并返回数值分数的函数形式提供。

from openxai import Evaluator
metric_evaluator = Evaluator(input_dict, inputs, labels, model, exp_method)
score = metric_evaluator.evaluate(metric='RIS')

OpenXAI 指标

OpenXAI 包括用于计算地面真实解释(即逻辑回归模型系数)与由先进方法生成的解释一致性的多种指标,如:

  • 功能一致性(FA)
  • 排序一致性(RA)
  • 符号一致性(SA)
  • 签名排序一致性(SRA)
  • 排序相关性(RC)
  • 对比排序一致性(PRA)

还有用于衡量预测一致性、稳定性和公平性的其他指标。

OpenXAI 排行榜

每个解释方法在OpenXAI中都是一个基准,我们提供了详细的排行榜,展示每个指标上的性能比较。


OpenXAI 以其全面的功能和易用性,正在引领AI可解释性的新篇章。无论你是研究人员还是实践者,OpenXAI都能成为你在探索模型解释领域的重要工具。立即加入,一起迈向更透明的AI未来!

登录后查看全文
热门项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
895
531
KonadoKonado
Konado是一个对话创建工具,提供多种对话模板以及对话管理器,可以快速创建对话游戏,也可以嵌入各类游戏的对话场景
GDScript
21
13
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
7
0
note-gennote-gen
一款跨平台的 Markdown AI 笔记软件,致力于使用 AI 建立记录和写作的桥梁。
TSX
85
4
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
372
387
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.09 K
0
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
94
15
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
625
60
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
401
377