EasyEdit项目中的知识编辑方法性能对比与分析

2025-07-03 20:52:01作者：凌朦慧Richard

An Easy-to-use Knowledge Editing Framework for LLMs.

项目地址：https://gitcode.com/gh_mirrors/ea/EasyEdit

在知识编辑领域，WISE、MEMIT和GRACE是三种重要的模型编辑方法。本文将通过实验数据分析这些方法在ZSRE任务上的表现差异，并探讨影响性能的关键因素。

实验设计与方法对比

实验采用了EasyEdit框架对三种编辑方法进行测试，重点关注以下几个关键指标：

重写准确率（rewrite_acc）：衡量模型执行知识更新的能力
重述准确率（rephrase_acc）：评估模型对改写后问题的理解能力
局部性（locality_acc）：检验模型保持未修改知识的能力

性能表现差异分析

从实验结果观察，三种方法展现出不同的特性：

WISE方法表现出色：
- 重写准确率达到99.75%
- 重述准确率为97.6%
- 局部性为24.8%
GRACE方法特点：
- 重写准确率99.33%
- 但重述准确率仅0.25%
- 局部性44.5%
MEMIT方法表现：
- 重写准确率93.99%
- 重述准确率91.43%
- 局部性16.8%

关键影响因素探讨

实验发现两个重要技术细节会显著影响结果：

评估指标选择：
- 默认使用基于token的精确匹配（exact match）
- 对于幻觉任务，建议使用困惑度（perplexity）指标
- 不同评估指标会导致结果差异
预处理文件处理：
- GRACE方法需要独立的预处理文件
- 使用相同预处理文件会导致局部性下降约30%
- 正确配置下GRACE可实现100%局部性

最佳实践建议

基于实验结果，我们建议：

对于高精度知识更新需求，优先考虑WISE方法
当需要保持原始知识时，GRACE方法在正确配置下表现最佳
评估指标应根据任务特性选择，常规任务使用token级精确匹配
不同编辑方法需要特定的预处理文件处理方式

这些发现为知识编辑领域的研究者和实践者提供了有价值的参考，帮助选择最适合特定场景的编辑方法。未来研究可以进一步探索这些方法在不同模型架构和任务类型上的表现差异。

An Easy-to-use Knowledge Editing Framework for LLMs.

项目地址：https://gitcode.com/gh_mirrors/ea/EasyEdit

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理