EasyEdit项目中Fine-Tuning实现优化问题的技术解析

2025-07-03 14:01:03作者：幸俭卉

An Easy-to-use Knowledge Editing Framework for LLMs.

项目地址：https://gitcode.com/gh_mirrors/ea/EasyEdit

在知识编辑领域，Fine-Tuning（微调）是一种基础但重要的方法。近期在EasyEdit项目中发现并修复了其FT-L（Fine-Tuning-Locality）实现中的一个关键问题，这对知识编辑的效果评估具有重要意义。

问题背景

在原始实现中，FT-L采用了ROME论文中的优化目标计算方法：仅通过输入prompt的最后一个token来计算负对数似然损失（nll loss）。这种方法存在一个潜在问题——当编辑目标（target）包含多个token时，模型会同时最大化所有目标token在prompt最后一个位置出现的概率，而不是按照自回归方式逐个预测目标token。

技术影响分析

这种实现方式会导致两个主要问题：

训练目标与标准语言模型训练不一致，不符合自回归生成的自然规律
在多token目标场景下，模型学习到的分布与实际应用时的生成过程存在偏差

解决方案

EasyEdit团队针对此问题提供了两种实现方案：

prompt_last：保持与ROME论文一致的实现方式，仅通过最后一个token计算损失
target_new：标准的自回归方法，使用交叉熵损失函数逐个预测目标token

其中，target_new方法被命名为FT-M（Fine-Tuning-MultiToken），作为更强大的知识编辑基线方法。

实验发现

尽管优化目标进行了修正，实验表明FT-L方法仍然难以同时兼顾可靠性和局部性：

高可靠性往往意味着模型权重被完全破坏
高局部性无法保证高编辑成功率

这些发现与原始论文中的结论保持一致，说明Fine-Tuning方法在知识编辑任务中存在的固有局限性。

实践建议

对于使用EasyEdit进行知识编辑研究的用户，建议：

根据实验需求选择合适的优化目标
对于多token编辑场景，优先考虑FT-M方法
注意评估时需同时考虑编辑成功率和模型保留原有知识的能力

该问题的发现和修复展示了开源社区协作的价值，也提醒研究者在基线方法实现时需要仔细验证其合理性。EasyEdit团队表示将在更新的arXiv版本中反映这些新的实验结果，为知识编辑领域提供更可靠的基准方法。

An Easy-to-use Knowledge Editing Framework for LLMs.

项目地址：https://gitcode.com/gh_mirrors/ea/EasyEdit

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统