EasyEdit项目中ROME算法执行时的AttributeError问题解析

2025-07-03 11:26:23作者：羿妍玫Ivan

[ACL 2024] An Easy-to-use Knowledge Editing Framework for LLMs.

项目地址：https://gitcode.com/gh_mirrors/ea/EasyEdit

问题背景

在使用EasyEdit项目中的ROME算法进行模型编辑时，用户遇到了一个AttributeError错误，提示"Can't pickle local object 'length_collation..collate_fn'"。这个问题特别出现在启用了mom2_adjustment参数的情况下，当尝试计算Wikipedia数据集的协方差矩阵时发生。

错误分析

该错误的核心在于Python的pickle模块无法序列化局部函数。具体来说，当EasyEdit尝试使用多进程处理数据时，需要将数据加载器中的collate_fn函数序列化以传递给子进程。然而，这个collate_fn函数被定义为一个局部函数（在另一个函数内部定义），导致pickle无法正确序列化。

技术细节

多进程数据加载：PyTorch的DataLoader默认使用多进程来加速数据加载，这需要能够序列化所有相关对象。
局部函数序列化限制：Python的pickle模块无法序列化定义在其他函数内部的局部函数，这是Python语言本身的限制。
ROME算法特性：当启用mom2_adjustment时，算法需要计算第二矩矩阵的逆，这个过程涉及从Wikipedia等大型数据集中采样数据。

解决方案

经过项目维护者的分析，确认这是一个与机器多线程处理相关的bug。推荐的解决方案是：

修改layer_stats.py文件中的DataLoader初始化部分，将num_workers参数设置为0。这会强制使用单进程数据加载，避免了多进程序列化局部函数的问题。

# 修改前
loader = DataLoader(ds, batch_size=batch_size, collate_fn=collate_fn)

# 修改后
loader = DataLoader(ds, batch_size=batch_size, collate_fn=collate_fn, num_workers=0)

影响与注意事项

性能影响：将num_workers设为0会降低数据加载速度，但对于大多数编辑操作来说，这个影响是可以接受的。
替代方案：如果确实需要多进程加速，可以考虑将collate_fn函数定义为全局函数，而不是局部函数。
模型兼容性：这个问题在GPT-2 XL模型上也会出现，说明与模型类型关系不大，主要是数据处理流程的问题。

最佳实践建议

对于小型数据集或少量编辑操作，可以直接使用num_workers=0的配置。
对于大规模编辑任务，建议重构代码，将collate_fn函数移出到模块级别，使其可以被正确序列化。
在Windows系统上使用多进程时，要特别注意这种序列化问题，因为Windows的多进程实现与Unix-like系统有所不同。

这个问题的解决展示了在深度学习项目中处理数据加载和多进程时需要注意的技术细节，特别是在涉及复杂的数据预处理流程时。理解这些底层机制有助于开发者更好地调试和优化模型训练和编辑流程。

[ACL 2024] An Easy-to-use Knowledge Editing Framework for LLMs.

项目地址：https://gitcode.com/gh_mirrors/ea/EasyEdit

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

deepin linux kernel

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

flutter_flutter

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统