FlashRAG项目复现过程中的关键问题与解决方案

2025-07-03 06:54:07作者：沈韬淼Beryl

显存不足问题的优化策略

在复现FlashRAG项目中的LongLLMLingua和RECOMP-abstractive方法时，研究人员普遍遇到了显存不足的问题。这个问题源于同时运行摘要模型和生成器模型会占用约30GB显存，特别是在使用4张24GB显存的4090显卡时尤为明显。

项目团队通过优化代码逻辑解决了这一问题，主要改进包括：

在复现Ret-Robust和FLARE方法时，出现了文档检索结果处理错误。根本原因是检索返回的doc_item是字典组成的列表而非单一字典，导致后续处理逻辑出错。

项目团队通过以下方式解决了这些问题：

REPLUG方法在运行时报出参数异常，主要问题在于：

解决方案是改用fschat框架运行REPLUG方法，该框架能更好地支持所需的生成逻辑。

研究人员在复现论文结果时发现普遍存在性能差异，主要影响因素包括：

在保存中间结果时出现了float32类型无法JSON序列化的问题。这是由于intermediate data中存在numpy类型数据导致的。项目团队通过类型转换处理修复了这一问题，确保所有数值类型都能正确序列化。

特别需要注意的是，复现论文结果时不能使用quick start的默认索引和语料库，必须按照说明文档重新构建索引。这一步骤对最终结果有显著影响，忽略可能导致10个点以上的性能差异。

通过系统性地解决这些问题，研究人员能够更准确地复现FlashRAG项目的实验结果，为后续研究和应用奠定坚实基础。

登录后查看全文