Ragas项目中的测试集生成异常问题分析与解决方案

2025-05-26 21:42:38作者：裴麒琰

Supercharge Your LLM Application Evaluations 🚀

项目地址：https://gitcode.com/gh_mirrors/ra/ragas

问题背景

在使用Ragas项目进行RAG(检索增强生成)系统评估时，开发者经常需要生成测试数据集来验证系统性能。然而，在最新版本的Ragas(0.1.20)中，许多用户遇到了测试集生成模块的异常问题，主要表现为"ExceptionInRunner"错误，导致测试集生成过程中断。

问题现象

当开发者尝试使用generate_with_langchain_docs或generate_with_llamaindex_docs方法生成测试集时，系统会抛出"ExceptionInRunner: The runner thread which was running the jobs raised an exception"错误。即使设置了raise_exceptions=False参数，问题依然存在。

技术分析

这个问题主要涉及以下几个技术层面：

异步执行机制：Ragas的测试集生成模块采用了异步执行方式，在多线程环境下运行时可能出现事件循环冲突。
依赖版本兼容性：与LangChain生态组件的版本兼容性问题可能导致底层执行异常。
文档处理流程：在将PDF文档转换为测试集的过程中，文档解析和嵌入生成环节可能出现异常。

解决方案

经过技术验证，目前有以下几种可行的解决方案：

版本降级方案：
- 将相关依赖包降级到特定版本组合
- 推荐版本组合：
  - langchain 0.2.16
  - langchain-community 0.2.0
  - langchain-core 0.2.41
  - langchain-openai 0.1.20
  - langchain-text-splitters 0.2.4
异步处理优化：
- 在Jupyter Notebook环境中，使用nest_asyncio解决事件循环冲突
- 示例代码：
```
import nest_asyncio
nest_asyncio.apply()
```
参数调整：
- 设置is_async=False关闭异步模式
- 确保raise_exceptions=False参数正确传递

性能优化建议

虽然版本降级可以解决问题，但用户反馈测试集生成速度明显下降。针对此问题，可以考虑以下优化方向：

分批处理文档：将大文档拆分为小批次处理，减少单次生成压力
调整LLM参数：适当提高生成温度(temperature)参数，增加生成多样性同时可能提高速度
硬件加速：确保正确使用GPU加速，特别是对于嵌入模型
缓存机制：对中间结果进行缓存，避免重复计算

总结

Ragas作为RAG系统评估的重要工具，其测试集生成模块在实际应用中仍存在一些稳定性问题。通过合理的版本管理和参数配置，开发者可以规避当前的主要异常问题。同时，社区也在积极解决这些技术挑战，未来版本有望提供更稳定高效的测试集生成能力。

对于性能问题，建议开发者根据实际场景调整生成策略，在稳定性和效率之间找到平衡点。随着项目的持续发展，这些问题有望得到根本性解决。

Supercharge Your LLM Application Evaluations 🚀

项目地址：https://gitcode.com/gh_mirrors/ra/ragas

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。