Ragas项目中异步评估指标的正确使用方法

2025-05-26 12:48:57作者：贡沫苏Truman

在Ragas项目中，开发者经常会使用LLM（大型语言模型）来构建各种评估指标。近期有用户反馈在使用AspectCritic指标时遇到了异步调用的问题，本文将深入分析这一问题并提供解决方案。

问题背景

Ragas是一个用于评估AI生成内容质量的框架，其中AspectCritic类允许用户创建自定义的评估指标。当用户尝试使用single_turn_score方法时，可能会遇到两种调用方式：

直接同步调用：metric.single_turnscore(test_data)
异步调用：await metric.single_turn_score(test_data)

第一种方式可以正常工作，而第二种方式则会产生语法错误"await outside function"。

技术分析

这个问题本质上不是Ragas框架的bug，而是Python异步编程的基本规则。在Python中，await关键字只能在异步函数(async def)内部使用。当开发者尝试在全局作用域或普通函数中直接使用await时，解释器会抛出语法错误。

Ragas框架的single_turn_score方法设计为异步方法，这是为了：

更好地处理与LLM的交互，这些交互通常是I/O密集型的
提高资源利用率，允许在等待LLM响应时执行其他任务
与现代异步Web框架更好地集成

解决方案

要正确使用异步评估方法，开发者需要将调用代码包裹在异步上下文中。以下是几种正确的使用方式：

1. 在异步函数中使用

async def evaluate():
    metric = AspectCritic(
        name="summary_accuracy",
        llm=evaluator_llm,
        definition="Verify if the summary is accurate.",
    )
    test_data = SingleTurnSample(**test_data)
    score = await metric.single_turn_score(test_data)
    return score

2. 使用asyncio.run运行异步代码

import asyncio

def main():
    metric = AspectCritic(
        name="summary_accuracy",
        llm=evaluator_llm,
        definition="Verify if the summary is accurate.",
    )
    test_data = SingleTurnSample(**test_data)
    score = asyncio.run(metric.single_turn_score(test_data))
    print(score)

3. 在Jupyter notebook中使用

Jupyter notebook原生支持异步执行，可以直接在cell中使用await：

score = await metric.single_turn_score(test_data)

最佳实践建议

统一代码风格：如果项目主要使用异步编程，建议将所有相关函数都定义为异步函数
错误处理：异步调用时不要忘记添加try-except块处理可能的异常
性能考虑：对于批量评估，考虑使用asyncio.gather并行执行多个评估任务
文档检查：使用前仔细阅读框架文档，了解每个方法是同步还是异步的

总结

Ragas框架采用异步设计是为了更好地处理与LLM的交互，提高评估效率。开发者在使用时需要遵循Python的异步编程规范，将await调用放在适当的异步上下文中。理解这一点后，就能充分利用Ragas提供的异步评估能力，构建高效的AI内容评估流程。

ragas

Evaluation framework for your Retrieval Augmented Generation (RAG) pipelines

项目地址：https://gitcode.com/gh_mirrors/ra/ragas

登录后查看全文