Ragas项目中Faithfulness指标使用问题解析

2025-05-26 07:23:27作者：胡易黎Nicole

Evaluation framework for your Retrieval Augmented Generation (RAG) pipelines

项目地址：https://gitcode.com/gh_mirrors/ra/ragas

问题背景

在Ragas项目最新版本0.2.7中，用户发现官方文档中关于Faithfulness评估指标的示例代码无法正常运行。这是一个典型的API变更导致文档滞后的案例，值得开发者注意。

问题分析

原始示例代码尝试从ragas.database_schema导入SingleTurnSample类，但实际在0.2.7版本中，这个类已经被移动到了ragas.dataset_schema模块。这种模块重构在软件开发过程中很常见，但需要及时更新相关文档。

解决方案

正确的使用方式需要做以下调整：

导入路径修正：from ragas.dataset_schema import SingleTurnSample
添加必要的LLM配置：需要配置评估使用的语言模型
确保环境变量设置正确

完整示例代码

import os
from dotenv import load_dotenv

# 加载环境变量
load_dotenv()

from ragas.dataset_schema import SingleTurnSample
from ragas.metrics import Faithfulness

# 创建评估样本
sample = SingleTurnSample(
    user_input="第一届超级碗是什么时候举办的？",
    response="第一届超级碗于1967年1月15日举行",
    retrieved_contexts=[
        "第一届AFL-NFL世界冠军赛于1967年1月15日在洛杉矶纪念体育馆举行。"
    ],
)

# 配置评估模型
llm = ChatOpenAI(model="gpt-4o-mini")
evaluator_llm = LangchainLLMWrapper(llm)
scorer = Faithfulness(llm=evaluator_llm)

# 执行评估
await scorer.single_turn_ascore(sample)

技术要点

评估流程：Faithfulness指标用于评估生成回答与检索上下文之间的一致性
模型配置：必须指定评估使用的语言模型，这是保证评估质量的关键
异步评估：使用await关键字表明这是一个异步操作

最佳实践建议

定期检查文档与代码版本的兼容性
在升级版本时注意API变更日志
对于评估类项目，保持评估模型的稳定性很重要

总结

这个问题展示了开源项目中常见的文档与代码同步挑战。开发者在使用Ragas这类评估框架时，应该注意版本兼容性问题，并理解评估流程中各组件的作用。正确的Faithfulness评估需要合理配置评估模型，并确保数据结构符合最新API要求。

Evaluation framework for your Retrieval Augmented Generation (RAG) pipelines

项目地址：https://gitcode.com/gh_mirrors/ra/ragas

登录后查看全文

项目优选

收起

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

flutter_flutter

昇腾LLM分布式训练框架

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

ohos_react_native

React Native鸿蒙化仓库

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统