2025最新Ragas安装指南：5分钟搭建专业RAG评估环境

2026-02-05 04:35:29作者：苗圣禹Peter

你是否还在为RAG（检索增强生成）系统的评估环境搭建而烦恼？是否遇到过安装过程中依赖冲突、版本不兼容等问题？本文将带你5分钟内完成Ragas的安装与配置，让你轻松拥有专业的RAG评估能力。读完本文后，你将能够：掌握Ragas的多种安装方式、解决常见的依赖问题、了解不同安装模式的适用场景，并成功运行第一个RAG评估示例。

一、快速安装：基础版Ragas

Ragas提供了简单快捷的pip安装方式，适用于大多数用户。打开终端，输入以下命令即可完成基础版Ragas的安装：

pip install ragas

这条命令会从Python Package Index（PyPI）下载并安装最新稳定版的Ragas。安装完成后，你就可以开始使用Ragas的核心功能进行RAG系统评估了。

二、尝鲜体验：安装开发版Ragas

如果你想体验Ragas的最新功能，可以从GitHub仓库的main分支安装开发版。使用以下命令：

pip install git+https://gitcode.com/gh_mirrors/ra/ragas.git

开发版包含了最新的特性和改进，但可能不如稳定版成熟。适合那些希望提前体验新功能，并愿意面对潜在问题的用户。

三、贡献开发：源码安装Ragas

如果你计划为Ragas贡献代码或进行自定义修改，建议采用源码安装方式。这种方式允许你在修改代码后立即看到效果，无需重新安装。步骤如下：

克隆Ragas仓库：

git clone https://gitcode.com/gh_mirrors/ra/ragas.git

cd ragas
pip install -e .

使用-e选项进行可编辑安装后，你对源码的任何修改都会直接反映到已安装的Ragas中，非常适合开发和调试。

四、处理依赖：解决版本冲突

Ragas依赖于多个第三方库，其中LangChain和OpenAI相关的依赖可能会出现版本冲突。根据官方文档的建议，如果你使用langchain_openai（例如ChatOpenAI），请显式安装langchain-core和langchain-openai以避免版本不匹配：

pip install -U "langchain-core>=0.2,<0.3" "langchain-openai>=0.1,<0.2" openai

你可以根据自己的环境调整版本范围，但显式安装这两个库有助于防止严格的依赖冲突。

从pyproject.toml中可以看到，Ragas的核心依赖包括numpy、datasets、tiktoken、pydantic等。这些依赖会在安装Ragas时自动安装，但如果你遇到任何依赖问题，可以查看该文件了解详细的依赖要求。

五、验证安装：检查Ragas版本

安装完成后，你可以通过以下命令检查Ragas的版本，以确认安装是否成功：

ragas --version

如果安装成功，终端会显示当前安装的Ragas版本号。

六、安装可选功能：扩展Ragas能力

Ragas提供了多种可选功能，可以通过安装可选依赖来启用。例如，如果你需要使用所有可选功能，可以安装：

pip install ragas[all]

其他可选功能包括tracing、gdrive和ai-frameworks等，你可以根据需要选择安装：

tracing：用于跟踪和监控，依赖langfuse和mlflow
gdrive：用于Google Drive集成，依赖google-api-python-client等
ai-frameworks：用于与其他AI框架集成，如haystack-ai

具体的可选依赖列表可以在pyproject.toml中查看。

七、Ragas工作流简介

安装完成后，让我们快速了解一下Ragas的工作流程。Ragas是一个用于RAG管道评估的框架，其核心功能包括评估数据集、评估指标和测试集生成等。

Ragas工作流

上图展示了Ragas的基本工作流程。你可以使用Ragas生成测试集，然后对RAG系统的输出进行评估，得到包括忠实度、相关性、连贯性等多个维度的评估指标。

八、开始使用：运行第一个评估

安装并配置好Ragas后，你可以参考快速开始指南运行你的第一个RAG评估。通常，一个基本的评估流程包括准备评估数据、定义评估指标和运行评估等步骤。

以下是一个简单的示例代码，展示了如何使用Ragas评估RAG系统的输出：

from ragas import evaluate
from datasets import Dataset

# 准备评估数据
data = {
    "question": ["What is the capital of France?"],
    "answer": ["The capital of France is Paris."],
    "contexts": [["Paris is the capital and most populous city of France."]],
}
dataset = Dataset.from_dict(data)

# 运行评估
result = evaluate(dataset, metrics=["faithfulness", "answer_relevancy"])
print(result)