2025最新Ragas安装指南:5分钟搭建专业RAG评估环境
你是否还在为RAG(检索增强生成)系统的评估环境搭建而烦恼?是否遇到过安装过程中依赖冲突、版本不兼容等问题?本文将带你5分钟内完成Ragas的安装与配置,让你轻松拥有专业的RAG评估能力。读完本文后,你将能够:掌握Ragas的多种安装方式、解决常见的依赖问题、了解不同安装模式的适用场景,并成功运行第一个RAG评估示例。
一、快速安装:基础版Ragas
Ragas提供了简单快捷的pip安装方式,适用于大多数用户。打开终端,输入以下命令即可完成基础版Ragas的安装:
pip install ragas
这条命令会从Python Package Index(PyPI)下载并安装最新稳定版的Ragas。安装完成后,你就可以开始使用Ragas的核心功能进行RAG系统评估了。
二、尝鲜体验:安装开发版Ragas
如果你想体验Ragas的最新功能,可以从GitHub仓库的main分支安装开发版。使用以下命令:
pip install git+https://gitcode.com/gh_mirrors/ra/ragas.git
开发版包含了最新的特性和改进,但可能不如稳定版成熟。适合那些希望提前体验新功能,并愿意面对潜在问题的用户。
三、贡献开发:源码安装Ragas
如果你计划为Ragas贡献代码或进行自定义修改,建议采用源码安装方式。这种方式允许你在修改代码后立即看到效果,无需重新安装。步骤如下:
- 克隆Ragas仓库:
git clone https://gitcode.com/gh_mirrors/ra/ragas.git
- 进入仓库目录并以可编辑模式安装:
cd ragas
pip install -e .
使用-e选项进行可编辑安装后,你对源码的任何修改都会直接反映到已安装的Ragas中,非常适合开发和调试。
四、处理依赖:解决版本冲突
Ragas依赖于多个第三方库,其中LangChain和OpenAI相关的依赖可能会出现版本冲突。根据官方文档的建议,如果你使用langchain_openai(例如ChatOpenAI),请显式安装langchain-core和langchain-openai以避免版本不匹配:
pip install -U "langchain-core>=0.2,<0.3" "langchain-openai>=0.1,<0.2" openai
你可以根据自己的环境调整版本范围,但显式安装这两个库有助于防止严格的依赖冲突。
从pyproject.toml中可以看到,Ragas的核心依赖包括numpy、datasets、tiktoken、pydantic等。这些依赖会在安装Ragas时自动安装,但如果你遇到任何依赖问题,可以查看该文件了解详细的依赖要求。
五、验证安装:检查Ragas版本
安装完成后,你可以通过以下命令检查Ragas的版本,以确认安装是否成功:
ragas --version
如果安装成功,终端会显示当前安装的Ragas版本号。
六、安装可选功能:扩展Ragas能力
Ragas提供了多种可选功能,可以通过安装可选依赖来启用。例如,如果你需要使用所有可选功能,可以安装:
pip install ragas[all]
其他可选功能包括tracing、gdrive和ai-frameworks等,你可以根据需要选择安装:
- tracing:用于跟踪和监控,依赖langfuse和mlflow
- gdrive:用于Google Drive集成,依赖google-api-python-client等
- ai-frameworks:用于与其他AI框架集成,如haystack-ai
具体的可选依赖列表可以在pyproject.toml中查看。
七、Ragas工作流简介
安装完成后,让我们快速了解一下Ragas的工作流程。Ragas是一个用于RAG管道评估的框架,其核心功能包括评估数据集、评估指标和测试集生成等。
Ragas工作流
上图展示了Ragas的基本工作流程。你可以使用Ragas生成测试集,然后对RAG系统的输出进行评估,得到包括忠实度、相关性、连贯性等多个维度的评估指标。
八、开始使用:运行第一个评估
安装并配置好Ragas后,你可以参考快速开始指南运行你的第一个RAG评估。通常,一个基本的评估流程包括准备评估数据、定义评估指标和运行评估等步骤。
以下是一个简单的示例代码,展示了如何使用Ragas评估RAG系统的输出:
from ragas import evaluate
from datasets import Dataset
# 准备评估数据
data = {
"question": ["What is the capital of France?"],
"answer": ["The capital of France is Paris."],
"contexts": [["Paris is the capital and most populous city of France."]],
}
dataset = Dataset.from_dict(data)
# 运行评估
result = evaluate(dataset, metrics=["faithfulness", "answer_relevancy"])
print(result)
运行这段代码后,你将得到RAG系统在忠实度和答案相关性两个指标上的得分,帮助你了解系统的性能。
九、总结
本文介绍了Ragas的多种安装方式,包括基础安装、开发版安装和源码安装,并提供了解决依赖冲突的方法。无论你是普通用户、开发者还是贡献者,都能找到适合自己的安装方式。
安装完成后,你可以参考官方文档和示例代码开始使用Ragas评估你的RAG系统。Ragas提供了丰富的评估指标和便捷的API,可以帮助你全面了解RAG系统的性能,从而进行有针对性的优化。
现在,你已经拥有了专业的RAG评估环境,开始探索Ragas的强大功能吧!如果你在使用过程中遇到任何问题,可以查阅官方文档或参与社区讨论获取帮助。
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin07
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00