2025最新Ragas安装指南:5分钟搭建专业RAG评估环境
你是否还在为RAG(检索增强生成)系统的评估环境搭建而烦恼?是否遇到过安装过程中依赖冲突、版本不兼容等问题?本文将带你5分钟内完成Ragas的安装与配置,让你轻松拥有专业的RAG评估能力。读完本文后,你将能够:掌握Ragas的多种安装方式、解决常见的依赖问题、了解不同安装模式的适用场景,并成功运行第一个RAG评估示例。
一、快速安装:基础版Ragas
Ragas提供了简单快捷的pip安装方式,适用于大多数用户。打开终端,输入以下命令即可完成基础版Ragas的安装:
pip install ragas
这条命令会从Python Package Index(PyPI)下载并安装最新稳定版的Ragas。安装完成后,你就可以开始使用Ragas的核心功能进行RAG系统评估了。
二、尝鲜体验:安装开发版Ragas
如果你想体验Ragas的最新功能,可以从GitHub仓库的main分支安装开发版。使用以下命令:
pip install git+https://gitcode.com/gh_mirrors/ra/ragas.git
开发版包含了最新的特性和改进,但可能不如稳定版成熟。适合那些希望提前体验新功能,并愿意面对潜在问题的用户。
三、贡献开发:源码安装Ragas
如果你计划为Ragas贡献代码或进行自定义修改,建议采用源码安装方式。这种方式允许你在修改代码后立即看到效果,无需重新安装。步骤如下:
- 克隆Ragas仓库:
git clone https://gitcode.com/gh_mirrors/ra/ragas.git
- 进入仓库目录并以可编辑模式安装:
cd ragas
pip install -e .
使用-e选项进行可编辑安装后,你对源码的任何修改都会直接反映到已安装的Ragas中,非常适合开发和调试。
四、处理依赖:解决版本冲突
Ragas依赖于多个第三方库,其中LangChain和OpenAI相关的依赖可能会出现版本冲突。根据官方文档的建议,如果你使用langchain_openai(例如ChatOpenAI),请显式安装langchain-core和langchain-openai以避免版本不匹配:
pip install -U "langchain-core>=0.2,<0.3" "langchain-openai>=0.1,<0.2" openai
你可以根据自己的环境调整版本范围,但显式安装这两个库有助于防止严格的依赖冲突。
从pyproject.toml中可以看到,Ragas的核心依赖包括numpy、datasets、tiktoken、pydantic等。这些依赖会在安装Ragas时自动安装,但如果你遇到任何依赖问题,可以查看该文件了解详细的依赖要求。
五、验证安装:检查Ragas版本
安装完成后,你可以通过以下命令检查Ragas的版本,以确认安装是否成功:
ragas --version
如果安装成功,终端会显示当前安装的Ragas版本号。
六、安装可选功能:扩展Ragas能力
Ragas提供了多种可选功能,可以通过安装可选依赖来启用。例如,如果你需要使用所有可选功能,可以安装:
pip install ragas[all]
其他可选功能包括tracing、gdrive和ai-frameworks等,你可以根据需要选择安装:
- tracing:用于跟踪和监控,依赖langfuse和mlflow
- gdrive:用于Google Drive集成,依赖google-api-python-client等
- ai-frameworks:用于与其他AI框架集成,如haystack-ai
具体的可选依赖列表可以在pyproject.toml中查看。
七、Ragas工作流简介
安装完成后,让我们快速了解一下Ragas的工作流程。Ragas是一个用于RAG管道评估的框架,其核心功能包括评估数据集、评估指标和测试集生成等。
Ragas工作流
上图展示了Ragas的基本工作流程。你可以使用Ragas生成测试集,然后对RAG系统的输出进行评估,得到包括忠实度、相关性、连贯性等多个维度的评估指标。
八、开始使用:运行第一个评估
安装并配置好Ragas后,你可以参考快速开始指南运行你的第一个RAG评估。通常,一个基本的评估流程包括准备评估数据、定义评估指标和运行评估等步骤。
以下是一个简单的示例代码,展示了如何使用Ragas评估RAG系统的输出:
from ragas import evaluate
from datasets import Dataset
# 准备评估数据
data = {
"question": ["What is the capital of France?"],
"answer": ["The capital of France is Paris."],
"contexts": [["Paris is the capital and most populous city of France."]],
}
dataset = Dataset.from_dict(data)
# 运行评估
result = evaluate(dataset, metrics=["faithfulness", "answer_relevancy"])
print(result)
运行这段代码后,你将得到RAG系统在忠实度和答案相关性两个指标上的得分,帮助你了解系统的性能。
九、总结
本文介绍了Ragas的多种安装方式,包括基础安装、开发版安装和源码安装,并提供了解决依赖冲突的方法。无论你是普通用户、开发者还是贡献者,都能找到适合自己的安装方式。
安装完成后,你可以参考官方文档和示例代码开始使用Ragas评估你的RAG系统。Ragas提供了丰富的评估指标和便捷的API,可以帮助你全面了解RAG系统的性能,从而进行有针对性的优化。
现在,你已经拥有了专业的RAG评估环境,开始探索Ragas的强大功能吧!如果你在使用过程中遇到任何问题,可以查阅官方文档或参与社区讨论获取帮助。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
请把这个活动推给顶尖程序员😎本次活动专为懂行的顶尖程序员量身打造,聚焦AtomGit首发开源模型的实际应用与深度测评,拒绝大众化浅层体验,邀请具备扎实技术功底、开源经验或模型测评能力的顶尖开发者,深度参与模型体验、性能测评,通过发布技术帖子、提交测评报告、上传实践项目成果等形式,挖掘模型核心价值,共建AtomGit开源模型生态,彰显顶尖程序员的技术洞察力与实践能力。00
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00
MiniMax-M2.5MiniMax-M2.5开源模型,经数十万复杂环境强化训练,在代码生成、工具调用、办公自动化等经济价值任务中表现卓越。SWE-Bench Verified得分80.2%,Multi-SWE-Bench达51.3%,BrowseComp获76.3%。推理速度比M2.1快37%,与Claude Opus 4.6相当,每小时仅需0.3-1美元,成本仅为同类模型1/10-1/20,为智能应用开发提供高效经济选择。【此简介由AI生成】Python00
Qwen3.5Qwen3.5 昇腾 vLLM 部署教程。Qwen3.5 是 Qwen 系列最新的旗舰多模态模型,采用 MoE(混合专家)架构,在保持强大模型能力的同时显著降低了推理成本。00- RRing-2.5-1TRing-2.5-1T:全球首个基于混合线性注意力架构的开源万亿参数思考模型。Python00