KagTest 的安装和配置教程
1、项目的基础介绍和主要的编程语言
KagTest 是一个开源框架,旨在利用知识图谱和向量检索的优势来增强大型语言模型和知识图谱,以解决检索增强生成(RAG)技术中的挑战。该项目的主要编程语言是 Python,它是一种广泛使用的高级编程语言,易于学习和使用。
2、项目使用的关键技术和框架
KagTest 使用了以下关键技术和框架:
- OpenSPG: OpenSPG 是一个基于 SPG(Semantic-enhanced Programmable Graph)框架研发的知识图谱引擎,由蚂蚁集团和 OpenKG 联合推出。它能够构建和应用知识图谱,并提供相关服务。
- KAG (Knowledge Augmented Generation): KAG 是 OpenSPG 发布 v0.5 版本中推出的知识增强生成框架,旨在解决 RAG 技术中的挑战,例如向量相似度与知识推理相关性差距大、对知识逻辑不敏感等问题。
3、项目安装和配置的准备工作和详细的安装步骤
3.1 准备工作
在安装 KagTest 之前,请确保您已经安装了以下依赖项:
- Python 3.8 或更高版本: KagTest 需要 Python 3.8 或更高版本。
- Git: 用于克隆 KagTest 项目的代码库。
- Docker: 用于部署 OpenSPG-Server。
3.2 安装步骤
-
克隆项目代码库
使用以下命令克隆 KagTest 项目的代码库:
git clone https://github.com/NanGePlus/KagTest.git cd KagTest -
安装依赖项
在 KagTest 项目目录中,运行以下命令安装项目所需的依赖项:
pip install -e .确认安装成功后,可以运行以下命令验证:
knext --version -
配置项目
在 KagTest 项目目录中,将
other/config目录下的example.cfg文件复制到根目录,并根据您的业务需求修改配置参数,例如命名空间、嵌入和 LLM 配置参数。 -
初始化项目
在命令行中,运行以下命令初始化项目:
knext project create --config_path ./example.cfg初始化项目完成后,进入对应的项目文件夹,并根据实际业务需求调整 schema,调整完成后执行
knext schema commit命令提交 schema。 -
构建索引
将文档复制到项目文件夹中的
builder/data目录下,支持 txt、pdf、markdown、docx、json 和 csv 等文件格式。然后,进入项目文件夹的builder目录,运行python indexer.py命令开始构建索引。 -
检索
构建索引成功后,您可以登录到 http://127.0.0.1:8887/ 或 http://127.0.0.1:7474/browser/ 查看知识图谱。图数据库的账号和密码分别为
neo4j和neo4j@openspg。接下来,进入项目文件夹的
solver目录,运行python query.py命令开始检索。根据您的业务需求,您可以设置相关的 prompt 内容,例如logic_form_plan.py、question_ner.py和resp_generator.py。您也可以在产品端进行测试,访问 http://127.0.0.1:8887/。
至此,您已完成 KagTest 的安装和配置。祝您使用愉快!
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust073- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
Kimi-K2.6Kimi K2.6 是一款开源的原生多模态智能体模型,在长程编码、编码驱动设计、主动自主执行以及群体任务编排等实用能力方面实现了显著提升。Python00
Hy3-previewHy3 preview 是由腾讯混元团队研发的2950亿参数混合专家(Mixture-of-Experts, MoE)模型,包含210亿激活参数和38亿MTP层参数。Hy3 preview是在我们重构的基础设施上训练的首款模型,也是目前发布的性能最强的模型。该模型在复杂推理、指令遵循、上下文学习、代码生成及智能体任务等方面均实现了显著提升。Python00