OpenSPG/KAG项目中知识图谱问答召回机制解析与优化

2025-06-01 00:45:35作者：平淮齐Percy

背景介绍

OpenSPG/KAG是一个开源的知识图谱分析与推理框架，其中的知识问答功能是其核心能力之一。在实际应用中，用户发现当执行知识图谱问答时，系统在数据召回阶段存在一些问题，导致最终只能退而求其次使用文档片段(Chunk)来回答问题，而非直接从知识图谱中获取精准答案。

在知识问答流程中，系统首先会尝试使用精确的知识图谱检索器(KGRetriever)来获取相关数据。具体步骤包括：

然而，当大语言模型对问题中的谓词识别不准确时，DSL查询语句会执行失败，导致精确检索流程中断。此时系统会转而使用模糊知识图谱检索器(fuzzy_kg_retriever)，但该检索器同样依赖DSL查询，因此当谓词识别错误时，依然无法正确召回数据。

知识图谱问答的核心在于能够准确理解问题语义并将其转换为图谱查询。OpenSPG/KAG采用了两阶段检索策略：

当两个阶段都失败时，系统会退回到基于文档片段的回答模式，这种回答方式虽然能提供相关信息，但缺乏知识图谱特有的结构化优势。

项目团队在后续版本中修复了这一问题。优化后的系统在以下方面进行了改进：

对于使用OpenSPG/KAG进行知识图谱问答开发的用户，建议：

通过理解知识图谱问答的内部机制，开发者可以更好地设计应用场景，充分发挥结构化知识的价值，为用户提供更精准、更智能的问答服务。

登录后查看全文