LightRAG项目中的Ollama模型模拟功能增强：添加/context查询前缀

2025-05-14 21:33:30作者：温玫谨Lighthearted

在LightRAG项目的最新开发中，团队针对Ollama模型模拟接口进行了一项重要功能增强——添加了/context查询前缀支持。这一改进使得LightRAG能够更好地作为Ollama模块与其他系统集成，特别是在需要仅获取上下文信息的场景下。

功能背景

LightRAG作为一个知识检索增强生成系统，其核心价值在于能够为大型语言模型提供精准的上下文信息。在实际应用中，存在多种场景需要单独获取上下文而不需要完整的生成结果。例如：

知识图谱构建时仅需实体和关系信息
检索增强验证阶段需要检查上下文质量
某些集成系统(如Dify)需要单独处理上下文信息

技术实现

原有的Ollama模拟接口已经支持多种查询前缀，如/query、/search等。本次增强新增了/context前缀，其实现原理是：

当检测到用户查询以/context开头时，自动设置only_need_context参数为True
调用底层query API时仅返回上下文部分
过滤掉LLM生成的内容，保持与Ollama API兼容的响应格式

应用价值

这一改进带来了几个显著优势：

系统集成更灵活：使LightRAG能够无缝对接支持Ollama协议的各种平台
性能优化：避免了不必要的生成计算，在仅需上下文的场景下显著提升响应速度
资源节约：减少了GPU计算资源的消耗，特别是在高频查询场景下
调试便利：开发者可以更便捷地检查检索到的上下文质量

使用示例

用户现在可以通过以下方式使用这一功能：

/context 孙悟空在《西游记》中是如何从叛逆的猴子转变为遵守纪律的英雄的？

系统将仅返回与查询相关的上下文信息，包括实体、知识点和检索到的相关内容片段，而不会生成完整的回答。

未来展望

这一功能的实现为LightRAG的模块化应用开辟了新的可能性。未来可以考虑：

扩展更多专用前缀支持特定场景
优化上下文返回格式，支持结构化输出
增加上下文质量评估指标返回
开发基于上下文的二次处理管道

这一改进虽然看似简单，但为LightRAG在复杂系统集成中的应用提供了重要基础，体现了项目团队对实际应用场景的深入理解和持续优化。

LightRAG

"LightRAG: Simple and Fast Retrieval-Augmented Generation"

项目地址：https://gitcode.com/GitHub_Trending/li/LightRAG

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力