LangFlow项目中使用Ollama本地LLM的Monkey Patch实现

2025-04-30 08:33:31作者：霍妲思

⛓️ Langflow is a visual framework for building multi-agent and RAG applications. It's open-source, Python-powered, fully customizable, model and vector store agnostic.

项目地址：https://gitcode.com/GitHub_Trending/lan/langflow

在LangFlow项目中集成本地运行的Ollama大语言模型时，开发者D3adP33ngv33n分享了一种巧妙的Monkey Patch解决方案。这种方法绕过了直接使用OpenAI API的需求，为希望在本地环境中运行LLM的用户提供了实用参考。

技术背景

LangFlow是一个基于流程的AI开发框架，默认情况下设计为与OpenAI等云服务API交互。然而，许多开发者出于隐私、成本或网络限制等原因，更倾向于使用本地部署的大语言模型。Ollama作为一个支持本地运行的LLM框架，成为理想选择。

核心实现方案

该方案的核心在于通过Python的Monkey Patch技术，动态替换LangFlow内部使用的litellm.completion函数。具体实现分为两个关键部分：

自定义completion函数：

def custom_completion(*args, **kwargs):
    messages = kwargs.get("messages", [])
    prompt = messages[0].get("content", "") if messages else ""
    response_text = query_ollama(prompt)
    return SimpleNamespace(choices=[SimpleNamespace(message=SimpleNamespace(content=response_text))])

litellm.completion = custom_completion

这个函数拦截所有LLM调用请求，提取提示词内容后转发给本地Ollama实例，并返回符合LangFlow预期的响应格式。

OllamaLLM适配器类：

class OllamaLLM(LLM):
    def __init__(self, use_gpu=True):
        super().__init__(model=OLLAMA_MODEL)
        self.use_gpu = use_gpu

    def complete(self, prompt):
        return litellm.completion(model=OLLAMA_MODEL, messages=[{"role": "user", "content": prompt}])

这个类继承自LangFlow的基础LLM类，提供了标准化的接口，确保与框架其他组件的兼容性。

技术细节解析

Monkey Patch机制：Python的动态特性允许运行时替换模块、类或函数。这里巧妙地替换了litellm.completion，使其成为与本地Ollama交互的桥梁。
响应格式适配：使用SimpleNamespace构造与OpenAI API兼容的响应结构，确保LangFlow后续处理逻辑无需修改。
GPU支持选项：在OllamaLLM类中保留了use_gpu参数，为后续可能的性能优化留出空间。