LangChain开发完全指南：从入门到企业级应用

2026-04-30 11:02:14作者：凌朦慧Richard

LangChain开发作为大语言模型应用框架的核心工具，正在改变LLM开发实战的方式。本文将带你从基础入门到掌握核心功能，通过实战案例和高级技巧，全面提升你的LangChain应用开发能力。

基础入门：如何用LangChain构建第一个LLM应用

💡 实用提示：在开始LangChain开发前，建议先熟悉Python环境和基本的LLM概念，这将帮助你更快理解框架的核心思想。

环境搭建与基础配置

首先，我们需要安装LangChain及其相关依赖。打开终端，执行以下命令：

pip install langchain openai python-dotenv

接下来，创建一个.env文件，添加你的OpenAI API密钥：

OPENAI_API_KEY=your_api_key_here

第一个LangChain应用：简单的文本生成器

下面是一个使用LangChain构建的简单文本生成应用：

from langchain.llms import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()  # 加载环境变量

# 初始化LLM模型
llm = OpenAI(temperature=0.7)

# 生成文本
response = llm("解释什么是大语言模型")
print(response)

这段代码展示了LangChain的基本用法：导入LLM模型，设置参数，然后调用模型生成文本。

LangChain核心概念解析

LangChain的核心概念包括：

模型(Models)：与各种LLM交互的接口
提示(Prompts)：用于引导模型生成特定输出的输入
链(Chains)：将多个组件组合起来完成复杂任务
代理(Agents)：根据用户输入决定采取哪些行动
记忆(Memory)：在对话中保持状态的能力

理解这些概念是掌握LangChain的基础。

核心功能：如何用链(Chains)和代理(Agents)实现复杂任务

💡 实用提示：链和代理是LangChain最强大的特性，合理使用它们可以大幅提升LLM应用的能力和灵活性。

深入理解LangChain的链(Chains)

链允许你将多个LLM调用或其他工具组合起来，形成一个完整的工作流。以下是一个简单的链示例：

from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

# 创建提示模板
prompt = PromptTemplate(
    input_variables=["product"],
    template="为{product}创建一个吸引人的标语。"
)

# 创建LLM链
chain = LLMChain(llm=llm, prompt=prompt)

# 运行链
result = chain.run(product="智能手表")
print(result)

更复杂的应用可能需要使用SequentialChain或SimpleSequentialChain来组合多个链：

from langchain.chains import SimpleSequentialChain

# 创建第一个链
prompt1 = PromptTemplate(
    input_variables=["product"],
    template="为{product}创建5个可能的名称。"
)
chain1 = LLMChain(llm=llm, prompt=prompt1)

# 创建第二个链
prompt2 = PromptTemplate(
    input_variables=["name"],
    template="为产品名称'{name}'创建一个吸引人的标语。"
)
chain2 = LLMChain(llm=llm, prompt=prompt2)

# 组合链
overall_chain = SimpleSequentialChain(chains=[chain1, chain2], verbose=True)

# 运行组合链
result = overall_chain.run("智能手表")
print(result)

掌握LangChain Agent开发全流程

代理(Agents)是LangChain中更高级的功能，它们可以根据用户输入决定调用哪些工具来完成任务。以下是一个使用SerpAPIWrapper进行网络搜索的代理示例：

from langchain.agents import initialize_agent, Tool
from langchain.agents import AgentType
from langchain.utilities import SerpAPIWrapper

# 初始化搜索工具
search = SerpAPIWrapper(serpapi_api_key="your_serpapi_key")

# 定义工具列表
tools = [
    Tool(
        name="Search",
        func=search.run,
        description="当你需要回答关于当前事件或需要最新信息的问题时使用"
    )
]

# 初始化代理
agent = initialize_agent(
    tools, 
    llm, 
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, 
    verbose=True
)

# 使用代理回答问题
result = agent.run("今天的天气怎么样？")
print(result)

代理的强大之处在于它能够自主决策何时需要使用工具，何时可以直接回答问题。

实战案例：如何用LangChain实现企业级RAG应用

💡 实用提示：RAG（检索增强生成）是企业应用中最常用的LangChain场景之一，它能让LLM基于企业私有数据生成回答。

RAG应用架构设计

RAG应用的基本架构包括以下几个部分：

文档加载与处理
文本分块
生成Embeddings（文本向量化技术）
向量存储
检索与生成

完整RAG应用实现步骤

首先，安装必要的依赖：

pip install langchain chromadb pypdf

下面是一个完整的RAG应用实现：

from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.chains import RetrievalQA

# 1. 加载文档
loader = PyPDFLoader("company_handbook.pdf")
documents = loader.load()

# 2. 文本分块
text_splitter = CharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=200,
    length_function=len
)
texts = text_splitter.split_documents(documents)

# 3. 创建Embeddings并存储到向量数据库
embeddings = OpenAIEmbeddings()
db = Chroma.from_documents(texts, embeddings)

# 4. 创建检索问答链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=db.as_retriever(),
    return_source_documents=True
)

# 5. 提问并获取回答
query = "公司的年假政策是什么？"
result = qa_chain({"query": query})
print(result["result"])

这个RAG应用能够基于PDF文档回答问题，非常适合企业内部知识库建设。

高级技巧：如何优化LangChain应用性能与部署

💡 实用提示：在将LangChain应用部署到生产环境前，务必考虑性能优化和资源消耗问题，这直接影响用户体验和运营成本。

向量数据库集成最佳实践

除了Chroma，LangChain还支持多种向量数据库，如 Pinecone、Weaviate、FAISS 等。以下是使用 Pinecone 的示例：

from langchain.vectorstores import Pinecone
import pinecone

# 初始化Pinecone
pinecone.init(
    api_key="your_pinecone_api_key",
    environment="your_pinecone_environment"
)

# 创建或连接到索引
index_name = "company-knowledge"
if index_name not in pinecone.list_indexes():
    pinecone.create_index(index_name, dimension=1536)  # OpenAI embeddings维度

# 创建向量存储
docsearch = Pinecone.from_documents(
    texts, embeddings, index_name=index_name
)

多模态处理与高级代理开发

LangChain支持多模态处理，可以结合文本、图像等多种数据类型。以下是一个简单的多模态示例：

from langchain.llms import OpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.document_loaders import ImageCaptionLoader

# 加载图像并生成描述
loader = ImageCaptionLoader(path_images=["product_image.jpg"])
documents = loader.load()

# 创建提示模板
prompt = PromptTemplate(
    input_variables=["image_description"],
    template="根据以下图像描述，为产品创建一个吸引人的营销文案：{image_description}"
)

# 创建链并运行
chain = LLMChain(llm=llm, prompt=prompt)
result = chain.run(documents[0].page_content)
print(result)

LangChain与LlamaIndex技术选型对比

特性	LangChain	LlamaIndex
核心定位	通用LLM应用框架	专注于RAG和知识管理
灵活性	高，适合构建复杂应用	中等，RAG场景下更简洁
学习曲线	较陡	较平缓
生态系统	丰富，支持多种工具	专注于数据处理和索引
企业应用	适合复杂工作流	适合文档问答系统

选择建议：

如果需要构建复杂的多步骤工作流或代理应用，选择LangChain
如果主要需求是构建文档问答系统，LlamaIndex可能更合适
实际项目中也可以结合两者的优势，用LlamaIndex处理文档，用LangChain构建工作流

生产环境部署策略

容器化部署

使用Docker容器化LangChain应用：

FROM python:3.9-slim

WORKDIR /app

COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

COPY app.py .

CMD ["python", "app.py"]

无服务器部署

使用AWS Lambda或Google Cloud Functions部署LangChain应用：

# lambda_function.py
import os
from langchain.llms import OpenAI
from dotenv import load_dotenv

load_dotenv()

llm = OpenAI(temperature=0.7)

def lambda_handler(event, context):
    prompt = event['prompt']
    response = llm(prompt)
    return {
        'statusCode': 200,
        'body': response
    }

避坑指南：LangChain开发常见问题及解决方案

问题1：上下文窗口限制导致回答不完整

解决方案：

使用文本分块技术减小输入大小
实现自动摘要功能，将长文本压缩
考虑使用支持更大上下文窗口的模型

from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50,
    length_function=len,
)
chunks = text_splitter.split_text(long_text)

问题2：代理决策过程不透明，难以调试

解决方案：

启用详细日志(verbose=True)
使用回调函数跟踪代理思考过程
实现自定义代理调试工具

from langchain.callbacks import get_openai_callback

with get_openai_callback() as cb:
    result = agent.run("复杂问题")
    print(f"Tokens used: {cb.total_tokens}")
    print(f"思考过程: {result}")

问题3：生产环境中API调用成本过高

解决方案：

实现缓存机制减少重复API调用
使用本地模型替代部分云端API调用
优化提示词，减少不必要的token消耗

from langchain.cache import InMemoryCache
from langchain.callbacks import llm_cache

llm_cache.set_cache(InMemoryCache())

# 第一次调用会触发API请求
result1 = llm("相同的查询")

# 第二次调用会使用缓存，不触发API请求
result2 = llm("相同的查询")

通过以上内容，我们全面介绍了LangChain开发的基础知识、核心功能、实战案例和高级技巧。希望这篇指南能帮助你更好地利用LangChain构建强大的大语言模型应用，从入门到精通，最终实现企业级应用部署。

ollama

Get up and running with Kimi-K2.5, GLM-5, MiniMax, DeepSeek, gpt-oss, Qwen, Gemma and other models.

项目地址：https://gitcode.com/GitHub_Trending/oll/ollama

登录后查看全文