5分钟上手！sentence-transformers+LangChain构建企业级智能问答系统

2026-02-05 05:17:05作者：农烁颖Land

你是否还在为构建智能问答系统时遇到的文本理解不准确、检索效率低、回答质量差等问题烦恼？本文将带你一文解决这些痛点，通过sentence-transformers与LangChain的无缝集成，快速搭建一个高效、准确的智能问答系统。读完本文，你将掌握文本嵌入生成、向量存储构建、检索增强生成（RAG）等核心技术，轻松应对各类问答场景。

技术原理：为何选择sentence-transformers与LangChain？

sentence-transformers是一个强大的句子嵌入（Sentence Embeddings）生成工具，能够将文本转化为具有语义信息的向量表示。其核心是基于预训练语言模型（如BERT），通过微调（Fine-tuning）使其能够生成高质量的句子嵌入。而LangChain则是一个用于构建基于语言模型的应用程序的框架，提供了丰富的组件，如文档加载器、文本分割器、向量存储、检索器、链等，能够轻松实现RAG架构。

sentence-transformers的工作原理如图所示：

从图中可以看出，sentence-transformers采用了Siamese Network（孪生网络）结构，将输入的句子对分别通过预训练语言模型和池化层（Pooling Layer），生成固定长度的句子嵌入。这种结构能够有效地捕捉句子之间的语义关系，为后续的检索任务提供有力支持。

LangChain的RAG架构则如图所示：

RAG架构的核心思想是将外部知识融入语言模型的生成过程中。首先，将文档库中的文档分割成小块，使用sentence-transformers生成嵌入向量并存储到向量数据库中。当用户提出问题时，LangChain的检索器会从向量数据库中检索出与问题相关的文档片段，然后将这些片段作为上下文传递给语言模型，生成最终的回答。这种方式不仅能够提高回答的准确性，还能够解决语言模型的知识时效性问题。

环境准备：快速搭建开发环境

要使用sentence-transformers与LangChain构建智能问答系统，首先需要搭建相应的开发环境。以下是详细的步骤：

克隆项目仓库：

git clone https://gitcode.com/gh_mirrors/se/sentence-transformers
cd sentence-transformers

安装依赖包： sentence-transformers的安装可以通过pip命令进行：

pip install sentence-transformers

LangChain的安装同样简单：

pip install langchain

此外，还需要安装向量数据库客户端，如FAISS（Facebook AI Similarity Search）：

pip install faiss-cpu  # CPU版本
# 或
pip install faiss-gpu  # GPU版本（如果有GPU）

验证安装：安装完成后，可以通过以下代码验证sentence-transformers是否安装成功：

from sentence_transformers import SentenceTransformer
model = SentenceTransformer('all-MiniLM-L6-v2')
embedding = model.encode("Hello, world!")
print(embedding.shape)  # 输出应为(384,)

验证LangChain是否安装成功：

from langchain.llms import OpenAI
llm = OpenAI(api_key="YOUR_API_KEY")  # 替换为你的OpenAI API密钥
print(llm("Hello, world!"))

核心步骤：构建智能问答系统的关键环节

1. 文本嵌入生成：使用sentence-transformers将文本转化为向量

sentence-transformers提供了多种预训练模型，适用于不同的场景。例如，all-MiniLM-L6-v2是一个轻量级模型，适合大多数场景；all-mpnet-base-v2则具有更高的性能，但模型体积较大。以下是使用sentence-transformers生成文本嵌入的示例代码：

from sentence_transformers import SentenceTransformer

# 加载预训练模型
model = SentenceTransformer('all-MiniLM-L6-v2')

# 定义文档库
documents = [
    "Machine learning is a field of study that gives computers the ability to learn without being explicitly programmed.",
    "Deep learning is part of a broader family of machine learning methods based on artificial neural networks with representation learning.",
    "Neural networks are computing systems vaguely inspired by the biological neural networks that constitute animal brains.",
    # ... 更多文档
]

# 生成文档嵌入
document_embeddings = model.encode(documents, convert_to_tensor=True)

# 生成查询嵌入
query = "How do artificial neural networks work?"
query_embedding = model.encode(query, convert_to_tensor=True)

生成的嵌入向量可以用于后续的相似度计算和检索任务。sentence-transformers支持批量处理，能够高效地处理大量文档。

2. 向量存储构建：使用LangChain连接向量数据库

LangChain提供了多种向量存储的集成，如FAISS、Chroma、 Pinecone等。以下是使用FAISS构建向量存储的示例代码：

from langchain.vectorstores import FAISS
from langchain.embeddings import SentenceTransformerEmbeddings

# 初始化嵌入模型
embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")

# 构建向量存储
db = FAISS.from_texts(documents, embeddings)

# 保存向量存储（可选）
db.save_local("faiss_index")

# 加载向量存储（可选）
# db = FAISS.load_local("faiss_index", embeddings)

FAISS是一个高效的向量相似性搜索库，能够快速检索出与查询向量最相似的文档向量。LangChain的向量存储接口简洁易用，使得构建和管理向量数据库变得非常方便。

3. 检索增强生成（RAG）：结合检索与生成能力

RAG的核心是将检索到的相关文档作为上下文传递给语言模型，以生成更准确、更相关的回答。以下是使用LangChain实现RAG的示例代码：

from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化语言模型
llm = OpenAI(api_key="YOUR_API_KEY")

# 构建检索器
retriever = db.as_retriever(search_kwargs={"k": 3})  # 检索 top 3 相关文档

# 构建RAG链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",  # 将检索到的文档内容拼接后传递给语言模型
    retriever=retriever,
    return_source_documents=True  # 返回源文档
)

# 执行查询
query = "How do artificial neural networks work?"
result = qa_chain({"query": query})

# 输出结果
print("Question:", query)
print("Answer:", result["result"])
print("Source Documents:", [doc.page_content for doc in result["source_documents"]])

在这个示例中，RetrievalQA链将检索到的文档内容作为上下文传递给OpenAI语言模型，生成最终的回答。chain_type参数可以设置为"stuff"、"map_reduce"、"refine"等，分别对应不同的文档处理策略。

代码示例：完整的智能问答系统实现

以下是一个完整的智能问答系统实现示例，包括文档加载、文本分割、嵌入生成、向量存储构建和RAG查询等环节：

from sentence_transformers import SentenceTransformer
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import FAISS
from langchain.embeddings import SentenceTransformerEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 1. 加载文档
loader = TextLoader("docs/example_document.txt")  # 替换为你的文档路径
documents = loader.load()

# 2. 文本分割
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

# 3. 初始化嵌入模型
embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")

# 4. 构建向量存储
db = FAISS.from_documents(texts, embeddings)

# 5. 初始化语言模型
llm = OpenAI(api_key="YOUR_API_KEY")  # 替换为你的OpenAI API密钥

# 6. 构建RAG链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=db.as_retriever(search_kwargs={"k": 3}),
    return_source_documents=True
)

# 7. 执行查询
query = "What is machine learning?"
result = qa_chain({"query": query})

# 8. 输出结果
print(f"Question: {query}")
print(f"Answer: {result['result']}")
print("Source Documents:")
for doc in result["source_documents"]:
    print(f"- {doc.page_content[:100]}...")  # 打印文档前100个字符

在实际应用中，你可以根据需要调整文档加载方式（如从PDF、Word等格式加载）、文本分割参数、嵌入模型、向量存储和语言模型等。

性能优化：提升系统效率与准确性的技巧

1. 模型选择：根据场景选择合适的嵌入模型

sentence-transformers提供了多种预训练模型，不同模型在性能和速度上有所差异。例如：

轻量级模型：如all-MiniLM-L6-v2，速度快，适合资源有限的场景。
高性能模型：如all-mpnet-base-v2，准确性高，适合对性能要求较高的场景。
多语言模型：如paraphrase-multilingual-MiniLM-L12-v2，支持多种语言。

你可以通过sentence-transformers官网查看更多模型信息，并根据实际需求选择。

2. 文本分割：合理设置chunk_size和chunk_overlap

文本分割的质量直接影响检索效果。一般来说，chunk_size设置为500-1000字符较为合适，chunk_overlap设置为50-100字符，以避免重要信息被分割到不同的块中。例如：

text_splitter = CharacterTextSplitter(
    chunk_size=700,
    chunk_overlap=100,
    separator="\n"
)

3. 向量存储优化：选择合适的向量数据库

不同的向量数据库具有不同的特点，如FAISS适合单机场景，Pinecone适合云端场景，Milvus适合大规模数据场景。你可以根据数据量、性能要求和部署环境选择合适的向量数据库。

4. 检索参数调整：优化search_kwargs

在构建检索器时，可以通过search_kwargs调整检索参数，如k（返回的相关文档数量）。一般来说，k设置为3-5较为合适，过多的文档可能会导致语言模型注意力分散。

retriever = db.as_retriever(search_kwargs={"k": 4})  # 返回 top 4 相关文档

应用场景：智能问答系统的多样化应用

sentence-transformers与LangChain集成的智能问答系统可以应用于多种场景，如：

1. 企业知识库问答

企业可以将内部文档（如产品手册、技术文档、规章制度等）构建成知识库，员工或客户可以通过智能问答系统快速获取所需信息。例如，IT部门可以构建一个技术支持知识库，帮助员工解决常见的技术问题。

2. 客户服务聊天机器人

将智能问答系统集成到客户服务平台，可以实现7x24小时自动回复客户的常见问题，提高客户满意度和服务效率。例如，电商平台可以构建一个产品咨询聊天机器人，回答客户关于产品特性、价格、物流等问题。

3. 智能搜索引擎

传统的搜索引擎基于关键词匹配，而基于嵌入向量的搜索引擎能够理解用户查询的语义，提供更相关的搜索结果。例如，学术搜索引擎可以使用智能问答系统帮助研究人员快速找到相关的论文。

4. 教育辅助系统

在教育领域，智能问答系统可以作为学习辅助工具，帮助学生解答疑问、提供学习资源。例如，在线教育平台可以构建一个课程问答系统，学生可以随时提问，系统根据课程内容生成回答。

总结与展望

本文详细介绍了如何使用sentence-transformers与LangChain构建智能问答系统，包括技术原理、环境准备、核心步骤、代码示例、性能优化和应用场景等方面。通过这种集成方式，我们可以快速搭建一个高效、准确的智能问答系统，轻松应对各类问答场景。

随着自然语言处理技术的不断发展，sentence-transformers和LangChain也在不断更新和完善。未来，我们可以期待更强大的嵌入模型、更高效的向量存储和更智能的语言模型，为智能问答系统带来更好的性能和用户体验。

如果你对本文内容有任何疑问或建议，欢迎在评论区留言讨论。同时，也欢迎点赞、收藏本文，关注我们获取更多AI技术干货！

下期预告：我们将介绍如何使用sentence-transformers与LangChain构建多模态智能问答系统，支持文本、图片等多种输入类型。敬请期待！

sentence-transformers

Multilingual Sentence & Image Embeddings with BERT

项目地址：https://gitcode.com/gh_mirrors/se/sentence-transformers

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。