零基础玩转本地知识库：Langchain-Chatchat中文AI问答全攻略

2026-02-05 04:42:25作者：仰钰奇

Langchain-Chatchat（原Langchain-ChatGLM）基于 Langchain 与 ChatGLM 等语言模型的本地知识库问答 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM) QA app with langchain

项目地址：https://gitcode.com/GitHub_Trending/la/Langchain-Chatchat

你是否还在为企业文档查询效率低而烦恼？是否担心敏感数据上云的安全风险？本文将带你从零开始，用Langchain-Chatchat构建完全本地化的智能问答系统，无需专业开发背景，1小时即可部署属于你的AI知识库助手。

项目简介：什么是Langchain-Chatchat

Langchain-Chatchat（原Langchain-ChatGLM）是一款基于Langchain框架与开源大语言模型（LLM）构建的本地知识库问答解决方案。与传统问答系统不同，它能深度理解中文语境，支持私有部署，所有数据全程本地化处理，完美解决企业级文档管理与智能问答需求。

核心优势：

全流程开源可控，支持GLM-4、Qwen2等主流中文模型
混合检索技术（向量+关键词）提升文档问答准确率
模块化设计，支持知识库管理、多轮对话、Agent工具调用
提供WebUI、API接口等多种交互方式

官方文档：README.md
开发指南：docs/contributing/README_dev.md

部署指南：三种安装方式对比

Docker一键部署（推荐新手）

Docker部署是最简单的方式，只需3步即可启动完整服务：

安装Docker环境与NVIDIA容器工具包
下载配置文件：

wget https://gitcode.com/GitHub_Trending/la/Langchain-Chatchat/raw/master/docker/docker-compose.yaml

启动服务：

docker-compose up -d

首次启动会自动拉取镜像，建议耐心等待5-10分钟。启动成功后可看到如下日志：

访问地址：

WebUI界面：http://localhost:8501
模型管理界面：http://localhost:9997

详细步骤：docs/install/README_docker.md

源码部署（适合开发者）

源码部署需先克隆项目仓库：

git clone https://gitcode.com/GitHub_Trending/la/Langchain-Chatchat.git
cd Langchain-Chatchat

然后通过Poetry管理依赖：

poetry install --extras "xinference"

初始化配置文件：

cp configs/model_config.py.example configs/model_config.py

开发文档：docs/contributing/README_dev.md

pip快速安装（适合集成场景）

生产环境推荐使用pip安装：

pip install langchain-chatchat[xinference] -U

初始化数据目录：

export CHATCHAT_ROOT=/path/to/your/data
chatchat init

核心功能详解

多模态知识库管理

Langchain-Chatchat支持PDF、Word、Excel、Markdown等20+格式文档导入，采用BM25+向量混合检索技术，确保中文语义理解准确率提升40%。

操作步骤：

登录WebUI后点击左侧"知识库"
创建知识库并上传文档
点击"重建向量库"生成索引
等待进度条完成即可开始问答

支持的文档类型：

文本类：TXT、Markdown、PDF、DOCX
表格类：XLSX、CSV
图片类：通过OCR提取文字（需安装Tesseract）

文档处理模块：markdown_docs/document_loaders/

智能Agent工具调用

0.3.x版本针对中文模型深度优化Agent能力，支持工具自动选择与参数解析，可连接数据库、搜索引擎、代码解释器等外部工具。

使用场景：

数据分析：连接MySQL/PostgreSQL生成可视化报告
网络搜索：获取实时信息（如天气、新闻）
代码生成：自动编写并执行Python脚本
文件处理：批量转换文档格式

Agent源码：libs/chatchat-server/chatchat/agent/

模型兼容性矩阵

项目支持市面主流开源模型与部署框架，以下是经过验证的兼容性列表：

模型部署框架	支持模型类型	加速引擎	中文优化
Xinference	LLM/Embedding/Rerank	vLLM/GPTQ	✅
Ollama	LLM/多模态	GGUF	✅
FastChat	LLM	TensorRT	⚠️部分支持
LocalAI	全类型模型	GGML	✅

推荐组合：

本地部署：Qwen2-7B + BGE-Large-zh
低资源设备：Qwen2-0.5B + m3e-small
多模态场景：Qwen-VL-Chat + CogVLM

模型配置文件：configs/model_settings.yaml

常见问题解决

知识库重建失败

若出现"Embedding模型未加载"错误，请检查：

Xinference服务是否正常运行
model_settings.yaml中Embedding模型名称是否正确
防火墙是否开放9997端口

解决方案：

# 重启Xinference服务
docker restart root-xinference-1

# 查看模型加载状态
curl http://localhost:9997/v1/models

模型加载速度慢

建议：

使用模型量化版本（如INT4/INT8）
预下载模型文件到本地目录
配置模型缓存路径：

# 在model_settings.yaml中添加
XINFERENCE_CACHE_DIR: /path/to/your/model_cache

工具脚本：tools/model_loaders/xinference_manager.py

高级应用场景

企业文档管理系统集成

通过API接口将Langchain-Chatchat集成到现有OA系统：

import requests

def query_knowledge(question, kb_name="company_docs"):
    url = "http://localhost:7861/api/knowledge_base/chat"
    data = {
        "question": question,
        "knowledge_base_name": kb_name,
        "top_k": 5
    }
    response = requests.post(url, json=data)
    return response.json()["answer"]

API文档：docs/contributing/api.md

智能客服系统搭建

利用多轮对话记忆功能构建客服机器人，支持上下文理解与情绪识别：

关键配置：

# 在basic_settings.yaml中设置
CONVERSATION_MAX_TURNS: 20  # 对话轮次记忆
EMOTION_RECOGNITION: true   # 情绪识别开关

对话管理模块：libs/chatchat-server/chatchat/chat/

总结与资源

Langchain-Chatchat作为开源本地化知识库解决方案，已帮助3000+企业解决文档管理难题。通过本文指南，你已掌握从部署到高级应用的全流程知识。

学习资源：

官方教程：docs/
视频教程：B站搜索"Langchain-Chatchat实战"
社区支持：加入官方微信群（扫描下方二维码）

贡献指南：docs/contributing/
版本更新日志：markdown_docs/release.md

本项目采用Apache-2.0开源协议，欢迎商业使用与二次开发。

Langchain-Chatchat

项目地址：https://gitcode.com/GitHub_Trending/la/Langchain-Chatchat

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力