Langchain-Chatchat项目中使用Ollama本地向量模型的配置指南

2025-05-04 08:44:28作者：史锋燃Gardner

在Langchain-Chatchat项目中，使用本地向量模型或Ollama托管的向量模型是一个常见需求。本文将详细介绍如何正确配置这些模型，帮助开发者充分利用本地计算资源。

配置Ollama向量模型的基本方法

要在Langchain-Chatchat中使用Ollama托管的向量模型，首先需要修改model_settings.yaml配置文件。以下是关键配置项：

设置默认模型：

DEFAULT_LLM_MODEL: qwen:32b
DEFAULT_EMBEDDING_MODEL: mxbai-embed-large

配置模型参数：

LLM_MODEL_CONFIG:
  llm_model:
    model: 'qwen:32b'
    temperature: 0.9
    max_tokens: 4096
    history_len: 10

设置Ollama平台连接：

MODEL_PLATFORMS:
  - platform_name: ollama
    platform_type: ollama
    api_base_url: http://localhost:11434/v1
    api_key: EMPTY
    llm_models:
      - qwen:32b
    embed_models:
      - mxbai-embed-large

常见问题解决方案

在实际配置过程中，开发者可能会遇到以下问题：

模型名称格式问题：
- 避免在模型名称中包含版本号，如"nomic-embed-text:v1.5"应简化为"nomic-embed-text"
- 确保模型名称与Ollama中实际拉取的模型名称完全一致
模型访问错误：
- 当出现"failed to access embed model"错误时，检查：
  - 模型是否已在Ollama中正确下载
  - 配置文件中的模型名称拼写是否正确
  - API端点是否可访问
配置冲突问题：
- 如果系统仍然尝试访问未配置的模型(如bge-large-zh-v1.5)，需要检查：
  - 项目代码中是否有硬编码的默认模型设置
  - 是否有多处配置文件存在冲突

高级配置技巧

多模型管理：
- 可以在Ollama平台配置中同时指定多个LLM模型和嵌入模型
- 通过DEFAULT_LLM_MODEL和DEFAULT_EMBEDDING_MODEL切换默认模型
性能调优：
- 调整api_concurrencies参数控制并发请求数
- 根据硬件资源合理设置max_tokens等参数
Docker环境注意事项：
- 确保容器内可以访问宿主机的Ollama服务
- 检查端口映射是否正确
- 确认容器内的配置文件已正确挂载