首页
/ Cheshire Cat AI 项目在 Windows 环境下使用本地 LLM 和 Qdrant 的部署问题解析

Cheshire Cat AI 项目在 Windows 环境下使用本地 LLM 和 Qdrant 的部署问题解析

2025-06-29 01:39:01作者:宣聪麟

问题背景

在 Windows 10 环境下部署 Cheshire Cat AI 项目时,用户尝试按照官方文档使用本地 LLM 和 Qdrant 向量数据库的组合方案。系统配置为 i7 3770 CPU、32GB RAM 和 GeForce RTX 3060 12GB 显卡,使用最新版 Docker Desktop 4.28.0。

核心错误现象

在启动过程中,系统报出以下关键错误:

  1. FastEmbed 库的警告信息,提示 DefaultEmbedding、FlagEmbedding 和 JinaEmbedding 已被弃用
  2. Qdrant 客户端在解析响应时出现验证错误,具体为 max_optimization_threads 参数应为整数但收到了 None 值
  3. 最终导致应用启动失败

技术分析

该问题主要源于 Windows 环境下 Qdrant 服务的兼容性问题。错误链显示:

  1. 首先出现的是 FastEmbed 库的弃用警告,这属于正常现象,不影响核心功能
  2. 关键问题出现在 Qdrant 客户端尝试获取集合信息时,无法正确处理返回的配置参数
  3. 具体表现为 optimizer_config.max_optimization_threads 参数应为整数但收到了 None 值,导致验证失败

解决方案

经过验证,在 Windows 环境下可采用以下部署方案:

  1. 仅保留 docker-compose.yml 中的 cheshire-cat-core 和 ollama 服务
  2. 注释或移除 qdrant 服务相关配置
  3. 通过 Cheshire Cat 的管理面板手动添加 Qdrant 连接

这种方案绕过了 Windows 环境下 Qdrant 容器化部署的兼容性问题,同时仍能保持全部功能。

部署建议

对于 Windows 用户,推荐以下最佳实践:

  1. 使用精简版 docker-compose.yml,仅包含核心服务和 Ollama
  2. 通过管理界面配置 Qdrant 连接,而非通过容器化部署
  3. 确保 GPU 资源正确分配给 Ollama 容器以加速本地 LLM 推理
  4. 监控系统资源使用情况,特别是 GPU 内存占用

这种部署方式已在多个 Windows 环境中验证可行,能够稳定运行 Cheshire Cat AI 项目的全部功能。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
197
2.17 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
208
285
pytorchpytorch
Ascend Extension for PyTorch
Python
59
94
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
973
574
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
549
81
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.02 K
399
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
393
27
MateChatMateChat
前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。 官网地址:https://matechat.gitcode.com
1.2 K
133