Cheshire Cat AI 项目在 Windows 环境下使用本地 LLM 和 Qdrant 的部署问题解析

2025-06-29 07:29:33作者：宣聪麟

Production ready AI assistant framework

项目地址：https://gitcode.com/gh_mirrors/core92/core

问题背景

在 Windows 10 环境下部署 Cheshire Cat AI 项目时，用户尝试按照官方文档使用本地 LLM 和 Qdrant 向量数据库的组合方案。系统配置为 i7 3770 CPU、32GB RAM 和 GeForce RTX 3060 12GB 显卡，使用最新版 Docker Desktop 4.28.0。

核心错误现象

在启动过程中，系统报出以下关键错误：

FastEmbed 库的警告信息，提示 DefaultEmbedding、FlagEmbedding 和 JinaEmbedding 已被弃用
Qdrant 客户端在解析响应时出现验证错误，具体为 max_optimization_threads 参数应为整数但收到了 None 值
最终导致应用启动失败

技术分析

该问题主要源于 Windows 环境下 Qdrant 服务的兼容性问题。错误链显示：

首先出现的是 FastEmbed 库的弃用警告，这属于正常现象，不影响核心功能
关键问题出现在 Qdrant 客户端尝试获取集合信息时，无法正确处理返回的配置参数
具体表现为 optimizer_config.max_optimization_threads 参数应为整数但收到了 None 值，导致验证失败

解决方案

经过验证，在 Windows 环境下可采用以下部署方案：

仅保留 docker-compose.yml 中的 cheshire-cat-core 和 ollama 服务
注释或移除 qdrant 服务相关配置
通过 Cheshire Cat 的管理面板手动添加 Qdrant 连接

这种方案绕过了 Windows 环境下 Qdrant 容器化部署的兼容性问题，同时仍能保持全部功能。

部署建议

对于 Windows 用户，推荐以下最佳实践：

使用精简版 docker-compose.yml，仅包含核心服务和 Ollama
通过管理界面配置 Qdrant 连接，而非通过容器化部署
确保 GPU 资源正确分配给 Ollama 容器以加速本地 LLM 推理
监控系统资源使用情况，特别是 GPU 内存占用

这种部署方式已在多个 Windows 环境中验证可行，能够稳定运行 Cheshire Cat AI 项目的全部功能。

Production ready AI assistant framework

项目地址：https://gitcode.com/gh_mirrors/core92/core

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。