Cleo项目自托管部署指南:从零开始搭建你的AI助手
2025-06-07 23:10:10作者:羿妍玫Ivan
前言
Cleo是一款功能强大的AI助手系统,支持自托管部署,让用户能够在私有环境中运行AI服务。本文将详细介绍如何在本地环境中部署Cleo,包括Docker和Pip两种安装方式,以及后续的配置和使用方法。
为什么选择自托管Cleo?
自托管Cleo具有以下显著优势:
- 数据隐私保护:所有数据都保留在您的私有网络中,甚至可以完全离线运行
- 高度可定制:从AI模型选择到功能配置,您可以根据需求自由调整
- 性能优化:可以根据硬件条件优化运行效率,特别是GPU加速
部署准备
在开始部署前,请确保您的系统满足以下基本要求:
- 操作系统:支持macOS、Windows(WSL2)和Linux
- 内存:至少8GB,推荐16GB以上
- 存储空间:至少5GB可用空间
- 网络:基础部署不需要互联网连接(离线模型)
部署方式选择
Cleo提供两种主要部署方式:
1. Docker部署(推荐)
Docker方式适合大多数用户,提供隔离的环境和简化的依赖管理。
系统特定准备
macOS用户:
- 安装Docker Desktop或通过Homebrew安装:
brew install --cask docker brew install docker-compose
Windows用户:
- 安装WSL2(Windows Subsystem for Linux 2)
wsl --install - 安装Docker Desktop并启用WSL2后端
Linux用户:
- 通过系统包管理器安装Docker Engine和Docker Compose
部署步骤
-
创建配置目录并下载docker-compose文件:
mkdir ~/.cleo && cd ~/.cleo wget [Cleo的docker-compose.yml文件地址] -
配置环境变量:
- 必须设置:
CLEO_ADMIN_PASSWORD、CLEO_DJANGO_SECRET_KEY - 可选设置:商业AI模型的API密钥(OpenAI/Anthropic/Gemini)
- 离线模型:配置
OPENAI_BASE_URL指向本地Ollama等服务
- 必须设置:
-
启动服务:
docker-compose up
2. Pip直接安装
适合需要深度定制或资源受限的环境。
安装命令
根据不同系统和硬件配置,安装命令有所区别:
macOS(M1/M2芯片):
CMAKE_ARGS="-DGGML_METAL=on" python -m pip install 'cleo[local]'
Windows(CUDA GPU):
$env:CMAKE_ARGS = "-DGGML_CUDA=on"
py -m pip install 'cleo[local]'
Linux(AMD GPU):
CMAKE_ARGS="-DGGML_HIPBLAS=on" FORCE_CMAKE=1 python -m pip install 'cleo[local]'
首次运行
启动服务:
USE_EMBEDDED_DB="true" cleo --anonymous-mode
首次运行会引导您:
- 创建管理员账户
- 配置聊天模型
- 完成基础设置
模型配置指南
Cleo支持多种AI模型,包括商业API和本地离线模型。
商业API模型配置
-
OpenAI:
- 需要API密钥
- 支持自定义API端点(兼容Ollama等)
- 示例模型:gpt-4o
-
Anthropic Claude:
- 需要API密钥
- 示例模型:claude-3-5-sonnet
-
Google Gemini:
- 需要API密钥
- 示例模型:gemini-2.0-flash
离线模型配置
- 从模型仓库选择GGUF格式的模型
- 在管理界面添加模型信息
- 首次使用时自动下载模型文件
- 支持GPU加速(需相应硬件)
客户端连接
部署完成后,可以通过以下方式访问:
- Web界面:http://localhost:42110
- 桌面客户端:提供更好的系统集成
- Obsidian/Emacs插件:与常用工具深度集成
常见问题解决
-
管理员面板访问问题:
- 确保使用localhost而非127.0.0.1
- 检查CSRF和域名设置
-
模型加载缓慢:
- 首次使用离线模型需要下载,请耐心等待
- 确保硬件满足模型要求
-
GPU加速不工作:
- 检查驱动安装
- 验证部署时的GPU参数设置
进阶配置建议
- 自动启动:配置系统服务实现开机自启
- 远程访问:通过反向代理安全暴露服务
- 知识同步:连接Notion或本地文档库
- 多模型管理:配置默认模型和专用模型
结语
通过本文的指导,您应该已经成功在本地环境部署了Cleo AI助手系统。自托管方式为您提供了完全控制权和数据隐私保障,同时也带来了灵活的定制可能性。根据您的具体需求,可以进一步探索Cleo的高级功能和集成选项,打造专属的AI助手体验。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0187
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0112
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
omega-aiOmega-AI:基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多线程与GPU运算,GPU支持CUDA,CUDNN。Java03
llm-universe本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/Jupyter Notebook08
热门内容推荐
最新内容推荐
项目优选
收起
deepin linux kernel
C
32
16
暂无描述
Dockerfile
759
4.94 K
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.78 K
187
暂无简介
Dart
1 K
259
Ascend Extension for PyTorch
Python
716
866
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
854
1.91 K
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.07 K
1.09 K
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.72 K
1.02 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
674
1.32 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
454
436