3步打造你的离线AI助手：本地LLM部署全攻略

2026-03-09 04:28:29作者：虞亚竹Luna

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama's altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

在数字时代，隐私保护与网络独立性成为用户日益关注的焦点。当你与AI助手交互时，是否曾担心对话数据被上传至云端？是否经历过因网络波动导致AI服务中断的尴尬？本地LLM部署技术为这些问题提供了完美解决方案——通过在个人设备上运行大语言模型（可本地运行的AI对话系统），你可以实现数据零上传、服务不中断的AI交互体验。本文将带你通过三个核心步骤，构建属于自己的离线AI助手，兼顾隐私安全与使用便捷性。

1. 构建本地推理引擎：从环境准备到模型部署

本地LLM部署的核心在于搭建高效的推理环境。这一步我们将完成硬件评估、基础工具安装和模型服务配置，为后续AI交互奠定基础。

性能需求分级表

配置等级	适用场景	最低配置要求	推荐模型规模
入门级	文本对话演示	CPU: 4核 / 内存: 8GB / 无GPU	3B参数模型
标准级	日常交互使用	CPU: 8核 / 内存: 16GB / GPU: 4GB显存	7B参数模型
高级级	复杂任务处理	CPU: 12核 / 内存: 32GB / GPU: 8GB显存	13B参数模型

[!TIP] 若使用笔记本电脑部署，建议优先选择低功耗模型（如Llama 3 8B），并确保散热良好。

核心工具链安装

基础环境配置
- 安装Git：用于获取项目代码
- 配置Node.js (v16+) 和pnpm：管理JavaScript依赖
- 部署Rust工具链：编译项目中的Rust组件

项目获取

git clone https://gitcode.com/GitHub_Trending/ai/airi
cd airi

模型管理工具选择
- Ollama：轻量化模型管理工具，支持一键部署主流模型
- 安装命令：curl https://ollama.ai/install.sh | sh

模型部署流程

启动Ollama服务：ollama serve
下载基础模型：ollama pull mistral（7B参数，平衡性能与效果）
验证部署：ollama run mistral "你好，AIri"

⚠️ 风险提示：首次模型下载可能需要30分钟以上，取决于网络状况。建议使用有线网络并避免中断下载。

✅ 成功标志：模型启动后能响应简单对话，无网络连接时仍可正常工作。

💡 常见误区：认为本地部署必须高端GPU。实际上，7B模型在现代CPU上也能运行，只是响应速度会慢1-2倍。可先使用CPU环境验证功能，再逐步升级硬件。

2. 配置AIri服务中枢：MCP服务器与环境变量

MCP（模型控制协议）服务器是AIri项目的神经中枢，负责协调模型调用、处理业务逻辑。正确配置这一环节，才能让本地模型真正为AIri虚拟角色提供智能支持。

MCP服务器部署

MCP服务器代码位于项目的Rust组件中，提供模型调度、推理优先级管理等核心功能。部署步骤如下：

进入MCP插件目录：cd crates/tauri-plugin-mcp
编译发布版本：cargo build --release
启动服务：./target/release/tauri-plugin-mcp

默认配置下，服务将监听本地3000端口，可通过修改配置文件调整参数。

环境变量配置

AIri各模块通过环境变量文件管理配置，关键参数包括模型地址、服务端口等。以Telegram机器人服务为例：

复制环境变量模板：cd services/telegram-bot && cp .env .env.local

编辑核心配置项：

# 本地LLM服务地址
LLM_API_BASE_URL='http://localhost:11434/v1/'
# 使用的模型名称
LLM_MODEL='mistral'
# 嵌入模型配置
EMBEDDING_MODEL='nomic-embed-text'

其他服务（如Discord机器人、Minecraft插件）的配置方法类似，只需修改对应服务目录下的.env.local文件。

[!TIP] 环境变量修改后需重启对应服务才能生效。建议使用grep -r "LLM_API_BASE_URL" .命令检查所有需要配置的服务文件。

⚠️ 风险提示：若同时运行多个服务实例，需确保端口不冲突（默认端口可在src/config.ts中修改）。

💡 常见误区：忽略嵌入模型配置。文本嵌入模型负责将对话内容转化为向量，缺少此配置会导致上下文理解能力大幅下降。

3. 构建交互界面：前端应用与功能验证

完成后端服务配置后，我们需要搭建用户交互界面，并验证整个系统的离线工作能力。AIri提供了Web前端和桌面应用两种交互方式。

Web前端配置

进入前端项目目录：cd apps/stage-web
创建本地环境配置：cp .env.example .env.local

配置本地API地址：

VITE_API_BASE_URL=http://localhost:8080/api
VITE_LOAD_REMOTE_RESOURCES=false

启动开发服务器：pnpm dev

访问http://localhost:5173即可看到AIri的虚拟角色界面。

关键功能验证清单

验证项目	测试方法	预期结果
文本对话	输入"你能做什么？"	模型返回功能介绍，无网络时正常响应
语音识别	点击麦克风图标说话	语音转为文字并得到回应
角色动画	进行多轮对话	虚拟角色根据对话内容展示表情动作