本地部署LLM驱动的AIri：打造你的专属离线虚拟助手

2026-03-09 04:37:20作者：冯梦姬Eddie

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama's altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

问题引入：打破AIri使用的网络枷锁

当你在没有网络的环境中想要与AIri互动时，是否遇到过功能受限的困扰？本文将通过本地化部署方案，让你彻底摆脱网络依赖，实现AIri的全功能离线运行。我们将采用"3大步骤+2个验证+1套优化"的实践框架，帮助你从零开始搭建完整的本地AI助手生态。

图1：AIri虚拟角色形象 - 本地部署后你将拥有的专属离线AI伙伴

核心价值：本地化部署的五大优势

本地化部署LLM模型不仅解决网络依赖问题，更带来五大核心价值：数据隐私完全掌控、响应速度提升40%以上、自定义模型适配、无使用成本限制以及断网环境下的持续可用性。对于需要频繁交互或对数据安全有高要求的用户，这是最佳解决方案。

分步实施：构建本地AIri生态系统

1. 部署私有模型引擎

核心概要：搭建本地模型服务是实现离线运行的基础，我们将使用Ollama作为模型管理工具，配合项目内置的MCP服务器实现模型统一调度。

✅ 环境准备清单

操作系统：Ubuntu 22.04 LTS / Windows 11 / macOS 13+
硬件配置：
- 最低配置：4核CPU，16GB RAM，集成显卡
- 推荐配置：8核CPU，32GB RAM，NVIDIA RTX 3060（8GB显存）
必备工具：Git、Node.js v18+、pnpm、Rust工具链

✅ 克隆项目代码库

git clone https://gitcode.com/GitHub_Trending/ai/airi
cd airi

✅ 安装Ollama模型管理工具

# Linux系统
curl https://ollama.ai/install.sh | sh

# Windows系统：从Ollama官网下载安装包
# macOS系统：brew install ollama

✅ 启动Ollama服务并下载模型

# 启动服务（Linux/macOS）
ollama serve &

# 下载基础模型（选择适合你硬件的模型）
ollama pull mistral:7b  # 中等配置推荐
# ollama pull llama2:13b  # 高性能配置推荐（需16GB+显存）
# ollama pull phi3:mini  # 低配置设备推荐

💡 实战技巧：模型下载过程可能需要30分钟到2小时，建议在网络稳定时进行。对于网络条件有限的用户，可以通过其他设备下载模型文件后，手动放置到Ollama的模型目录（Linux: ~/.ollama/models，Windows: C:\Users<用户名>.ollama\models）。

✅ 启动MCP服务器

cd crates/tauri-plugin-mcp
cargo run --release -- --port 8081

2. 配置项目环境变量

核心概要：通过环境变量配置，将AIri各组件指向本地模型服务，实现全系统离线化。

✅ 创建环境配置文件

# 复制环境变量模板
cp .env.example .env.local

# 使用编辑器打开配置文件
nano .env.local

✅ 配置关键参数

# 模型服务配置
LLM_PROVIDER=ollama
LLM_BASE_URL=http://localhost:11434/v1
LLM_MODEL=mistral:7b

# 嵌入模型配置
EMBEDDING_PROVIDER=ollama
EMBEDDING_MODEL=nomic-embed-text
EMBEDDING_BASE_URL=http://localhost:11434/v1

# 本地服务配置
MCP_SERVER_URL=http://localhost:8081
LOCAL_MODE=true

✅ 安装项目依赖

# 返回项目根目录
cd ../../

# 安装所有依赖
pnpm install

# 构建核心模块
pnpm run build:core

⚠️ 注意事项：依赖安装过程中可能会遇到Rust组件编译失败，主要原因是缺少系统依赖库。Ubuntu用户可通过sudo apt install libssl-dev pkg-config解决，Windows用户需要安装Visual Studio构建工具。

3. 启动核心服务组件

核心概要：按正确顺序启动后端服务、前端应用和虚拟角色渲染模块，完成系统集成。

✅ 启动后端API服务

cd packages/server-runtime
pnpm start:local

✅ 启动前端应用

# 打开新终端
cd apps/stage-web
pnpm dev --host

✅ 启动虚拟角色渲染服务

# 打开新终端
cd apps/stage-tamagotchi
pnpm dev

💡 实战技巧：三个服务需要分别在不同终端启动，建议使用终端分屏工具同时监控它们的运行状态。首次启动时会进行资源预加载，可能需要5-10分钟，请耐心等待。

场景验证：确保离线功能正常运行

验证文本交互功能

✅ 访问前端界面：打开浏览器访问 http://localhost:5173 ✅ 进行文本对话：在聊天框输入"你好，介绍一下自己" ✅ 验证离线响应：确认AIri能生成回复且不产生网络请求

验证语音交互功能

✅ 配置音频设备：确保麦克风和扬声器正常工作 ✅ 测试语音输入：点击语音按钮并说出"今天天气怎么样" ✅ 验证语音输出：确认AIri能正确识别并以语音方式回应

⚠️ 常见问题：如果语音功能无法工作，检查项目根目录下的[音频处理]模块配置，确保本地ASR/TTS服务已正确启动。

进阶拓展：优化与定制

跨平台兼容性配置

Windows系统：

需要额外安装Visual C++ Redistributable
模型路径：C:\Users\<用户名>\.ollama\models
服务启动：使用PowerShell以管理员身份运行

macOS系统：

通过Homebrew安装依赖：brew install node rust
权限设置：系统偏好设置 > 安全性与隐私 > 允许AIri访问麦克风

Linux系统：

推荐使用systemd管理服务自启动
音频权限：sudo usermod -aG audio $USER

性能优化指南

模型优化：

启用模型量化：ollama pull mistral:7b-q4_0（4位量化版本）
调整推理参数：修改~/.ollama/config中的num_ctx和num_thread

系统优化：

增加swap空间：对于内存不足的系统
GPU加速配置：安装CUDA Toolkit 11.7+以启用GPU推理

常见错误代码速查表

错误代码	可能原因	解决方案
E001	Ollama服务未启动	执行`ollama serve`启动服务
E002	模型文件损坏	删除模型目录并重新拉取
E003	端口冲突	修改配置文件中的端口号
E004	内存不足	关闭其他应用或使用更小模型
E005	权限不足	使用管理员权限运行服务