AIri本地化部署指南：在私有环境中实现LLM驱动的虚拟角色离线运行

2026-03-09 04:40:25作者：范靓好Udolf

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama's altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

一、核心痛点与技术挑战

在数字陪伴日益普及的今天，AIri作为基于LLM驱动的Live2D/VRM虚拟角色，为用户带来了全新的互动体验。然而，网络依赖性和隐私安全问题成为制约其普及的两大瓶颈。本文将深入分析本地化部署过程中的核心技术挑战，并提供一套完整的解决方案，帮助用户在私有环境中构建安全、高效的AIri离线运行系统。

1.1 技术挑战分析

本地化部署AIri面临三大核心挑战：

计算资源需求与硬件适配：LLM模型推理需要强大的计算支持，如何在不同硬件配置下实现最佳性能是首要难题。

服务架构设计：AIri包含模型服务、API服务、前端渲染等多个组件，如何设计低耦合的本地化服务架构是系统稳定性的关键。

数据流转与隐私保护：实现完全离线运行意味着所有数据处理必须在本地完成，如何确保数据不泄露同时保证功能完整性是重要考量。

1.2 硬件选择技术决策树

选择合适的硬件配置是本地化部署的基础，以下决策树可帮助你根据需求和预算做出选择：

是否需要实时语音交互?
├── 是 → 推荐配置:
│   ├── CPU: 12核以上
│   ├── 内存: 32GB RAM
│   ├── GPU: NVIDIA RTX 3080 (10GB显存)以上
│   └── 存储: 100GB SSD
└── 否 → 基础配置:
    ├── CPU: 8核以上
    ├── 内存: 16GB RAM
    ├── GPU: NVIDIA GTX 1660 (6GB显存)以上
    └── 存储: 50GB SSD

图1: AIri虚拟角色形象 - 本地化部署的核心交互对象

二、模块化部署方案

2.1 环境准备模块

2.1.1 基础工具链安装

🔧 执行卡片：开发环境初始化

操作目的：安装项目所需的基础开发工具
关键命令：

# 安装Rust工具链
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh

# 安装Node.js (v16+)和pnpm
curl -fsSL https://deb.nodesource.com/setup_16.x | sudo -E bash -
sudo apt-get install -y nodejs
npm install -g pnpm

# 克隆项目仓库
git clone https://gitcode.com/GitHub_Trending/ai/airi
cd airi

预期结果：项目目录下出现完整的源代码结构，可通过ls命令查看主要文件夹

2.2 模型服务模块

2.2.1 Ollama模型管理

🔧 执行卡片：Ollama安装与配置

操作目的：部署本地模型管理服务
关键命令：

# 安装Ollama
curl https://ollama.ai/install.sh | sh

# 启动Ollama服务
ollama serve &

# 下载基础模型 (根据硬件选择合适模型)
# 轻量级配置
ollama pull nomic-embed-text  # 嵌入模型
ollama pull mistral:7b-q4_0   # 7B量化模型(适合8GB显存)

# 高性能配置
ollama pull nomic-embed-text
ollama pull llama2:13b        # 13B模型(需要16GB以上显存)

预期结果：通过ollama list命令可看到已下载的模型列表

2.2.2 MCP服务器部署

🔧 执行卡片：MCP服务器启动

操作目的：启动AIri专用模型控制协议服务器
关键命令：

# 进入MCP插件目录
cd crates/tauri-plugin-mcp

# 编译并运行MCP服务
cargo run --release &

# 验证服务是否启动成功
curl http://localhost:8081/health

预期结果：返回{"status":"ok"}表示MCP服务器启动成功

底层原理解析：MCP(Model Control Protocol)服务器是AIri项目的模型管理核心，它提供统一的模型调用接口，协调不同LLM模型的加载、推理和资源分配，类似于模型服务的"交通指挥官"。

2.3 项目配置模块

2.3.1 环境变量配置矩阵

配置项	本地部署推荐值	作用	注意事项
LLM_API_BASE_URL	http://localhost:11434/v1/	配置本地LLM服务地址	Ollama默认地址
LLM_MODEL	mistral:7b-q4_0	指定使用的对话模型	根据硬件性能选择
EMBEDDING_MODEL	nomic-embed-text	指定嵌入模型	建议保持默认
VITE_API_BASE_URL	http://localhost:8080/api	前端API地址	需与后端服务端口一致
VITE_LOAD_REMOTE_RESOURCES	false	是否加载远程资源	离线部署必须设为false

🔧 执行卡片：环境变量配置

操作目的：配置项目环境变量指向本地服务
关键命令：

# 配置Telegram机器人环境变量
cd services/telegram-bot
cp .env.example .env.local

# 使用编辑器修改.env.local文件
# 设置本地模型参数
# LLM_API_BASE_URL='http://localhost:11434/v1/'
# LLM_MODEL='mistral:7b-q4_0'
# EMBEDDING_MODEL='nomic-embed-text'

# 配置前端环境变量
cd ../../apps/stage-web
cp .env.example .env.local

# 设置本地API地址
# VITE_API_BASE_URL=http://localhost:8080/api
# VITE_LOAD_REMOTE_RESOURCES=false

预期结果：项目根目录下生成.env.local文件，包含所有本地服务配置

2.3.2 依赖安装

🔧 执行卡片：项目依赖安装

操作目的：安装所有项目依赖
关键命令：

# 返回项目根目录
cd ../../..

# 安装项目依赖
pnpm install

# 构建核心模块
pnpm build:core

预期结果：所有依赖安装完成，无错误提示

三、场景化验证流程

3.1 核心服务启动流程

3.1.1 后端服务启动

🔧 执行卡片：启动后端服务

操作目的：启动API服务和模型服务
关键命令：

# 启动API服务
cd packages/server-runtime
pnpm start &

# 启动前端开发服务器
cd ../../apps/stage-web
pnpm dev &

# 启动虚拟角色渲染服务
cd ../stage-tamagotchi
pnpm dev &

预期结果：三个服务均成功启动，无错误日志输出

3.2 功能验证场景

3.2.1 文本对话功能验证

✅ 验证步骤：

打开浏览器访问http://localhost:5173
在聊天框输入"你好，你叫什么名字？"
观察是否收到AIri的文本回复

预期结果：AIri能在3-10秒内回复，内容包含自我介绍

3.2.2 语音交互功能验证

✅ 验证步骤：

确保麦克风已连接并授权
点击界面上的麦克风图标
说出"今天天气怎么样？"
观察是否能正确识别并生成语音回复

预期结果：系统能识别语音输入，并在5-15秒内生成语音回复

3.2.3 离线功能验证

✅ 验证步骤：

断开网络连接
重复上述文本和语音验证步骤
检查功能是否正常工作

预期结果：所有功能在离线状态下仍能正常工作，无网络请求错误

四、部署复杂度评估

部署方案	技术复杂度	硬件要求	维护成本	推荐用户群体
基础文本版	⭐⭐☆☆☆	低	低	入门用户
完整语音版	⭐⭐⭐☆☆	中	中	进阶用户
全功能版	⭐⭐⭐⭐☆	高	高	开发者用户

4.1 方案选择建议

入门用户：选择基础文本版，使用7B量化模型，无需GPU也可运行
进阶用户：选择完整语音版，配备中端GPU，体验完整交互功能
开发者用户：选择全功能版，配置高性能GPU，可进行二次开发

五、故障排除决策流程图

启动失败?
├── 是 → 检查服务日志:
│   ├── API服务日志: packages/server-runtime/logs/
│   ├── 前端日志: 浏览器开发者工具控制台
│   └── 模型服务日志: journalctl -u ollama
└── 否 → 功能异常?
    ├── 是 → 检查:
    │   ├── 网络连接是否已断开?
    │   ├── 模型是否正确加载?
    │   └── 环境变量是否配置正确?
    └── 否 → 性能问题?
        ├── 是 → 优化:
        │   ├── 降低模型参数
        │   ├── 启用模型量化
        │   └── 关闭其他应用释放资源
        └── 否 → 部署成功