3步打造你的离线AI助手：AIri本地化部署全攻略

2026-03-09 04:39:05作者：明树来

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama's altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

AIri作为基于LLM驱动的Live2D/VRM虚拟角色，能为用户提供沉浸式的AI交互体验。然而，网络依赖、数据隐私泄露风险以及硬件资源限制，常常成为用户顺畅使用AIri的阻碍。通过本地化部署，不仅可以实现无网络环境下的稳定运行，还能有效保护个人数据安全，同时根据自身硬件条件优化性能。本文将采用"问题-方案-验证"框架，带你完成AIri的本地化部署，打造专属的离线AI伙伴。

一、痛点解析：AIri在线运行的三大核心挑战

1.1 网络依赖困境

AIri的核心功能依赖于云端LLM服务，在网络不稳定或无网络环境下，语音交互、文本对话等功能将完全失效。特别是在旅行、偏远地区等场景，用户无法享受连贯的AI服务体验。数据传输过程中，还可能因网络延迟导致交互卡顿，影响虚拟角色的实时响应表现。

1.2 数据隐私风险

使用云端服务时，用户的对话内容、语音数据等敏感信息需要传输至第三方服务器，存在数据泄露和被滥用的风险。对于注重隐私保护的用户而言，将个人交互数据暴露在网络中，可能导致隐私泄露、个性化数据被用于训练等安全问题。

1.3 硬件资源限制

云端服务对硬件配置有较高要求，低端设备可能无法流畅运行AIri的全部功能。同时，不同用户的硬件环境差异较大，部分设备可能因CPU性能不足、内存容量有限或缺乏独立显卡，导致虚拟角色渲染卡顿、语音处理延迟等问题。

💡 实用提示：在决定本地化部署前，建议先评估自身使用场景中网络稳定性、数据敏感度以及硬件条件，确认本地化部署是否能解决实际问题。

二、模块化方案：三步实现AIri本地化部署

2.1 环境适配：打造兼容本地运行的基础环境

2.1.1 硬件兼容性检测指南

在开始部署前，需确保硬件满足AIri本地运行的基本要求。以下是推荐配置与最低配置的对比：

硬件组件	推荐配置	最低配置	影响功能
处理器	8核CPU	4核CPU	模型推理速度、多任务处理能力
内存	16GB RAM	8GB RAM	模型加载、并发处理稳定性
显卡	NVIDIA GPU（8GB显存）	集成显卡	图形渲染、模型推理加速
存储	100GB可用空间	50GB可用空间	模型文件存储、项目文件存放

可通过以下命令检查系统硬件信息：

# 查看CPU信息
lscpu | grep "Core(s) per socket"

# 查看内存信息
free -h

# 查看显卡信息（NVIDIA）
nvidia-smi

2.1.2 必要工具安装与配置

本地化部署需要安装Git、Node.js、pnpm和Rust工具链等基础工具。执行以下命令完成安装：

# 安装Git
sudo apt update && sudo apt install -y git

# 安装Node.js（v16+）和pnpm
curl -fsSL https://deb.nodesource.com/setup_16.x | sudo -E bash -
sudo apt install -y nodejs
npm install -g pnpm

# 安装Rust工具链
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh -s -- -y
source $HOME/.cargo/env

克隆AIri项目仓库：

git clone https://gitcode.com/GitHub_Trending/ai/airi
cd airi

💡 实用提示：建议使用Ubuntu 20.04+或Windows 10/11系统进行部署，这两个系统对AIri的兼容性最佳。安装过程中若遇到依赖问题，可参考项目根目录下的README.md文件获取帮助。

2.2 核心服务：搭建本地模型与管理系统

2.2.1 Ollama模型管理工具部署

Ollama是一款轻量级的模型管理工具，支持一键下载和运行主流LLM模型。安装并配置Ollama：

# Linux系统安装Ollama
curl https://ollama.ai/install.sh | sh

# 启动Ollama服务
ollama serve &

# 下载嵌入模型
ollama pull nomic-embed-text

# 下载对话模型（根据硬件选择）
# 7B参数模型（适合中等配置）
ollama pull mistral
# 13B参数模型（需要较高配置）
# ollama pull llama2:13b

2.2.2 MCP服务器配置与启动

MCP（Model Control Protocol）服务器是AIri项目的模型管理核心组件，负责协调本地模型与应用程序的交互。核心配置文件：[crates/tauri-plugin-mcp/src/config.rs]

# 进入MCP插件目录
cd crates/tauri-plugin-mcp

# 编译并运行MCP服务
cargo run --release

MCP服务器默认监听本地端口，可通过修改配置文件调整端口和模型路径，以适应不同的部署环境。

💡 实用提示：如果硬件配置有限，建议优先选择7B参数的模型（如mistral），在保证基本功能的同时减少资源占用。Ollama支持模型量化，可通过ollama pull mistral:7b-q4_0命令下载量化版本，进一步降低显存需求。

2.3 功能组件：配置AIri核心模块

2.3.1 环境变量配置

AIri使用环境变量管理关键配置，包括LLM模型地址、API密钥等。以Telegram机器人服务为例：

# 进入服务目录
cd services/telegram-bot

# 复制环境变量示例文件
cp .env.example .env.local

# 编辑.env.local文件，设置本地模型参数
nano .env.local

在.env.local文件中添加以下配置：

# 设置本地LLM API地址（Ollama默认地址）
LLM_API_BASE_URL='http://localhost:11434/v1/'

# 设置使用的本地模型名称
LLM_MODEL='mistral'

# 配置嵌入模型
EMBEDDING_API_BASE_URL='http://localhost:11434/v1/'
EMBEDDING_MODEL='nomic-embed-text'

2.3.2 依赖安装与服务启动

安装项目所有依赖并启动核心服务：

# 返回项目根目录
cd ../../..

# 安装项目依赖
pnpm install

# 启动后端API服务
cd packages/server-runtime
pnpm start &

# 启动前端应用
cd ../../apps/stage-web
pnpm dev &

# 启动虚拟角色渲染服务
cd ../stage-tamagotchi
pnpm dev &

💡 实用提示：不同服务的环境配置类似，例如Discord机器人的配置文件位于[services/discord-bot/.env.example]，Minecraft服务的配置可参考[services/minecraft/README.md]。启动服务时建议使用&符号将进程放入后台，便于同时管理多个服务。