AIri本地部署全攻略：打造你的专属离线虚拟角色

2026-03-09 04:32:44作者：秋泉律Samson

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama's altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

担心云端服务中断导致虚拟角色无法响应？顾虑敏感对话数据泄露风险？希望在无网络环境下仍能与AIri顺畅互动？本文将带你通过本地化部署，将基于LLM驱动的Live2D/VRM虚拟角色AIri完全部署到本地环境，实现数据隐私保护与无网络依赖的稳定运行。

一、痛点解析：为什么需要本地部署AIri

1. 数据安全三大隐患

云端交互模式下，你的每一次对话、语音指令都需要经过第三方服务器中转。这些包含个人偏好与隐私的交互数据，存在被存储、分析甚至泄露的风险。医疗咨询、家庭对话等敏感场景尤其需要数据本地化保护。

2. 网络依赖的致命缺陷

网络波动导致对话中断、语音识别延迟、角色动作卡顿——这些问题在网络条件不佳时尤为突出。本地部署能彻底摆脱网络束缚，实现毫秒级响应速度。

3. 资源成本优化需求

持续使用云端API会产生累积成本，特别是语音交互和模型调用频繁的场景。本地部署虽有初期硬件投入，但长期使用成本几乎为零。

二、方案设计：本地化部署的技术架构

1. 三步搭建本地模型服务

💡 实操提示：推荐先在终端执行nvidia-smi（NVIDIA显卡）或rocm-smi（AMD显卡）确认GPU是否支持硬件加速

# 安装模型管理工具
curl -fsSL https://ollama.com/install.sh | sh

# 启动服务并下载推荐模型
ollama serve &
ollama pull mistral:7b # 基础对话模型
ollama pull nomic-embed-text # 嵌入模型

通俗解释：Ollama就像模型应用商店，帮你一键下载、安装和运行各种AI模型，省去手动配置环境的麻烦。

2. 零门槛配置MCP服务器

MCP（Model Control Protocol）是AIri项目专属的模型管理核心，代码位于crates/tauri-plugin-mcp/。启动步骤：

# 进入MCP插件目录
cd crates/tauri-plugin-mcp

# 编译并启动服务
cargo run --release

3. 环境配置的避坑指南

项目使用.env文件管理配置，以Telegram机器人服务为例：

# 复制环境变量模板
cd services/telegram-bot
cp .env.example .env.local

编辑.env.local文件，关键配置如下：

# 本地模型服务地址
LLM_API_BASE_URL='http://localhost:11434/v1/'
# 使用的模型名称
LLM_MODEL='mistral:7b'

三、实施步骤：从环境准备到功能验证

1. 硬件配置双方案选择

配置类型	CPU	内存	显卡	存储
最低配置	4核	8GB	无GPU	30GB
推荐配置	8核	16GB	NVIDIA 8GB显存	60GB

💡 实操提示：若无独立显卡，可使用CPU模式运行，但响应速度会降低50%以上

2. 四步完成基础环境搭建

克隆项目代码

git clone https://gitcode.com/GitHub_Trending/ai/airi
cd airi

安装系统依赖

# Ubuntu/Debian系统示例
sudo apt install -y build-essential libssl-dev pkg-config

安装开发工具链

# 安装Node.js和pnpm
curl -fsSL https://get.pnpm.io/install.sh | sh
pnpm env use 18

# 安装Rust工具链
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh

安装项目依赖

pnpm install

3. 核心模块配置与启动

后端服务启动

# 启动API服务
cd packages/server-runtime
pnpm start

前端应用配置

# 进入前端目录
cd apps/stage-web

# 创建本地配置文件
echo "VITE_API_BASE_URL=http://localhost:8080/api" > .env.local
echo "VITE_LOAD_REMOTE_RESOURCES=false" >> .env.local

# 启动开发服务器
pnpm dev

虚拟角色渲染服务

cd apps/stage-tamagotchi
pnpm dev

4. 功能验证四步法

界面访问：打开浏览器访问http://localhost:5173，应显示AIri角色界面
文本对话：在聊天框输入"你好"，检查是否收到本地模型回复
语音交互：点击麦克风图标，说出"今天天气如何"，验证语音识别与合成功能
离线测试：断开网络连接后重复上述测试，确认功能正常

四、优化策略：性能调优与安全加固

1. 模型优化三技巧

模型量化：使用4-bit量化版本减少显存占用
```
ollama pull mistral:7b-q4_0
```
推理参数调整：修改crates/tauri-plugin-mcp/src/config.rs降低温度参数
后台进程管理：使用systemd将Ollama服务设置为开机自启

2. 安全加固两要点

网络隔离：配置防火墙只开放必要端口，编辑nix/firewall.nix
权限控制：限制服务运行用户权限，修改docker-compose.yml中的user配置

3. 资源占用优化

关闭前端动画效果：编辑apps/stage-web/src/utils/animation.ts
调整模型推理线程数：修改services/server/src/config.ts中的threads参数

五、成果与进阶

已实现功能清单

✅ 完全离线的文本对话能力
✅ 本地语音识别与合成
✅ 虚拟角色实时渲染
✅ 数据隐私本地保护

进阶探索方向

模型定制：训练个性化对话模型，参考docs/content/zh-Hans/docs/model-training.md
技能扩展：开发本地技能插件，示例代码位于plugins/airi-plugin-homeassistant/
硬件加速：配置GPU推理优化，参考NVIDIA CUDA配置指南

通过本文的本地化部署方案，你已成功将AIri虚拟角色完全部署到本地环境，实现了数据隐私保护与无网络依赖的稳定运行。随着硬件性能的提升和模型优化技术的发展，本地部署的体验将持续改善，为你带来更安全、更流畅的虚拟角色互动体验。

airi

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

登录后查看全文

AIri本地部署全攻略：打造你的专属离线虚拟角色

一、痛点解析：为什么需要本地部署AIri

1. 数据安全三大隐患

2. 网络依赖的致命缺陷

3. 资源成本优化需求

二、方案设计：本地化部署的技术架构

1. 三步搭建本地模型服务

2. 零门槛配置MCP服务器

3. 环境配置的避坑指南

三、实施步骤：从环境准备到功能验证

1. 硬件配置双方案选择

2. 四步完成基础环境搭建

3. 核心模块配置与启动

后端服务启动

前端应用配置

虚拟角色渲染服务

4. 功能验证四步法

四、优化策略：性能调优与安全加固

1. 模型优化三技巧

2. 安全加固两要点

3. 资源占用优化

五、成果与进阶

已实现功能清单

进阶探索方向

热门内容推荐

最新内容推荐

项目优选

AIri本地部署全攻略：打造你的专属离线虚拟角色

一、痛点解析：为什么需要本地部署AIri

1. 数据安全三大隐患

2. 网络依赖的致命缺陷

3. 资源成本优化需求

二、方案设计：本地化部署的技术架构

1. 三步搭建本地模型服务

2. 零门槛配置MCP服务器

3. 环境配置的避坑指南

三、实施步骤：从环境准备到功能验证

1. 硬件配置双方案选择

2. 四步完成基础环境搭建

3. 核心模块配置与启动

后端服务启动

前端应用配置

虚拟角色渲染服务

4. 功能验证四步法

四、优化策略：性能调优与安全加固

1. 模型优化三技巧

2. 安全加固两要点

3. 资源占用优化

五、成果与进阶

已实现功能清单

进阶探索方向

相关内容推荐

热门内容推荐

最新内容推荐

项目优选