本地AI部署：构建你的离线虚拟角色AIri完整指南

2026-03-09 04:45:54作者：鲍丁臣Ursa

💖🧸 Self hosted, you-owned Grok Companion, a container of souls of waifu, cyber livings to bring them into our worlds, wishing to achieve Neuro-sama's altitude. Capable of realtime voice chat, Minecraft, Factorio playing. Web / macOS / Windows supported.

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

在数字化时代，AI助手已成为我们生活和工作的重要伙伴。然而，网络依赖和隐私安全始终是用户面临的两大痛点。本文将带你通过本地化部署方案，将AIri虚拟角色完全移植到本地环境，实现模型离线运行与数据隐私保护的双重目标。无论是网络不稳定的环境还是对数据安全有高要求的场景，本地部署都能让AIri随时陪伴在你身边，成为真正属于你的离线AI伙伴。

1. 破解三大核心痛点：本地部署的技术价值

1.1 隐私保护：数据不再跨网流转

传统云服务模式下，用户交互数据需要上传至云端处理，存在数据泄露风险。本地部署方案将所有数据处理过程限制在用户设备内部，从根本上杜绝数据外泄可能。核心配置文件：[services/telegram-bot/.env.local] - 包含本地模型地址与隐私保护参数。

1.2 网络独立：摆脱连接依赖

通过本地化推理引擎，AIri可在无网络环境下正常工作，特别适合旅行、偏远地区等网络不稳定场景。验证指标：断开网络后，连续交互10轮无响应延迟或失败。

1.3 定制自由：硬件资源自主调配

本地部署允许用户根据硬件条件调整模型参数，在性能与资源占用间找到最佳平衡。硬件兼容性矩阵如下：

配置类型	CPU要求	内存要求	GPU要求	推荐模型规模	典型响应速度
基础配置	4核	8GB	无	3B参数	2-3秒/轮
标准配置	8核	16GB	4GB显存	7B参数	1-2秒/轮
高性能配置	12核	32GB	8GB显存	13B参数	0.5-1秒/轮

图1：AIri虚拟角色形象 - 本地部署让这个AI伙伴完全属于你

2. 模块化部署流程：从环境到引擎的四步构建

2.1 环境初始化：打造基础运行平台

首先需要准备必要的开发工具链，为后续部署奠定基础。执行环境初始化命令：

# 安装系统依赖
sudo apt update && sudo apt install -y git build-essential libssl-dev

# 安装Node.js (v16+)和pnpm
curl -fsSL https://deb.nodesource.com/setup_16.x | sudo -E bash -
sudo apt install -y nodejs
npm install -g pnpm

# 安装Rust工具链
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh -s -- -y
source $HOME/.cargo/env

✅ 验证指标：node -v显示v16+，cargo --version显示1.60+版本。

2.2 代码获取：克隆项目仓库

获取AIri项目源码，这是本地部署的基础。执行以下命令：

git clone https://gitcode.com/GitHub_Trending/ai/airi
cd airi

注意：国内用户可使用加速镜像提高克隆速度，确保网络稳定。

2.3 依赖安装：构建项目生态

安装项目所需的全部依赖，包括前端、后端及Rust组件。执行依赖安装命令：

# 安装项目依赖
pnpm install

# 编译Rust组件
cargo build --release

⚠️ 风险提示：依赖安装过程可能耗时较长（10-30分钟），取决于网络速度和硬件性能。

2.4 推理引擎部署：本地化AI核心

部署本地推理引擎是实现离线运行的关键，我们使用Ollama作为模型管理工具。执行以下命令：

# 安装Ollama
curl https://ollama.ai/install.sh | sh

# 启动推理服务（后台运行）
nohup ollama serve &

# 下载推荐模型（7B参数，平衡性能与资源）
ollama pull mistral

# 下载嵌入模型
ollama pull nomic-embed-text

✅ 验证指标：curl http://localhost:11434/api/tags返回模型列表，包含已下载的mistral和nomic-embed-text。

3. 多维度功能验证体系：确保离线环境稳定性

3.1 基础连接测试：验证服务可达性

首先确认本地推理引擎与AIri服务的连接状态。执行测试命令：

# 测试模型推理接口
curl -X POST http://localhost:11434/api/generate -d '{
  "model": "mistral",
  "prompt": "Hello, AIri!"
}'

✅ 验证指标：返回包含"Hello, I'm AIri!"等类似回复的JSON响应。

3.2 文本交互验证：核心对话功能测试

启动AIri前端应用，测试文本对话功能是否正常工作。执行启动命令：

# 启动前端应用
cd apps/stage-web
pnpm dev

在浏览器中访问http://localhost:5173，进行多轮对话测试。验证指标：连续5轮对话无重复回复，响应时间稳定在2秒以内。

3.3 语音交互验证：实时性与准确性测试

测试语音输入输出功能，验证本地ASR/TTS服务是否正常工作。配置语音服务：

# 进入实时音频应用目录
cd apps/realtime-audio

# 安装依赖并构建
pnpm install
pnpm build

# 启动语音服务
pnpm start

✅ 验证指标：语音输入识别准确率>95%，语音合成响应时间<1.5秒，无明显卡顿或失真。

3.4 离线状态验证：断网环境功能测试

断开网络连接，重复上述所有测试。验证指标：所有功能保持正常，无网络请求错误提示。

注意：首次运行需联网下载必要资源，后续可完全离线运行。

4. 性能调优与生态扩展：打造个性化AI体验

4.1 模型优化：平衡性能与资源占用

针对不同硬件配置，可通过模型量化技术降低资源消耗。执行量化模型命令：

# 下载4-bit量化模型（适合低配置设备）
ollama pull mistral:7b-q4_0

# 配置使用量化模型
echo "LLM_MODEL=mistral:7b-q4_0" >> services/telegram-bot/.env.local

⚡ 性能优化效果：模型大小减少60%，内存占用降低50%，推理速度提升30%。

4.2 功能扩展：开发自定义技能

AIri支持通过插件系统扩展功能，你可以开发专属技能。技能开发示例：

// 创建自定义技能文件：plugins/ai/skills/my-skill.ts
export const mySkill = {
  name: "my-skill",
  description: "自定义技能示例",
  execute: async (context) => {
    return `这是我的自定义技能响应: ${context.input}`;
  }
};

核心技能开发文档：[crates/tauri-plugin-mcp/src/skills] - 包含技能开发API与示例。

4.3 界面定制：打造个性化虚拟角色

修改前端资源文件，定制AIri的外观和交互界面。关键资源目录：[apps/stage-web/src/assets/] - 包含界面背景、角色模型等资源文件。

4.4 部署决策树：选择适合你的方案

根据硬件条件和功能需求，选择最适合的部署方案：

基础办公本/低配置设备 → 3B模型 + 纯CPU推理
游戏本/中端配置 → 7B量化模型 + GPU加速
高性能工作站 → 13B模型 + 完整功能集

⚡ 进阶优化方向：尝试使用模型蒸馏技术进一步减小模型体积，或通过模型并行提升推理速度。

通过本文介绍的本地AI部署方案，你已成功将AIri虚拟角色移植到本地环境，实现了完全离线运行。这不仅解决了网络依赖和隐私安全问题，还赋予你对AI助手的完全控制权。随着硬件性能的提升和模型技术的发展，本地部署将成为AI应用的重要趋势，为用户带来更安全、更自由的AI体验。现在，开始探索属于你的个性化AI伙伴吧！

airi

项目地址：https://gitcode.com/GitHub_Trending/ai/airi

登录后查看全文