从零开始搭建本地AI数字人系统：Duix-Avatar全流程指南

2026-03-17 02:47:54作者：裴麒琰

在内容创作、在线教育和企业宣传领域，数字人技术正成为提升效率的关键工具。然而，传统数字人制作不仅成本高昂，还存在数据隐私泄露的风险。如何在本地环境中搭建一套安全可控的AI数字人系统？Duix-Avatar（原HeyGem.ai）作为开源解决方案，通过全离线操作模式，让用户只需10秒视频即可完成数字人克隆，实现低成本、高隐私的AI视频创作。本文将从环境准备到实战应用，带你全面掌握本地AI数字人制作的核心流程。

项目核心价值与技术特性

为什么选择Duix-Avatar？

Duix-Avatar的独特优势在于全本地化部署与高效克隆能力的结合。与云端服务相比，其数据处理全程在本地完成，避免了隐私泄露风险；相比传统3D建模，10秒视频克隆技术将制作成本降低99%，使个人创作者和中小企业也能轻松拥有专属数字人。

核心技术解析

智能视觉引擎：通过深度学习算法提取面部特征点，构建高精度3D面部模型，支持多种表情和姿态驱动。
语音合成技术：采用端到端TTS模型，捕捉声纹特征并生成自然语音，支持语速、语调等参数调节。
多模态融合系统：将文本转语音（TTS）与面部动画合成（F2F）无缝衔接，实现口型与语音的精准同步。

图1：Duix-Avatar应用主界面，展示数字人创建与视频生成核心功能区

系统环境配置要求

硬件配置表

组件	最低配置	推荐配置
CPU	英特尔i5-13400F	英特尔i7-13700K
内存	32GB	64GB
显卡	NVIDIA RTX 4070	NVIDIA RTX 4090
存储	系统盘100GB+，数据盘30GB+	系统盘200GB+ SSD

操作系统支持

Windows：Windows 10 19042.1526及以上版本
Linux：Ubuntu 22.04 Desktop版本

本地化部署三步流程

第一步：环境准备

安装Docker环境
- 检查WSL状态：
```
wsl --list --verbose
```
- 更新WSL：
```
wsl --update
```
- 安装Docker Desktop并启用WSL2集成
调整Docker资源配置
进入Docker设置界面，在Resources选项卡中分配至少16GB内存，并将镜像存储路径迁移至非系统盘：

图2：Docker资源配置界面，箭头标注为设置入口与存储路径修改区域

第二步：获取项目与镜像

克隆代码仓库

git clone https://gitcode.com/GitHub_Trending/he/Duix-Avatar
cd Duix-Avatar

拉取Docker镜像

docker pull guiji2025/fun-asr
docker pull guiji2025/fish-speech-ziming
docker pull guiji2025/duix.avatar

第三步：启动服务与验证

启动服务端
```
cd deploy
docker-compose up -d
```
⚠️ 注意事项：首次启动需下载约20GB模型文件，建议在网络稳定环境下进行，全程约30分钟。
验证服务状态
执行docker ps命令，确认以下三个容器处于Running状态：
- fun-asr（语音识别服务）
- fish-speech-ziming（语音合成服务）
- duix.avatar（视频生成服务）
安装客户端
运行项目根目录下的Duix.Avatar-x.x.x-setup.exe完成客户端安装。