LivePortrait全流程指南：从环境配置到高级动画生成

2026-04-04 09:34:57作者：温艾琴Wonderful

环境预检清单

在开始LivePortrait的安装部署前，请确保您的系统满足以下要求并完成相应准备工作：

检查项	最低配置	推荐配置	状态
操作系统	Windows 10/11, Ubuntu 18.04+, macOS 12+	Ubuntu 20.04+	☐
Python版本	3.10.x	3.10.9	☐
CUDA支持	11.1+ (如使用GPU)	11.8	☐
内存	8GB RAM	16GB+ RAM	☐
显存	4GB VRAM	8GB+ VRAM	☐
存储空间	10GB可用空间	20GB+可用空间	☐
FFmpeg	已安装	4.4+版本	☐

⚠️ 兼容性警告：动物模式暂不支持macOS系统，且X-Pose依赖仅限非商业科学研究使用。

一、准备阶段：环境兼容性与资源规划

1.1 系统环境准备

1.1.1 安装系统依赖

目标：配置基础开发环境和多媒体处理工具
环境：Linux/macOS/Windows
操作：

# Ubuntu/Debian
sudo apt update && sudo apt install -y git wget curl build-essential ffmpeg libsox-dev

# macOS
brew install git wget curl ffmpeg

# Windows
# 1. 下载并安装Git: https://git-scm.com/download/win
# 2. 下载FFmpeg并添加到系统PATH: https://ffmpeg.org/download.html

验证：ffmpeg -version 应显示版本信息

1.1.2 Python环境配置

目标：创建隔离的Python运行环境
环境：所有平台
操作：

# 安装Miniconda
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3
export PATH="$HOME/miniconda3/bin:$PATH"
conda init bash && source ~/.bashrc

# 创建并激活虚拟环境
conda create -n LivePortrait python=3.10 -y
conda activate LivePortrait

验证：python --version 应显示3.10.x版本

1.2 项目获取与依赖安装

1.2.1 获取项目代码

目标：获取LivePortrait源代码
环境：所有平台
操作：

git clone https://gitcode.com/GitHub_Trending/li/LivePortrait
cd LivePortrait

1.2.2 安装Python依赖

目标：安装核心依赖包
环境：所有平台
操作：

# 基础依赖
pip install -r requirements_base.txt

# 根据硬件选择合适的依赖文件
# GPU用户
pip install -r requirements.txt

# macOS用户
pip install -r requirements_macOS.txt

1.2.3 PyTorch版本选择

目标：安装与CUDA匹配的PyTorch版本
环境：Linux/Windows (GPU)
操作：

# 检查CUDA版本
nvcc -V

# 根据CUDA版本选择安装命令
# CUDA 11.1
pip install torch==1.10.1+cu111 torchvision==0.11.2 torchaudio==0.10.1 -f https://download.pytorch.org/whl/cu111/torch_stable.html

# CUDA 11.8
pip install torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cu118

# CUDA 12.1
pip install torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cu121

验证：python -c "import torch; print(torch.cuda.is_available())" 应返回True

1.3 预训练模型准备

1.3.1 下载模型权重

目标：获取必要的预训练模型
环境：所有平台
操作：

# 安装huggingface_hub
pip install -U "huggingface_hub[cli]"

# 下载模型（国内用户建议使用HF镜像）
export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download KwaiVGI/LivePortrait \
    --local-dir pretrained_weights \
    --exclude "*.git*" "README.md" "docs"

1.3.2 验证模型文件结构

目标：确保模型文件完整
环境：所有平台
操作：

# 检查模型文件结构
ls -R pretrained_weights | grep -E "appearance|motion|spade|warping|retargeting"

预期输出：应包含appearance_feature_extractor.pth、motion_extractor.pth等核心模型文件

1.4 动物模式额外配置

目标：配置动物肖像动画所需的特殊依赖
环境：Linux/Windows
操作：

# 编译X-Pose依赖
cd src/utils/dependencies/XPose/models/UniPose/ops
python setup.py build install

# 返回项目根目录
cd ../../../../../../..

二、操作阶段：分步指引与可视化验证

2.1 基础配置：快速启动Gradio界面

目标：通过可视化界面体验LivePortrait功能
环境：所有平台
操作：

# 启动人类模式界面
python app.py

# 启动动物模式界面（Linux/Windows）
python app_animals.py

成功启动后，浏览器将自动打开Gradio界面。人类模式界面包含源文件上传区、驱动视频上传区、裁剪选项和动画参数设置面板。

2.2 快速验证：基础动画生成

2.2.1 人类肖像动画

目标：使用示例文件生成第一个动画
环境：所有平台
操作：

在Gradio界面中，点击"Examples"下的任意源图像
选择一个驱动视频示例（如"d0.mp4"）
保持默认参数，点击"Animate"按钮

预期结果：系统将生成并显示动画视频，展示源图像根据驱动视频的动作变化。

2.2.2 动物肖像动画

目标：测试动物模式功能
环境：Linux/Windows
操作：

python app_animals.py

在动物模式界面中，选择示例动物图像和驱动模板，点击"Animate"生成动画。

2.3 命令行推理：高级参数控制

2.3.1 基本命令格式

目标：使用命令行进行精确控制
环境：所有平台
操作：

# 人类模式基本命令
python inference.py -s <源文件路径> -d <驱动文件路径> [参数选项]

# 示例：使用图片源和视频驱动
python inference.py -s assets/examples/source/s9.jpg -d assets/examples/driving/d0.mp4

2.3.2 关键参数详解

参数	类型	默认值	推荐值	说明
`--driving_option`	str	"expression-friendly"	"expression-friendly"	动画风格选项，"expression-friendly"侧重表情，"pose-friendly"侧重姿态
`--driving_multiplier`	float	1.0	0.8-1.5	运动强度乘数，值越大动作越夸张
`--animation_region`	str	"all"	"all"	动画区域："exp"表情,"pose"姿态,"lip"嘴唇,"eyes"眼睛,"all"全部
`--flag_stitching`	bool	True	True	是否启用缝合功能，小幅度运动推荐启用

2.3.3 结果验证与导出

目标：确认输出结果并保存
环境：所有平台
操作：

# 检查输出文件
ls outputs

# 播放生成的视频
ffplay outputs/result.mp4

三、进阶阶段：场景应用与问题诊断

3.1 场景应用：高级动画制作

3.1.1 面部特征编辑

目标：精确调整面部表情和姿态
环境：所有平台
操作：

启动Gradio界面：python app.py
上传源图像
在"Retargeting and Editing Portraits"面板中调整滑块
- 面部运动滑块：控制头部位置和旋转
- 面部表情滑块：调整微笑、皱眉、眨眼等表情

3.1.2 图像驱动动画

目标：使用单张图像驱动动画
环境：所有平台
操作：

# 使用命令行实现图像驱动
python inference.py -s assets/examples/source/s9.jpg -d assets/examples/driving/d12.jpg --driving_option expression-friendly

在Gradio界面中，也可以通过选择"Driving Image"选项实现相同效果，上传一张包含表情的图像作为驱动源。

3.1.3 批量处理工作流

目标：高效处理多个文件
环境：所有平台
操作：

# 创建批量处理脚本
cat > batch_process.sh << EOF
#!/bin/bash
SOURCE_DIR="input_images"
DRIVING_FILE="assets/examples/driving/talking.pkl"
OUTPUT_DIR="batch_output"

mkdir -p \$OUTPUT_DIR

for file in \$SOURCE_DIR/*.jpg; do
    filename=\$(basename "\$file" .jpg)
    python inference.py -s "\$file" -d \$DRIVING_FILE -o "\$OUTPUT_DIR/\$filename.mp4"
done
EOF

# 执行批量处理
chmod +x batch_process.sh
./batch_process.sh

3.2 性能优化：提升推理效率

3.2.1 硬件资源优化

目标：根据硬件配置调整参数
环境：所有平台
操作：

# 低显存GPU优化（4-6GB VRAM）
python inference.py -s source.jpg -d driving.mp4 --source_max_dim 720 --flag_use_half_precision

# 高性能GPU优化（8GB+ VRAM）
python inference.py -s source.jpg -d driving.mp4 --flag_do_torch_compile

3.2.2 模型加载优化

目标：减少模型加载时间
环境：所有平台
操作：

# 在Python代码中预加载模型（适用于应用开发）
from src.live_portrait_wrapper import LivePortraitWrapper

# 初始化并加载模型（只需执行一次）
wrapper = LivePortraitWrapper(
    model_config_path="src/config/models.yaml",
    checkpoint_path="pretrained_weights/liveportrait/base_models",
    device="cuda"
)

# 后续推理可直接使用已加载的模型
result = wrapper.process(source_image, driving_video)

3.3 问题诊断：常见故障排除

3.3.1 CUDA内存不足

症状：CUDA out of memory错误
原因：输入分辨率过高或批量处理过大
解决方案：

# 降低输入分辨率
python inference.py --source_max_dim 720

# 禁用半精度推理（会增加内存使用但解决精度问题）
python inference.py --flag_use_half_precision False

预防措施：根据GPU显存选择合适的输入分辨率，8GB显存建议不超过1024x1024。

3.3.2 面部检测失败

症状：No face detected警告
原因：图像质量差或面部角度不当
解决方案：

# 降低检测阈值
python inference.py --det_thresh 0.3

# 手动指定裁剪区域
python inference.py --source_crop_scale 2.0 --source_crop_x 0 --source_crop_y -0.1

预防措施：使用正面清晰的面部图像，避免过度侧脸或遮挡。

3.3.3 动画结果异常

症状：面部扭曲或动作不自然
原因：运动参数设置不当
解决方案：

# 调整运动强度
python inference.py --driving_multiplier 0.8

# 切换动画模式
python inference.py --driving_option pose-friendly

预防措施：对于大幅度动作，建议使用"pose-friendly"模式并降低driving_multiplier。

知识拓展

技术原理概述

LivePortrait采用模块化架构，主要包含四个核心组件：

外观特征提取器：从源图像中提取面部特征
运动提取器：从驱动视频中提取动作信息
变形网络：根据运动信息生成面部变形
SPADE生成器：生成最终的动画帧

应用场景扩展

数字内容创作：为静态肖像添加动态表情
虚拟主播：实时驱动虚拟形象
影视后期：辅助面部动画制作
互动娱乐：开发有趣的面部表情互动应用

通过本指南，您已掌握LivePortrait的环境配置、基础操作和高级应用技巧。随着实践深入，您可以探索更多参数组合，创造出更加生动自然的肖像动画效果。

LivePortrait

Bring portraits to life!

项目地址：https://gitcode.com/GitHub_Trending/li/LivePortrait

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

Python

572

694