avatars4all 的项目扩展与二次开发

2025-07-01 14:23:47作者：申梦珏Efrain

项目的基础介绍

avatars4all 是一个开源项目，它允许用户通过浏览器实时从网络摄像头生成动态头像。该项目基于纯 JavaScript 和 Google Colab 平台，无需安装任何额外的硬件或软件，即可实现 First-order Motion Model (FOMM) 的实时应用，也被称为 Avatarify。项目提供了一个丰富的图形用户界面 (GUI)，用户可以轻松地与模型交互，创建个性化的 deep-fake 视频。

项目的核心功能

实时动态头像：用户可以通过摄像头实时生成动态头像。
无需要额外硬件或软件：利用浏览器即可实现所有功能。
用户友好的 GUI：提供了简单直观的界面，方便用户上传自己的图片或视频，以及调整模型参数。
多样化的头像选择：包括从网络上生成的风格化头像到用户自定义的上传头像。
丰富的视觉效果：支持多种视觉效果，如绿屏、草图和模糊效果。

项目使用了哪些框架或库？

项目主要使用了以下框架或库：

TensorFlow.js：用于在浏览器中运行机器学习模型。
First-order Motion Model (FOMM)：实现图像动画的核心算法。
Wav2Lip：用于根据音频同步口型。
Liquid Warping GAN：用于生成逼真的全身 deep-fake 视频。

项目的代码目录及介绍

项目的代码目录结构大致如下：

avatars4all/
├── .github/
├── media/
├── LICENSE.md
├── README.md
├── facevidblur.ipynb
├── facevidcrop.ipynb
├── fomm_bibi.ipynb
├── fomm_fufu.ipynb
├── fomm_live.ipynb
├── ganivut.ipynb
├── ganozli.ipynb
├── gmic_video.ipynb
├── incomplete_webrtc_fomm_live.ipynb
├── melaflefon.ipynb
├── mraa-body.ipynb
├── toonify.ipynb
├── yarok.ipynb