SadTalker项目在Automatic1111 v1.9.4中的安装与问题解决方案

2025-05-18 06:54:40作者：傅爽业Veleda

项目背景

SadTalker是一个开源的AI语音驱动面部动画生成工具，能够根据输入的音频和静态图像生成逼真的说话人脸视频。该项目基于深度学习技术，整合了多项计算机视觉和语音处理算法。

在Automatic1111 WebUI v1.9.4版本中安装SadTalker扩展时，用户可能会遇到几个典型问题：

问题表现为报错信息提到numpy模块缺少complex或float属性。这是由于NumPy 1.20版本后弃用了这些旧式别名。

解决方法：

pip install --upgrade librosa

此命令会将librosa升级到最新版本，其中已修复了对NumPy新版本的兼容性问题。升级后，librosa会使用np.complex128和np.float64等新式命名。

SadTalker需要多个Python依赖包，建议检查并安装以下关键包：

可以通过以下命令批量检查：

pip list | grep -E "face-alignment|imageio-ffmpeg|librosa|yacs|av|gfpgan"

安装完成后，需要在WebUI启动脚本中设置模型路径：

对于Windows用户，编辑webui_user.bat：

set SADTALKER_CHECKPOINTS=C:\path\to\sadtalker\checkpoints

对于Linux用户，编辑webui_user.sh：

export SADTALKER_CHECKPOINTS=/path/to/sadtalker/checkpoints

安装完成后，可以通过以下步骤验证：

虽然SadTalker项目目前维护状态不佳，但仍有一些替代方案可供考虑：

虽然SadTalker在Automatic1111 v1.9.4中的安装过程可能遇到一些挑战，但通过正确管理依赖和配置，仍然可以成功运行。该项目在面部动画质量方面仍有优势，适合对输出质量要求较高的场景。对于遇到问题的用户，建议按照本文提供的步骤系统性地排查和解决问题。

登录后查看全文