ComfyUI中Wan2.1 T2V 1.3B模型生成全黑视频问题的分析与解决

2025-04-30 06:15:19作者：齐冠琰

在ComfyUI视频生成工作流中，部分用户在使用Wan2.1 T2V 1.3B模型时遇到了输出结果为全黑视频的问题。这个问题主要出现在AMD Radeon RX 6800 XT（16GB显存）和NVIDIA RTX 3050等消费级显卡上，表现为模型能够正常执行但最终生成的视频文件为全黑画面，同时控制台会输出"invalid value encountered in cast"的运行时警告。

问题现象分析

当用户运行Wan2.1 T2V 1.3B模型时，系统日志显示模型加载和推理过程看似正常完成，但最终生成的视频文件却呈现全黑状态。从技术角度来看，这通常表明在视频帧数据的处理过程中出现了数值异常，导致图像数据被错误地转换为无效值。

控制台输出的警告信息"RuntimeWarning: invalid value encountered in cast"进一步证实了这一点，表明在将NumPy数组转换为图像数据时遇到了无效数值（如NaN或超出范围的值）。这种现象在深度学习推理中通常与数值精度问题或计算溢出有关。

根本原因探究

经过深入分析，这个问题主要由以下几个因素共同导致：

数值精度问题：模型在推理过程中可能产生了超出正常范围的数值或NaN值，特别是在使用较低精度计算时。
注意力机制实现差异：不同硬件平台（特别是AMD和NVIDIA显卡）对注意力机制的计算实现可能存在细微差异。
量化设置不当：虽然Wan2.1 T2V 1.3B模型官方声称不需要量化即可运行，但在某些硬件配置下，默认的量化设置可能导致计算精度不足。

解决方案

针对这一问题，社区提供了几种有效的解决方案：

强制注意力机制上采样：在启动ComfyUI时添加--force-upcast-attention参数，这可以确保注意力计算使用更高的数值精度，避免计算过程中的数值溢出。
调整权重数据类型：将模型的weight_dtype参数从默认值改为fp8_e4m3fn，这种8位浮点格式在保持较高计算效率的同时，提供了更好的数值稳定性。
更新驱动和框架：确保使用最新版本的PyTorch和ROCm（针对AMD显卡）或CUDA（针对NVIDIA显卡）驱动，以获得最佳兼容性和性能。