Stable Diffusion WebUI在MacOS上运行SDXL模型时VAE导致的NansException问题分析

2025-04-28 08:46:39作者：申梦珏Efrain

stable-diffusion-webui

AUTOMATIC1111/stable-diffusion-webui - 一个为Stable Diffusion模型提供的Web界面，使用Gradio库实现，允许用户通过Web界面使用Stable Diffusion进行图像生成。

项目地址：https://gitcode.com/GitHub_Trending/st/stable-diffusion-webui

问题背景

在使用Stable Diffusion WebUI进行图像生成时，MacOS用户在使用SDXL模型进行img2img操作时可能会遇到一个特定的技术问题。当模型内置了VAE（变分自编码器）或手动选择了VAE时，系统会抛出"NansException"错误，提示张量中出现全NaN值。这个问题在SD1.5模型上不会出现，且SDXL模型的纯文本生成(txt2img)功能也工作正常。

技术现象分析

该问题表现为：

仅在使用SDXL模型进行图像到图像转换时出现
与VAE组件的激活直接相关
错误信息明确指出计算过程中产生了NaN值
使用--no-half参数可以规避问题但严重影响性能

根本原因

经过技术分析，这个问题源于MacOS平台上的特定硬件限制与SDXL模型VAE组件的半精度(FP16)计算不兼容。具体来说：

SDXL模型的VAE组件在FP16精度下计算时，在某些Mac硬件上会产生数值不稳定
这种不稳定性导致中间计算结果溢出为NaN值
系统内置的NaN检查机制会主动中断计算过程
SD1.5模型由于架构不同，对FP16计算有更好的兼容性

解决方案

针对这个问题，目前有以下几种可行的解决方案：

使用修复版VAE：社区已经开发了针对SDXL优化的VAE版本，可以避免NaN问题的产生
强制全精度计算：虽然使用--no-half参数可以解决问题，但这会导致计算速度显著下降
禁用模型内置VAE：如果模型允许，可以尝试使用无VAE的版本
调整计算精度设置：在设置中启用"Upcast cross attention layer to float32"选项

最佳实践建议

对于MacOS平台上的Stable Diffusion WebUI用户，建议采取以下工作流程：

优先使用专门为SDXL优化的VAE版本
在进行img2img操作前，检查模型是否包含内置VAE
保持WebUI和所有依赖项为最新版本
如果必须使用内置VAE的模型，考虑使用--no-half参数但降低批量大小

技术展望

随着Stable Diffusion生态的发展，未来可能会看到：

更多针对Apple Silicon优化的模型变体
WebUI对Mac平台更好的原生支持
更高效的混合精度计算策略
自动化的精度调整机制

这个问题典型地展示了深度学习应用在不同硬件平台上的兼容性挑战，也提醒开发者在模型优化时需要考虑到各种硬件配置的特殊性。

stable-diffusion-webui

AUTOMATIC1111/stable-diffusion-webui - 一个为Stable Diffusion模型提供的Web界面，使用Gradio库实现，允许用户通过Web界面使用Stable Diffusion进行图像生成。

项目地址：https://gitcode.com/GitHub_Trending/st/stable-diffusion-webui

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

ohos_react_native

React Native鸿蒙化仓库

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力