Stable Diffusion WebUI Forge 中通过 API 调整 GPU 显存分配的解决方案

2025-05-22 05:49:03作者：龚格成

在 Stable Diffusion WebUI Forge 项目中，用户在使用 API 进行图像生成时可能会遇到无法通过 API 调整 GPU 显存分配的问题。本文将详细分析该问题的成因，并提供完整的解决方案。

问题背景

许多开发者在使用 Stable Diffusion WebUI Forge 的 API 接口时发现，虽然大部分设置选项都可以通过 API 进行配置，但 GPU 显存分配（GPU Weights）这一关键参数却无法直接通过 API 进行设置。这会导致在使用 API 生成图像时频繁出现"低显存警告"，而同样的设置在 Web UI 界面中却能正常工作。

技术分析

经过深入研究发现，GPU 显存分配实际上是通过以下公式计算的：

GPU 显存权重(MB) = 总显存 - forge_inference_memory

这意味着要调整 GPU 显存分配，实际上需要修改 forge_inference_memory 参数的值。这个参数可以通过 /sdapi/v1/options 端点进行设置。

解决方案

1. 通过 options 端点设置显存

要正确设置 GPU 显存分配，应该向 /sdapi/v1/options 端点发送包含 forge_inference_memory 参数的请求。例如：

{
    "forge_inference_memory": 4096
}

这个值需要根据你的显卡总显存进行合理设置。例如，对于 12GB 显存的显卡，如果希望分配 8GB 给 GPU 权重，那么 forge_inference_memory 应该设置为 4096（12GB - 8GB = 4GB）。

2. 不同模型类型的显存设置

在实际使用中，可能需要为不同类型的模型设置不同的显存分配：

// Flux 模型设置
{
    "forge_inference_memory": 4096
}

// 标准 SD 模型设置
{
    "forge_inference_memory": 10240
}

3. 注意事项

避免刷新页面：在通过 API 设置参数后，如果刷新 Web UI 页面，可能会导致内存管理设置被重置，引发错误。
模型切换问题：在切换模型类型（如从 Flux 切换到标准 SD）时，确保同时更新相关的显存设置。
CFG 值设置：使用 Flux 模型时，CFG 值应保持在较低水平（如 1.0），而蒸馏 CFG 值需要正确设置。

最佳实践

在 API 调用前，先通过 /sdapi/v1/options 设置好所有必要的参数，包括模型类型、显存分配等。
对于 Flux 模型，建议的完整设置示例：

{
    "sd_model_checkpoint": "FLUX/flux1-dev-Q4_0.gguf",
    "forge_unet_storage_dtype": "Automatic (fp16 LoRA)",
    "forge_additional_modules": [
        "models/VAE/ae.safetensors",
        "models/text_encoder/clip_l.safetensors",
        "models/text_encoder/t5xxl_fp8_e4m3fn.safetensors"
    ],
    "forge_inference_memory": 4096,
    "forge_preset": "flux"
}

监控显存使用情况，根据实际需求调整 forge_inference_memory 值。

结论

通过理解 GPU 显存分配的底层计算逻辑，开发者可以有效地通过 API 控制 Stable Diffusion WebUI Forge 的显存使用。关键在于正确设置 forge_inference_memory 参数，并注意不同模型类型可能需要不同的显存配置。随着项目的持续更新，未来可能会提供更直接的 API 控制方式，但目前这一解决方案已经能够满足大多数开发需求。

stable-diffusion-webui-forge

为Stable Diffusion WebUI提供开发便利，优化资源管理，提升推理速度，支持实验性功能研究，兼容主流扩展与模型格式。

项目地址：https://gitcode.com/GitHub_Trending/st/stable-diffusion-webui-forge

登录后查看全文