Stable Diffusion WebUI Forge 中多模型 API 调用的实践指南

2025-05-22 05:42:47作者：蔡怀权

稳定扩散WebUIForge是基于Stable Diffusion WebUI的一款高级开发平台，旨在通过优化资源管理、加速推理过程及探索实验性功能，为开发者提供更流畅的创作环境。受《我的世界》Forge模组平台启发，它致力于成为SD WebUI的强大扩展基石。当前版本基于SD-WebUI 1.10.1深度定制，支持快速接入现有模型与扩展。无论是Git高手还是普通用户，均可通过简便的一键安装包或手动步骤轻松体验。该平台经过详尽测试，确保从基础扩散处理到控制网、IP适配器等高级功能全面正常运作，为艺术生成和AI辅助创作带来革新体验。需要注意的是，近期经历重大更新，微软Surface触控压感暂时失效，但Wacom设备支持良好。遇到问题可通过社区反馈，共同参与这一创新工具的完善之旅。

项目地址：https://gitcode.com/GitHub_Trending/st/stable-diffusion-webui-forge

背景与问题概述

在 Stable Diffusion WebUI Forge 项目中，用户经常需要通过 API 同时支持多种模型（如标准 SD、SDXL 和 Flux 模型）的调用。然而，在实际使用过程中，开发者遇到了几个关键问题：

模型切换机制不明确，API 调用结果依赖于 WebUI 界面手动启用的检查点
尝试通过 override_settings 参数指定模型检查点时，设置被忽略
多请求并发时模型状态可能互相干扰
Flux 模型生成速度较慢（40-90秒）

模型切换的技术实现

传统方式的问题

最初，用户尝试通过 API 请求中的 override_settings 参数来切换模型：

"override_settings": {"sd_model_checkpoint": "dreamshaper_v8.safetensors"}

然而，这种方式在某些版本中会被忽略，特别是在引入了 Flux 模型支持后。错误日志显示系统仍然尝试使用之前加载的模型（如 JuggernautXL），导致维度不匹配错误：

RuntimeError: mat1 and mat2 shapes cannot be multiplied (308x2048 and 768x320)

临时解决方案

在问题修复前，开发者可以采用以下两种临时方案：

预设置模型：通过单独的 API 调用预先设置模型

POST /sdapi/v1/options
{"sd_model_checkpoint": "目标模型名称"}

多实例部署：为每个模型类型运行独立的 WebUI 实例，分配不同端口，避免状态冲突

根本解决方案

项目社区已经提交并合并了修复代码，恢复了 override_settings 参数对模型检查点的切换功能。现在可以直接在单个 API 请求中指定目标模型：

{
    "prompt": "示例提示",
    "override_settings": {
        "sd_model_checkpoint": "flux1-dev-F16.gguf",
        "forge_preset": "flux"
    }
}

并发请求处理策略

由于 WebUI 内部存在大量共享状态，当多个请求同时指定不同模型时，可能会产生冲突。目前推荐的解决方案包括：

请求队列：在 API 网关层实现请求序列化，确保同一时间只有一个模型切换请求被处理
模型预热：预先加载常用模型到内存，减少运行时切换开销
资源隔离：为高优先级模型保留专用 GPU 资源

Flux 模型性能优化

针对 Flux 模型生成速度较慢的问题（40-90秒），可以考虑以下优化措施：

模型量化：使用 FP16 或 INT8 量化版本减少计算量
硬件加速：确保正确配置 CUDA 和 cuDNN 环境
批处理优化：适当调整批量大小以充分利用 GPU 并行能力
缓存机制：对相同参数的请求实现结果缓存

典型 Flux 模型配置示例：

{
    "forge_preset": "flux",
    "forge_additional_modules": [
        "models/VAE/ae.safetensors",
        "models/text_encoder/t5xxl_fp16.safetensors",
        "models/text_encoder/clip_l.safetensors"
    ],
    "sd_model_checkpoint": "flux1-dev-F16.gguf"
}