苹果ML-Stable-Diffusion项目中的大模型转换问题分析与解决方案

2025-05-13 09:07:34作者：舒璇辛Bertina

在将大型Stable Diffusion模型（如SDXL和Pony模型）转换为CoreML格式的过程中，开发者可能会遇到一个典型的技术障碍。本文将从技术原理、问题现象和解决方案三个维度进行深入剖析。

问题背景

当使用python_coreml_stable_diffusion.torch2coreml工具进行模型格式转换时，系统首先需要将原始的.safetensors文件转换为diffusers格式。对于较大的模型（参数规模超过10GB），转换过程会自动将UNet模块分割成多个文件（如diffusion_pytorch_model-00001-of-00002.bin和diffusion_pytorch_model-00002-of-00002.bin）。

技术原理

这种现象源于Hugging Face库的自动分片机制。当模型参数超过默认的10GB阈值时，系统会自动将模型分割成多个文件以提高存储和处理的效率。然而，python_coreml_stable_diffusion.torch2coreml工具在设计时仅支持单个模型文件输入，无法正确处理这种分片存储的情况。

解决方案

目前有两种可行的解决方法：

版本降级方案：将diffusers库降级至0.28.2版本。这个早期版本尚未引入强制分片机制，能够生成单个UNet模型文件。虽然简单有效，但可能牺牲新版本的一些优化特性。
参数调整方案：在转换命令中显式指定更大的分片阈值。通过设置max_shard_size参数（如20GB），可以避免模型被自动分割。这种方法保持了新版本的优势，但需要确保系统有足够的内存资源。