如何在X-Flux项目中配置本地模型路径进行LoRA训练

2025-07-05 16:27:24作者：翟萌耘Ralph

项目地址：https://gitcode.com/gh_mirrors/xf/x-flux

背景介绍

X-Flux是一个基于扩散模型的AI图像生成项目，它支持通过LoRA（Low-Rank Adaptation）技术对预训练模型进行微调。在实际应用中，我们经常需要将模型文件下载到本地进行管理，而不是每次都从网络下载。本文将详细介绍如何在X-Flux项目中配置本地模型路径进行训练。

本地模型配置方法

环境变量设置

X-Flux项目提供了通过环境变量指定本地模型路径的机制，主要涉及以下两个关键环境变量：

FLUX_DEV：指定Flux主模型的文件路径
AE：指定自动编码器模型的文件路径

配置示例：

export FLUX_DEV="/path/to/flux1-dev.safetensors"
export AE="/path/to/ae.safetensors"

文本编码器本地化

X-Flux使用了两种文本编码器：T5和CLIP。要使它们从本地加载，需要修改相关代码：

T5编码器配置：

def load_t5(device: str | torch.device = "cuda", max_length: int = 512) -> HFEmbedder:
    return HFEmbedder("/local/path/to/xflux_text_encoders", 
                     max_length=max_length, 
                     torch_dtype=torch.bfloat16).to(device)

CLIP编码器配置：

def load_clip(device: str | torch.device = "cuda") -> HFEmbedder:
    return HFEmbedder("/local/path/to/clip-vit-large-patch14", 
                     max_length=77, 
                     torch_dtype=torch.bfloat16).to(device)

模型加载逻辑修改

在HFEmbedder类中，需要修改模型类型判断逻辑，因为原本是通过检查路径是否包含"openai"来判断是否是CLIP模型。修改后的实现：

class HFEmbedder(nn.Module):
    def __init__(self, version: str, max_length: int, **hf_kwargs):
        super().__init__()
        # 自定义路径判断逻辑
        if version == "/local/path/to/xflux_text_encoders":
            self.is_clip = False
        else:
            self.is_clip = True
            
        self.max_length = max_length
        self.output_key = "pooler_output" if self.is_clip else "last_hidden_state"

        if self.is_clip:
            self.tokenizer = CLIPTokenizer.from_pretrained(version, max_length=max_length)
            self.hf_module = CLIPTextModel.from_pretrained(version, **hf_kwargs)
        else:
            self.tokenizer = T5Tokenizer.from_pretrained(version, max_length=max_length)
            self.hf_module = T5EncoderModel.from_pretrained(version, **hf_kwargs)

        self.hf_module = self.hf_module.eval().requires_grad_(False)

注意事项

文件结构要求：本地模型目录应包含完整的模型文件，对于Flux主模型需要包含：
- flux1-dev.safetensors
- model_index.json
- ae.safetensors
路径一致性：确保代码中所有路径引用与实际存储路径完全一致
模型初始化：加载本地模型后，仍需调用eval()和requires_grad_(False)确保模型处于评估模式且不计算梯度
兼容性检查：验证本地模型版本与代码要求的版本是否兼容