OneTrainer项目中Cascade LoRA训练模型保存问题解析

2025-07-04 18:55:39作者：史锋燃Gardner

OneTrainer is a one-stop solution for all your Diffusion training needs.

项目地址：https://gitcode.com/gh_mirrors/on/OneTrainer

问题现象

在使用OneTrainer进行Cascade LoRA模型训练时，部分用户遇到了训练完成后模型无法正常保存的问题。系统报错显示"Access is denied"(访问被拒绝)，具体表现为训练进程结束时无法将模型文件写入指定目录。

错误分析

根据错误日志显示，问题发生在模型保存阶段，具体报错为：

safetensors_rust.SafetensorError: Error while serializing: IoError(Os { code: 5, kind: PermissionDenied, message: "Access is denied." })

这一错误通常由以下两种原因导致：

文件权限问题：目标目录或文件没有写入权限
文件冲突：目标位置已存在同名文件或目录

解决方案

针对文件权限问题

确保训练程序对目标目录有完全控制权限
在Windows系统上，可以右键点击目标文件夹 → 属性 → 安全 → 编辑，为当前用户添加完全控制权限
避免使用系统保护目录(如Program Files)作为输出目录

针对文件冲突问题

训练前确保目标目录为空
在Windows系统上，清空回收站，因为已删除但仍在回收站中的文件仍可能占用文件名
对于LoRA训练，建议明确指定输出文件名和扩展名

特殊注意事项

OneTrainer在处理不同训练模式时，保存行为有所差异：

常规Cascade微调训练：会自动在指定目录下生成两个.safetensors文件
LoRA训练：需要用户明确指定输出文件名和.safetensors扩展名

最佳实践建议

为每次训练创建独立的输出目录
对于LoRA训练，使用完整路径指定输出文件，如：models/lora/my_lora_model.safetensors
训练前检查目标目录的可用空间和权限
在Windows系统上，避免使用包含空格或特殊字符的路径

通过遵循这些建议，可以有效避免训练完成后模型保存失败的问题，确保训练成果得到妥善保存。

OneTrainer is a one-stop solution for all your Diffusion training needs.

项目地址：https://gitcode.com/gh_mirrors/on/OneTrainer

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

昇腾LLM分布式训练框架

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started