QwenLM/Qwen项目中LoRA微调后模型文件格式的变更说明

2025-05-12 03:59:35作者：段琳惟

The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.

项目地址：https://gitcode.com/GitHub_Trending/qw/Qwen

在QwenLM/Qwen项目的最新版本中，用户在进行LoRA（Low-Rank Adaptation）微调训练时可能会注意到一个显著变化：训练完成后生成的模型文件不再是传统的adapter_model.bin格式，而是变为了adapter_model.safetensors。这一变更并非错误，而是项目为了提升模型安全性和兼容性所做的主动调整。

技术背景

自peft库（Parameter-Efficient Fine-Tuning）0.7.0版本起，开发团队对参数存储格式进行了重要升级。safetensors作为一种新兴的模型参数存储格式，相比传统的bin格式具有以下优势：

安全性增强：safetensors格式在设计上改进了传统PyTorch序列化格式可能存在的潜在问题
加载效率提升：该格式支持更快的模型加载速度，特别是在大型模型场景下
跨平台兼容性：提供了更好的多语言支持和跨平台兼容性

用户影响与验证

对于习惯使用bin格式的用户，这一变更可能会引起短暂困惑。但需要明确的是：

训练过程完全正常，adapter_model.safetensors文件包含了所有必要的微调参数
该文件与原有bin文件功能完全等效，只是存储格式不同
项目中的其他组件（如推理代码）已同步更新以支持新格式

用户可以通过检查训练输出目录中的文件列表来验证训练是否成功完成。除了safetensors文件外，完整的训练输出还应包含：

adapter_config.json（适配器配置）
tokenizer相关文件（如tokenizer_config.json）
训练日志和结果文件

使用建议

对于需要继续使用bin格式的特殊场景，用户可以考虑以下方案：

使用peft库提供的格式转换工具将safetensors转换为bin格式
在训练配置中明确指定输出格式（如果peft库支持）
更新下游应用代码以直接支持safetensors格式

随着生态系统的演进，safetensors格式正在成为PyTorch生态中的新标准。QwenLM/Qwen项目采用这一格式，既是对社区最佳实践的遵循，也是为未来功能扩展所做的技术准备。

建议用户逐步适应这一变更，并检查自己的应用代码是否兼容新格式。对于确实遇到兼容性问题的场景，可以考虑在过渡期间同时维护两种格式的适配器模型，直至所有依赖组件完成升级。

The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.

项目地址：https://gitcode.com/GitHub_Trending/qw/Qwen

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

flutter_flutter

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。