LMDeploy项目中的LoRA适配器Safetensors格式支持解析

2025-06-04 10:32:20作者：郜逊炳

在深度学习模型部署领域，LMDeploy作为一个高效的模型部署工具包，近期在其PyTorch引擎中增加了对LoRA适配器Safetensors格式的支持。这一改进解决了用户在使用过程中遇到的关键兼容性问题。

问题背景

LoRA(Low-Rank Adaptation)是一种流行的模型微调技术，它通过在预训练模型上添加低秩矩阵来实现高效的参数适应。在LMDeploy的早期版本中，PyTorch引擎仅支持加载.bin格式的LoRA适配器权重文件。然而，现代深度学习框架如HuggingFace Transformers默认将微调后的权重保存为Safetensors格式，这导致了许多用户在实际使用中遇到文件加载失败的问题。

技术实现细节

LMDeploy通过以下技术方案实现了对Safetensors格式的支持：

智能文件检测机制：系统现在会首先尝试加载adapter_model.bin文件，如果不存在则自动尝试加载adapter_model.safetensors文件。这种设计既保持了向后兼容性，又支持了新格式。
使用Transformers工具链：通过引入transformers.modeling_utils.load_state_dict函数，LMDeploy能够统一处理不同格式的权重文件。这个函数内部已经实现了对Safetensors格式的支持。
设备映射支持：新实现保留了原有的map_location参数功能，确保权重能够正确加载到指定的计算设备上。

版本兼容性考虑

值得注意的是，这一改进对Transformers库的版本有一定要求。虽然LMDeploy没有严格限制Transformers的具体版本，但用户需要确保安装的Transformers版本足够新，以支持load_state_dict函数的完整功能。

实际应用价值

这一改进为LMDeploy用户带来了以下便利：

直接支持Transformers默认生成的LoRA适配器权重，无需额外转换步骤
保持了与现有工作流程的兼容性
提升了工具链的整体易用性

总结

LMDeploy对Safetensors格式的支持体现了项目团队对用户体验的重视。这一看似微小的改进实际上解决了许多用户在实际部署过程中的痛点，使得LoRA技术的应用更加顺畅。随着深度学习生态系统的不断发展，类似的格式兼容性改进将继续提升工具链的整体成熟度。

lmdeploy

LMDeploy is a toolkit for compressing, deploying, and serving LLMs.

项目地址：https://gitcode.com/gh_mirrors/lm/lmdeploy

登录后查看全文

LMDeploy项目中的LoRA适配器Safetensors格式支持解析

问题背景

技术实现细节

版本兼容性考虑

实际应用价值

总结

项目优选