首页
/ Adapter-Transformers项目中的Safetensors适配器加载功能演进

Adapter-Transformers项目中的Safetensors适配器加载功能演进

2025-06-29 18:34:33作者:谭伦延

在基于Transformer架构的模型微调领域,Adapter-Hub的adapter-transformers库提供了一种轻量级的参数高效微调方案。近期社区反馈中,开发者提出了关于适配器权重文件格式的重要改进建议,这反映了深度学习生态向更安全、高效存储格式演进的大趋势。

技术背景

传统PyTorch模型通常使用pickle序列化格式(.bin)保存权重,但该格式存在安全风险,可能被恶意注入代码。HuggingFace推出的safetensors格式作为替代方案,具有以下核心优势:

  1. 安全性:纯张量存储格式,杜绝代码注入风险
  2. 效率:支持零拷贝加载,大幅提升大模型加载速度
  3. 跨平台:与框架无关的标准化存储

现状分析

当前adapter-transformers库在模型加载环节已初步支持safetensors:

  • 主模型加载:通过AutoAdapterModel.from_pretrained()use_safetensors参数可指定加载safetensors格式的基础模型权重
  • 适配器加载:load_adapter()方法仍强制依赖pickle格式的适配器权重文件(.bin),即使目录中存在.safetensors文件也会被忽略

这种不一致性导致用户需要同时维护两种格式的权重文件,增加了存储负担和管理复杂度。

技术实现方案

要实现完整的safetensors支持,核心需要改造适配器加载逻辑:

  1. 文件探测机制:当指定safetensors=True时,优先查找.safetensors后缀文件
  2. 回退机制:保持与旧版本的兼容性,当safetensors文件不存在时自动回退到传统格式
  3. 序列化优化:适配器保存时也应支持输出safetensors格式

社区影响

该改进将带来多重收益:

  • 安全性提升:消除适配器环节的pickle反序列化风险
  • 存储优化:用户可选择仅保留safetensors格式,节省约50%的存储空间
  • 性能改善:大尺寸适配器的加载速度可提升2-3倍

目前开发团队已在相关PR中推进该功能,预计将在下一版本中发布完整支持。这标志着adapter-transformers向现代模型权重管理标准又迈进了重要一步。

最佳实践建议

对于当前版本的用户,建议采取以下过渡方案:

  1. 主模型加载可安全使用safetensors格式
  2. 适配器加载暂时保持双格式并存
  3. 关注项目更新,及时迁移到纯safetensors工作流

随着生态发展,未来版本可能会将safetensors设为默认格式,开发者应提前做好技术储备。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
189
2.14 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
205
284
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
966
570
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
545
75
pytorchpytorch
Ascend Extension for PyTorch
Python
58
89
金融AI编程实战金融AI编程实战
为非计算机科班出身 (例如财经类高校金融学院) 同学量身定制,新手友好,让学生以亲身实践开源开发的方式,学会使用计算机自动化自己的科研/创新工作。案例以量化投资为主线,涉及 Bash、Python、SQL、BI、AI 等全技术栈,培养面向未来的数智化人才 (如数据工程师、数据分析师、数据科学家、数据决策者、量化投资人)。
Python
78
71
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
146
192
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.01 K
399