Torchtune项目：如何将微调后的.pt模型转换为HuggingFace的.safetensors格式

2025-06-09 05:11:06作者：吴年前Myrtle

在深度学习模型微调过程中，模型格式转换是一个常见需求。本文将详细介绍如何在使用Torchtune项目微调Llama 3.1模型后，将生成的.pt格式检查点转换为HuggingFace生态支持的.safetensors格式。

背景介绍

Torchtune是一个基于PyTorch的模型微调工具包，它生成的模型检查点默认采用.pt格式。而HuggingFace生态系统更倾向于使用.safetensors格式，这种格式不仅更安全，还能更好地与HuggingFace的Transformers库集成。

转换方法

最新版本的Torchtune已经内置了模型格式转换功能。用户完成模型微调后，可以直接使用以下步骤：

确保使用最新版Torchtune（版本需包含PR#2074及之后的更新）
微调完成后，检查输出目录中的模型文件
系统会自动生成适配HuggingFace的.safetensors文件

使用转换后的模型

转换完成后，可以通过HuggingFace的Transformers库直接加载使用：

from transformers import AutoModelForCausalLM, AutoTokenizer

# 指定模型路径
model_path = "/path/to/your/converted_model"

# 加载模型和分词器
model = AutoModelForCausalLM.from_pretrained(model_path)
tokenizer = AutoTokenizer.from_pretrained(model_path, safetensors=True)

# 文本生成示例
def generate_text(model, tokenizer, prompt, max_length=50):
    inputs = tokenizer(prompt, return_tensors="pt")
    outputs = model.generate(**inputs, max_length=max_length)
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

prompt = "请补全这句话：'从前有座山...'"
print("模型输出:", generate_text(model, tokenizer, prompt))

注意事项

模型转换过程会保留原始模型的所有参数和结构
转换后的.safetensors文件可以通过HuggingFace的索引文件(index.safetensor.json)自动识别
如果同时存在适配器模型和完整模型，HuggingFace会根据索引文件自动选择正确的检查点

技术细节

.safetensors格式相比传统.pt格式有以下优势：

更安全的序列化方式，防止恶意代码执行
更快的加载速度
更好的跨平台兼容性
原生支持HuggingFace生态系统

Torchtune的转换过程实际上是将PyTorch的内部状态字典重新序列化为.safetensors格式，同时保留所有必要的模型配置信息。

总结

随着Torchtune项目的持续更新，模型格式转换已经变得非常简单。开发者现在可以轻松地将微调后的Llama 3.1等模型集成到HuggingFace生态系统中，充分利用Transformers库提供的丰富功能。这一改进大大降低了模型部署的门槛，使得从实验到生产的流程更加顺畅。

登录后查看全文

Torchtune项目：如何将微调后的.pt模型转换为HuggingFace的.safetensors格式

背景介绍

转换方法

使用转换后的模型

注意事项

技术细节

总结

热门内容推荐

最新内容推荐

项目优选

Torchtune项目：如何将微调后的.pt模型转换为HuggingFace的.safetensors格式

背景介绍

转换方法

使用转换后的模型

注意事项

技术细节

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选