PyTorch/XLA项目：如何正确保存StableHLO转换后的模型权重

2025-06-30 06:42:56作者：丁柯新Fawn

在PyTorch/XLA项目中，将模型转换为StableHLO格式是一个常见的需求。通过torch_xla的export模块可以方便地实现这一转换，但许多开发者对转换后权重的保存方式存在疑问。本文将详细介绍这一技术要点。

StableHLO转换基础

使用PyTorch/XLA进行模型转换时，核心流程是通过tx.export.exported_program_to_stablehlo()函数获取两个关键输出：

模型权重（weights）
StableHLO表示（stablehlo）

其中权重以Python列表形式返回，每个元素对应模型的一个参数。这些参数实际上是JAX数组（jax.Array）对象，需要特殊处理才能持久化保存。

权重保存方案

推荐使用HuggingFace的safetensors格式保存权重，这是目前处理JAX数组的最佳实践之一。具体实现要点包括：

首先将权重列表转换为字典结构，建议使用模型参数的原始路径作为键名
使用safetensors库的Flax专用API进行序列化
保存后的文件具有平台无关性，且支持快速加载

完整保存示例

import safetensors.flax as sf

# 假设已完成模型导出
weights, stablehlo = tx.export.exported_program_to_stablehlo(exported)

# 构建权重字典
weight_dict = {f"param_{i}": w for i, w in enumerate(weights)}

# 保存权重
sf.save_file(weight_dict, "model_weights.safetensors")

# 保存StableHLO表示
with open("model.mlir", "w") as f:
    f.write(stablehlo.mlir_module())