QwenLM/Qwen模型加载问题解析：pytorch_model.bin.index.json缺失的解决方案

2025-05-12 19:51:48作者：郜逊炳

在使用QwenLM/Qwen开源大模型时，部分用户遇到了模型加载失败的问题，系统提示缺少pytorch_model.bin.index.json文件。这个问题主要源于模型文件格式的演进和不同版本transformers库的兼容性问题。

问题现象

当用户尝试加载Qwen-1.8B-Chat等模型时，系统会报错提示找不到pytorch_model.bin.index.json文件。这个文件是传统PyTorch模型权重文件的索引文件，用于指示如何加载分片的模型权重。

根本原因

随着深度学习生态的发展，模型存储格式也在不断演进。Qwen项目采用了更现代的safetensors格式来存储模型权重，这种格式相比传统的PyTorch bin文件具有以下优势：

安全性更高：safetensors格式可以防止恶意代码执行
加载速度更快：特别在大模型场景下表现更优
跨平台兼容性更好

因此，Qwen模型仓库中提供的是model.safetensors.index.json文件，而非传统的pytorch_model.bin.index.json。

解决方案

针对这个问题，用户可以采用以下几种解决方法：

更新transformers库：确保使用transformers 4.30或更高版本，新版本已默认支持safetensors格式
明确指定使用safetensors：在旧版transformers中加载时，添加use_safetensors=True参数
检查缓存目录：确认模型文件已完整下载，必要时删除缓存重新下载
使用ModelScope的snapshot_download：国内用户推荐使用ModelScope的下载工具，确保下载完整性

技术背景

safetensors是HuggingFace推出的一种新型模型序列化格式，它解决了传统PyTorch pickle格式的安全隐患。在加载大模型时，safetensors格式能提供更好的性能和安全性保障。随着生态的发展，越来越多的开源大模型项目开始采用这种格式作为默认存储方案。

对于开发者而言，理解这种格式转换有助于更好地使用和维护大模型项目。当遇到类似问题时，检查transformers库版本和模型文件格式的匹配性是首要的排查步骤。

Qwen

The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.

项目地址：https://gitcode.com/GitHub_Trending/qw/Qwen

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Dart

1.04 K

271