GLM-4模型微调中的Transformers版本兼容性问题解析

2025-06-03 00:39:09作者：蔡怀权

问题背景

在使用GLM-4-9B-Chat模型进行LoRA微调时，用户遇到了一个典型的版本兼容性问题。当训练进度达到100%时，系统抛出"ValueError: too many values to unpack (expected 2)"错误，这表明在模型输出处理过程中出现了维度不匹配的情况。

问题分析

该问题主要源于Hugging Face Transformers库的版本兼容性。具体表现为：

在Transformers 4.43.3版本下运行时，模型在训练完成时无法正确处理输出张量
同样的错误也出现在推理(inference)阶段
错误信息表明系统预期接收2个值，但实际接收到了更多值

解决方案

经过技术验证，有以下几种解决方案：

升级到最新代码并配合Transformers 4.44.0：项目维护者已更新代码库，支持最新版Transformers
降级到Transformers 4.43.0：这是一个稳定的中间版本，可以避免4.44.0可能出现的评估(evaluation)问题
使用特定模型版本：确保使用最新发布的GLM-4-9B-Chat模型，这些模型已针对新版Transformers进行了优化

技术细节

该问题的本质在于不同版本Transformers对模型输出的处理方式发生了变化。在较新版本中：

缓存格式标准化(standardize_cache_format)参数被引入
模型输出张量的结构可能发生了变化
生成混合(GenerationMixin)类的内部方法接口有调整

最佳实践建议

对于使用GLM-4进行微调的用户，建议：

保持环境一致性：确保开发、训练和推理环境使用相同的库版本
优先使用项目推荐版本：关注项目文档中推荐的库版本组合
分阶段验证：先进行小规模训练验证环境正确性，再开展完整训练
注意模型与库版本的匹配：新模型通常需要新版本库的支持

总结

深度学习框架和库的快速迭代常常带来版本兼容性挑战。GLM-4项目团队持续跟进Hugging Face生态的更新，及时调整代码保持兼容。用户在遇到类似问题时，首先应考虑库版本因素，并通过官方渠道获取最新解决方案。

GLM-4

GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型

项目地址：https://gitcode.com/gh_mirrors/gl/GLM-4

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解