GLM-4V-9B模型ValueError问题分析与解决方案

2025-06-03 17:16:23作者：魏侃纯Zoe

GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型

项目地址：https://gitcode.com/gh_mirrors/gl/GLM-4

问题背景

在使用GLM-4V-9B多模态大模型进行推理时，用户遇到了一个典型的错误："ValueError: too many values to unpack (expected 2)"。这个错误发生在模型生成文本的过程中，具体是在调用_update_model_kwargs_for_generation方法时，系统期望获取两个返回值，但实际上收到了一个包含40个元素的元组。

错误分析

该错误属于典型的Python解包错误，发生在transformers库的模型生成过程中。深入分析可以发现：

错误发生在模型生成文本的采样阶段(_sample方法)
具体问题出在_extract_past_from_model_output方法的返回值处理上
系统期望该方法返回一个包含两个元素的元组(缓存名称和缓存值)
但实际上该方法返回了一个包含40个元素的元组，导致解包失败

根本原因

经过技术分析，这个问题的主要原因是transformers库版本不兼容。GLM-4V-9B模型的最新实现需要特定版本的transformers库支持，而用户最初使用的是4.40.2版本，这个版本与模型的实现存在接口不匹配的问题。

具体来说，新版本的GLM模型对缓存机制进行了优化，返回了更详细的缓存信息，但旧版本的transformers库无法正确处理这些信息，导致了返回值解包失败。

解决方案

解决这个问题的方法非常简单：将transformers库升级到4.42.4或更高版本。新版本的transformers库已经适配了GLM-4V-9B模型的接口变更，能够正确处理模型返回的缓存信息。

升级命令如下：

pip install transformers==4.42.4

技术建议

对于使用大型语言模型的开发者，我们建议：

始终关注模型官方文档推荐的依赖库版本
在升级模型权重时，同步检查相关依赖库是否需要更新
建立虚拟环境隔离不同项目的依赖，避免版本冲突
对于多模态模型，特别注意视觉相关依赖的版本兼容性

总结

GLM-4V-9B作为一款先进的多模态大模型，在版本迭代过程中会不断优化内部实现。开发者在使用时应当保持相关依赖库的同步更新，以获得最佳兼容性和性能表现。这次ValueError问题的解决也提醒我们，在深度学习项目中，依赖管理是一个需要特别重视的环节。

GLM-4 series: Open Multilingual Multimodal Chat LMs | 开源多语言多模态对话模型

项目地址：https://gitcode.com/gh_mirrors/gl/GLM-4

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理