Self-LLM项目中GLM-4-9B-chat微调常见问题解析

2025-05-15 23:17:26作者：郁楠烈Hubert

《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调（全参数/Lora）、部署国内外开源大模型（LLM）/多模态大模型（MLLM）教程

项目地址：https://gitcode.com/GitHub_Trending/se/self-llm

问题背景

在Self-LLM项目中使用GLM-4-9B-chat模型进行LoRA微调时，许多开发者遇到了一个典型错误：在加载LoRA权重进行推理阶段出现"ValueError: too many values to unpack (expected 2)"的错误。这个错误通常发生在模型生成阶段，具体表现为在尝试解包kv_cache时出现值数量不匹配的问题。

错误分析

该错误的根本原因在于环境依赖版本不兼容。从错误堆栈可以看出，问题出现在SelfAttention模块处理kv_cache时，模型期望接收两个值(cache_k和cache_v)，但实际接收到的参数数量不符。这种类型的问题通常与以下因素有关：

transformers库版本过高
peft库与其他组件的版本冲突
模型实现与库版本不匹配

解决方案

经过社区验证，最可靠的解决方案是严格按照以下依赖版本配置环境：

modelscope==1.9.5
transformers==4.40.0
streamlit==1.24.0
sentencepiece==0.1.99
accelerate==0.29.3
datasets==2.13.0
peft==0.10.0
tiktoken==0.7.0

特别需要注意的是，transformers库的版本不能高于4.40.0。这是解决该问题的关键因素。

其他可能出现的相关问题

在解决上述问题后，开发者可能还会遇到以下类似错误：

TypeError: argument after ** must be a mapping, not Tensor 这通常是由于输入参数格式不正确导致的，确保传入generate()方法的参数是字典格式。
Keyword arguments not recognized 这种错误提示某些参数不被识别，同样可能是由于版本不兼容或参数传递方式不正确。

最佳实践建议

环境隔离：建议使用虚拟环境或容器技术隔离项目环境，避免依赖冲突。
版本控制：使用requirements.txt或environment.yml文件精确控制依赖版本。
分步验证：在完整流程前，先验证基础功能是否正常工作。
错误处理：在代码中添加适当的错误处理和日志记录，便于快速定位问题。

技术原理深入

这个问题的本质在于不同版本的transformers和peft库对模型内部状态的处理方式不同。GLM-4-9B-chat模型在实现时对kv_cache的处理有特定要求，当库版本不匹配时：

高版本transformers可能改变了内部状态的组织方式
peft的适配层可能无法正确转换这些状态
导致模型在解码时无法正确解析注意力机制的缓存状态

因此，保持版本一致是确保各组件协同工作的关键。

总结

在使用Self-LLM项目进行大模型微调时，环境配置是成功的关键因素之一。特别是对于GLM-4这样的国产大模型，更需要严格按照推荐的依赖版本进行环境搭建。遇到类似"too many values to unpack"的错误时，首先应该检查环境版本是否匹配，这是解决大多数兼容性问题的有效方法。

《开源大模型食用指南》针对中国宝宝量身打造的基于Linux环境快速微调（全参数/Lora）、部署国内外开源大模型（LLM）/多模态大模型（MLLM）教程

项目地址：https://gitcode.com/GitHub_Trending/se/self-llm

登录后查看全文

项目优选

收起

deepin linux kernel

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。