ChatGLM3微调过程中的常见问题及解决方案

2025-05-16 13:29:40作者：吴年前Myrtle

问题背景

在使用ChatGLM3进行p-tuning-v2微调时，许多开发者遇到了相似的错误。这些错误主要与环境配置和库版本兼容性有关，特别是transformers库的版本问题。本文将详细分析这些问题的根源，并提供有效的解决方案。

在微调过程中，开发者通常会遇到以下两类典型错误：

BatchEncoding转换错误：表现为BatchEncoding.to() got an unexpected keyword argument 'non_blocking'，最终导致'NoneType' object has no attribute 'to'错误。
TrainerState初始化错误：表现为TrainerState.__init__() got an unexpected keyword argument 'stateful_callbacks'，通常发生在尝试从检查点恢复训练时。

这个问题的根本原因是transformers库版本过高（如4.41.1）与ChatGLM3微调代码不兼容。新版本的transformers对BatchEncoding类的处理方式发生了变化，导致在设备转换时出现参数不匹配的问题。

这个问题同样源于版本不兼容，当transformers库版本降得过低时（如4.40.0），虽然解决了第一个问题，但又会导致新的API不兼容问题。这是因为不同版本的transformers对TrainerState类的初始化参数要求不同。

推荐方案：将transformers库版本降级到4.40.0版本。这个版本经过验证能够解决BatchEncoding相关的转换问题，同时保持较好的稳定性。

安装命令：

pip install transformers==4.40.0

如果降级到4.40.0后出现TrainerState初始化错误，可以考虑以下两种方案：

为了获得最佳的微调体验，建议建立如下的Python环境配置：

ChatGLM3微调过程中的常见问题多源于环境配置不当，特别是transformers库的版本问题。通过合理控制库版本和环境配置，大多数问题都能得到有效解决。建议开发者在开始微调前，先建立一个干净的环境，并严格按照推荐的版本进行配置，这样可以避免许多不必要的问题。

登录后查看全文