ChatGLM3微调推理过程中tokenizer报错问题分析与解决方案

2025-05-16 00:45:16作者：牧宁李

问题背景

在使用ChatGLM3进行P-Tuning微调后，用户在执行推理(inference)时遇到了一个关于tokenizer的报错。具体错误信息显示为"AttributeError: can't set attribute 'eos_token'"，这表明在加载tokenizer时尝试设置eos_token属性时出现了问题。

错误分析

这个错误通常发生在以下情况：

tokenizer版本不匹配：当使用较新版本的transformers库加载旧版tokenizer时，可能会因为属性设置方式的变化而出现此类错误。
配置文件不一致：微调后的模型checkpoint中的tokenizer配置文件与当前代码库版本不一致。
属性保护机制：在某些版本的transformers中，eos_token等特殊token属性可能被设置为只读，无法直接修改。

解决方案

根据项目维护者的建议，解决此问题的方法是：

更新代码库：将huggingface transformers代码和ChatGLM3项目代码更新至2023年2月23日(0223)版本。这个版本虽然模型文件没有变化，但配置文件已经更新，可以解决tokenizer加载问题。
版本一致性检查：确保训练和推理环境使用的transformers库版本一致，避免因版本差异导致的兼容性问题。

深入理解

在自然语言处理中，tokenizer负责将文本转换为模型可以理解的token ID序列。eos_token(End Of Sequence token)是tokenizer中一个重要的特殊token，用于标记序列的结束。当tokenizer加载过程中无法设置这个关键属性时，整个推理流程就会中断。

ChatGLM3作为大型语言模型，其tokenizer实现有其特殊性。项目维护者通过更新配置文件的方式解决了这个问题，说明这可能是一个已知的兼容性问题，而非模型本身的缺陷。

最佳实践建议

环境管理：在使用ChatGLM3进行微调和推理时，建议使用虚拟环境，并严格记录所有依赖库的版本。
版本控制：跟踪项目更新日志，及时同步最新代码，特别是配置文件的变更。
错误排查：遇到类似tokenizer加载问题时，可以尝试清除huggingface缓存(通常位于~/.cache/huggingface)，然后重新加载模型和tokenizer。
社区支持：ChatGLM3作为开源项目，遇到问题时可以参考社区讨论或提交issue寻求帮助。

通过遵循这些建议，用户可以更顺利地完成ChatGLM3的微调和推理流程，充分发挥这一强大语言模型的潜力。

ChatGLM3

ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

项目地址：https://gitcode.com/gh_mirrors/ch/ChatGLM3

登录后查看全文