ChatGLM3模型微调后推理报错问题分析与解决方案

2025-05-16 23:31:13作者：冯梦姬Eddie

ChatGLM3 - 由清华大学和智谱AI联合发布的新一代对话预训练模型，具备强大的语言理解和生成能力。

项目地址：https://gitcode.com/gh_mirrors/ch/ChatGLM3

问题背景

在使用ChatGLM3项目进行模型微调时，用户可能会遇到一个典型问题：在成功完成finetune_hf.py脚本的微调后，尝试使用inference_hf.py脚本加载checkpoint进行推理时，系统会提示需要信任远程代码(trust_remote_code)，即使脚本中已经明确设置了trust_remote_code=True参数。

错误现象

当用户运行推理脚本时，控制台会显示以下信息：

首先正常加载模型checkpoint分片
随后提示需要执行自定义代码
即使用户输入"y"确认，仍然会抛出ValueError异常，提示需要设置trust_remote_code=True

根本原因分析

经过深入分析，这个问题主要由以下几个因素共同导致：

transformers库版本兼容性问题：最新版本的transformers(4.37.2)与ChatGLM3存在某些兼容性问题
peft库版本冲突：当peft升级到0.8.0及以上版本时，会出现此类问题
模型加载机制变化：新版本库对自定义模型的安全检查机制更加严格

解决方案

针对这个问题，我们推荐以下解决方案：

方案一：版本降级

将transformers库降级到4.36.0版本：
```
pip install transformers==4.36.0
```
确保peft库保持在0.7.1版本：
```
pip install peft==0.7.1
```

方案二：更新模型文件

确保使用最新的ChatGLM3模型文件
执行项目中的update_requirements.sh脚本更新所有依赖

方案三：环境检查

检查CUDA版本是否兼容(建议11.8)
确认torch版本与CUDA匹配(2.2.0+cu118)
清理并重建Python虚拟环境

最佳实践建议

版本控制：在开始项目前，固定关键库的版本
环境隔离：使用虚拟环境或容器技术隔离不同项目的运行环境
日志记录：详细记录环境配置和版本信息，便于问题排查
逐步验证：在完整流程前，先验证各环节是否能独立运行

技术原理深入

这个问题本质上反映了深度学习框架生态中版本管理的复杂性。transformers库作为HuggingFace生态的核心组件，其模型加载机制在不同版本间可能发生变化。ChatGLM3作为基于自定义架构的大模型，需要特定的库版本来保证兼容性。

当加载包含自定义代码的模型时，新版本的安全机制会强制进行交互式确认，而某些环境下这种交互可能无法正常工作。版本降级可以规避这个问题，因为旧版本的加载机制更为宽松。

总结

ChatGLM3模型微调后的推理问题是一个典型的版本兼容性问题。通过控制关键库的版本，可以有效解决trust_remote_code相关的错误。建议用户在开始ChatGLM3项目前，仔细检查并固定相关依赖的版本，以确保整个工作流程的顺畅运行。

ChatGLM3 - 由清华大学和智谱AI联合发布的新一代对话预训练模型，具备强大的语言理解和生成能力。

项目地址：https://gitcode.com/gh_mirrors/ch/ChatGLM3

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理