ChatGLM3微调实践：PtuningV2与模型加载问题解析

2025-05-16 22:20:48作者：滕妙奇

前言

在大型语言模型的应用中，微调(Fine-tuning)是使预训练模型适应特定任务的关键技术。ChatGLM3作为当前热门的开源中文大模型，提供了多种微调方式，包括全参数微调、LoRA和P-TuningV2等。本文将深入探讨ChatGLM3项目中P-TuningV2微调后模型加载的相关问题和技术细节。

P-TuningV2微调机制解析

P-TuningV2是一种参数高效的微调方法，与LoRA不同，它主要通过添加可训练的前缀参数(prefix)来实现模型适配，而不是采用低秩适配的方式。这种微调方式具有以下特点：

参数效率：仅需微调少量参数即可获得良好效果
训练稳定性：相比全参数微调，训练过程更加稳定
模型保存：微调后的模型会保存前缀参数而非完整模型权重

微调后的模型结构

在ChatGLM3项目中，使用P-TuningV2微调后会生成以下关键文件：

pytorch_model.bin：包含微调后的前缀参数
config.json：记录模型配置信息
training_args.bin：保存训练参数

值得注意的是，P-TuningV2微调不会生成adapter_config.json文件，这与LoRA微调方式不同。这是因为P-TuningV2的前缀参数直接集成在模型结构中，不需要额外的适配器配置。

模型加载的正确方式

对于P-TuningV2微调后的模型，应采用标准的模型加载方式：

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained(
    "path_to_finetuned_model",
    trust_remote_code=True,
    device_map="auto"
)

tokenizer = AutoTokenizer.from_pretrained(
    "path_to_finetuned_model",
    trust_remote_code=True
)

如果原始模型位置发生变更，需要确保微调后的模型配置中base_model_name_or_path指向正确的原始模型路径。

常见问题解决方案

缺少adapter_config.json问题：
- 这是正常现象，P-TuningV2微调不会生成该文件
- 无需额外处理，直接加载微调后的模型即可
模型路径变更问题：
- 如果原始模型位置变更，需要手动修改微调模型目录下的config.json文件
- 更新其中的_name_or_path字段为新的原始模型路径
加载方式选择：
- P-TuningV2微调后的模型应使用AutoModelForCausalLM加载
- 只有LoRA微调才需要使用AutoPeftModelForCausalLM