MMPose项目中使用预训练模型进行微调时的常见问题解析

2025-06-03 11:00:49作者：郦嵘贵Just

问题背景

在使用MMPose进行姿态估计任务时，研究人员和开发者经常会遇到需要基于预训练模型进行微调的情况。然而，在实际操作过程中，特别是在尝试加载预训练权重时，可能会遇到message_hub键缺失的错误提示，导致模型无法正常加载。

错误现象分析

当用户尝试通过python tools/train.sh --resume <path to pretrained checkpoint>命令恢复训练或加载预训练模型时，系统会抛出KeyError: 'message_hub'错误。这是因为MMEngine的Runner在恢复训练时，默认会尝试加载检查点中的message_hub状态，而MMPose保存的模型检查点中并不包含这一信息。

技术原理

MMPose和MMEngine之间的交互机制是理解这一问题的关键。MMEngine作为底层框架，设计了一套完整的训练状态恢复机制，其中包括对message_hub状态的保存和恢复。而MMPose作为上层应用，在保存模型时出于精简考虑，没有保存message_hub相关的状态信息。

解决方案

正确加载预训练权重的方法

区分resume和load_from：
- resume=True用于恢复中断的训练，会尝试加载完整的训练状态
- load_from仅用于加载模型权重，不恢复训练状态

推荐做法：

python tools/train.py configs/your_config.py --load-from=pretrained_model.pth

配置文件设置：在配置文件中明确指定：
```
load_from = 'pretrained_model.pth'
```

命令行参数的正确使用

对于命令行操作，应该避免使用--resume参数来加载预训练权重，而应该使用--load-from参数：

python tools/train.py configs/your_config.py --load-from=pretrained_model.pth

深入理解

模型保存机制： MMPose默认只保存模型权重和优化器状态，不保存训练过程中的message_hub等辅助信息，这是为了减小模型文件体积。
训练恢复与权重加载的区别：
- 训练恢复(resume)需要完整的训练状态
- 权重加载(load_from)只需要模型参数
版本兼容性：不同版本的MMPose和MMEngine在这方面的处理可能略有不同，建议保持框架和工具包版本的一致性。

最佳实践建议

明确区分预训练权重加载和训练恢复两种场景
对于微调任务，优先使用load_from参数
检查模型文件和配置文件的版本兼容性
在团队协作中，统一模型保存和加载的规范

通过理解这些底层机制和正确使用方法，可以避免在MMPose项目中使用预训练模型时遇到的各种问题，提高开发效率。

mmpose

OpenMMLab Pose Estimation Toolbox and Benchmark.

项目地址：https://gitcode.com/GitHub_Trending/mm/mmpose

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.26 K

692