首页
/ OpenGVLab/InternVideo项目中的VideoMAEv2模型权重获取指南

OpenGVLab/InternVideo项目中的VideoMAEv2模型权重获取指南

2025-07-07 19:59:43作者:魏侃纯Zoe

在计算机视觉领域,预训练模型权重的获取对于研究人员和开发者至关重要。近期,OpenGVLab团队开发的InternVideo项目中,VideoMAEv2模型权重下载方式发生了变化,值得广大使用者注意。

模型权重迁移背景

VideoMAEv2是OpenGVLab团队推出的重要视频理解模型,其中vit_g_hybrid版本因其优异的性能受到广泛关注。该模型最初通过阿里云OSS服务提供下载,但近期团队已将模型权重迁移至更稳定的托管平台。

当前可用模型版本

目前可通过以下方式获取三个关键版本的模型权重:

  1. 基础预训练模型 - vit_g_hybrid_pt_1200e.pth
  2. Kinetics-710微调版本 - vit_g_hybrid_pt_1200e_k710_ft.pth
  3. Something-Something V2微调版本 - vit_g_hybrid_pt_1200e_ssv2_ft.pth

使用建议

对于大多数视频理解任务,建议从基础预训练模型开始,根据具体需求选择是否进行领域适配。Kinetics-710版本适用于通用视频分类任务,而Something-Something V2版本则更适合细粒度动作识别场景。

研究人员在使用这些预训练权重时,应注意模型的输入规格和预处理流程,确保与原始训练设置保持一致,以获得最佳性能表现。

注意事项

模型权重文件较大,下载时请确保网络环境稳定。建议使用支持断点续传的下载工具,并验证下载文件的完整性。对于国内用户,从新的托管平台下载通常能获得更好的速度和稳定性。

登录后查看全文
热门项目推荐
相关项目推荐