VMamba项目中的Cityscapes语义分割结果复现问题解析

2025-06-30 07:12:29作者：宣海椒Queenly

问题背景

在VMamba项目的语义分割任务中，研究人员发现当使用tiny-s1l8模型在Cityscapes数据集上进行微调时，无法复现论文中报告的mIoU指标。具体表现为：使用相同的预训练权重(pth文件)时，实际获得的mIoU(47.1)低于预期结果。

通过深入分析日志和实验数据，我们发现了几个关键点：

初始验证性能差异：在训练的第16000次迭代时，验证mIoU为37.58，而论文中报告的对应值为42.05，这表明模型从训练初期就存在性能差异。
权重加载验证：检查预训练权重加载情况显示，分类预训练权重(vssm1_tiny_0230s_ckpt_epoch_264.pth)已成功加载，但存在一些层不匹配的情况(如outnorm层缺失，分类头层多余)，这是预期中的正常现象。
批量大小影响：进一步分析发现验证阶段的批量大小(batch size)设置差异是导致结果不一致的主要原因。原始实验使用较大的验证批量大小(对应总迭代次数250次)，而复现实验使用较小的批量大小(对应总迭代次数500次)。

在语义分割任务中，批量大小对结果的影响主要体现在以下几个方面：

要确保复现论文结果，应特别注意以下几点：

这个案例给我们带来以下启示：

通过调整验证批量大小与原始实验保持一致，研究人员成功解决了VMamba语义分割结果复现不一致的问题，这为后续相关研究提供了有价值的参考经验。

登录后查看全文