PaddleOCR模型微调时准确率从0开始的排查与解决

2025-05-01 11:38:41作者：姚月梅Lane

问题背景

在使用PaddleOCR进行模型微调时，开发者可能会遇到一个常见但令人困惑的问题：当加载预训练模型进行微调时，训练过程中的准确率指标(acc)突然从0开始，而不是从预训练模型的性能水平继续提升。这种现象在PaddleOCR的文本识别模型微调过程中尤为常见。

从实际案例中可以看到，开发者在使用PaddleOCR的SVTR模型进行阿拉伯语文本识别微调时，虽然成功加载了预训练模型(best_accuracy)，但训练日志显示初始准确率为0：

[2025/02/18 03:25:31] ppocr INFO: epoch: [98/148], global_step: 2, lr: 0.000025, acc: 0.000000

同时，损失值(CTCLoss和SARLoss)却显示在合理范围内，表明模型确实加载了预训练权重并进行了前向计算。

经过深入排查，发现这个问题通常与以下因素有关：

数据预处理不一致：微调时使用的数据预处理方式与预训练模型训练时不一致，特别是文本方向问题。在阿拉伯语等从右向左书写的语言中，文本方向处理不当会导致模型无法正确识别。
字典文件不匹配：微调时使用的字符字典与预训练模型训练时使用的字典不一致，导致字符映射关系错乱。
评估指标计算方式：PaddleOCR的评估指标是基于字符匹配计算的，如果预处理阶段就出现了方向错误，即使模型输出了正确结果，评估时也会因方向不一致而判定为错误。

针对这个问题，开发者通过以下步骤成功解决了问题：

这个案例为我们提供了宝贵的经验：

基于此案例，建议开发者在进行PaddleOCR模型微调时遵循以下最佳实践：

通过系统性的问题排查和正确的处理方式，开发者可以成功解决PaddleOCR模型微调中的准确率异常问题，获得理想的模型性能。

登录后查看全文