Paddle-Lite表格识别模型移植与推理优化实践

2025-05-31 08:18:36作者：廉彬冶Miranda

问题背景

在将PaddleOCR中的表格识别模型移植到Paddle-Lite平台时，开发者遇到了推理结果不一致的问题。具体表现为：在Python环境下使用PaddleOCR推理结果正常，但将模型转换为Paddle-Lite格式后，在C++环境下推理结果出现明显偏差。

环境配置

PaddlePaddle版本：2.6.2
Paddle-Lite版本：v2.13-rc
PaddleOCR版本：release/2.7
硬件环境：ARMv8架构CPU（hisi mix210）

关键问题分析

模型转换问题：使用opt工具将表格识别模型转换为.nb格式后，推理精度下降
预处理差异：Python和C++环境下的图像预处理操作可能存在细微差别
后处理实现：输出结果的解析和处理方式需要与模型输出严格匹配

解决方案

1. 模型转换注意事项

确保opt工具的版本与Paddle-Lite版本一致。转换命令示例：

./opt --model_file=model.pdmodel --param_file=model.pdiparams --optimize_out=model_opt

2. 图像预处理标准化

正确的预处理流程应包括：

调整图像大小（最长边缩放到488像素）
图像归一化（均值[0.485,0.456,0.406]，标准差[0.229,0.224,0.225]）
填充至正方形（488x488）

关键代码示例：

cv::Mat resizeImageToMaxSide(cv::Mat img, int max_side_len) {
    // 实现图像缩放逻辑
}

cv::Mat normalizeImage(cv::Mat img, vector<float> mean, vector<float> std, float scale) {
    // 实现归一化逻辑
}

3. 后处理实现优化

正确的后处理应包含：

解析模型输出的位置预测和结构概率
调整坐标到原始图像尺寸
处理HTML标签索引

关键代码示例：

const float *loc_preds = results->data<float>();
const float *structure_probs = results->data<float>();

for (int step_idx = 0; step_idx < structure_probs_shape[1]; step_idx++) {
    // 处理每个步骤的输出
    int char_idx = argmax(...);
    // 调整坐标
    for (int point_idx = 0; point_idx < loc_preds_shape[2]; point_idx++) {
        float point = loc_preds[...];
        // 根据图像尺寸调整坐标
    }
}