PINTO_model_zoo中CREStereo模型的TensorRT优化与使用指南

2025-06-18 11:42:43作者：冯梦姬Eddie

A repository for storing models that have been inter-converted between various frameworks. Supported frameworks are TensorFlow, PyTorch, ONNX, OpenVINO, TFJS, TFTRT, TensorFlowLite (Float32/16/INT8), EdgeTPU, CoreML.

项目地址：https://gitcode.com/gh_mirrors/pi/PINTO_model_zoo

概述

CREStereo是一种基于深度学习的立体匹配算法，能够从双目图像中精确计算视差图。在PINTO_model_zoo项目中，提供了多种CREStereo模型的ONNX格式实现，包括不同分辨率、迭代次数和精度版本。本文将重点介绍如何针对TensorRT推理环境优化CREStereo模型，特别是"next"版本模型的使用方法。

CREStereo模型架构特点

CREStereo模型采用迭代优化的设计思想，通过多次迭代逐步优化视差图。标准模型通常包含以下关键组件：

特征提取网络：从左右图像中提取多层次特征
代价体构建模块：建立特征间的相关性
迭代优化模块：通过GRU单元逐步优化视差估计
上采样模块：将低分辨率视差图上采样至输入图像尺寸

"next"版本模型的特殊之处

"next"版本模型是标准CREStereo模型的一个变体，它允许外部输入初始视差图(flow)作为网络的初始估计。这种设计带来了几个优势：

可以与传统立体匹配算法(SGBM、BM等)结合使用，用传统算法的输出作为初始估计
支持多阶段处理，将前一次迭代的输出作为下一次迭代的输入
提高了算法的灵活性，可以根据需要调整初始估计来源

模型转换与优化

要将标准CREStereo模型转换为"next"版本，可以使用ONNX模型操作工具进行子图提取。关键步骤如下：

识别模型中的关键节点：
- 输入节点：next_left(左图)、next_right(右图)、init_output(初始视差)
- 输出节点：next_output(优化后的视差)

使用sne4onnx工具提取相关子图：

sne4onnx \
--input_onnx_file_path crestereo_combined_iter20_480x640.onnx \
--input_op_names next_left next_right init_output \
--output_op_names next_output \
--output_onnx_file_path crestereo_combined_iter20_480x640_next.onnx