TensorRT编译ONNX模型时出现Unsupported Formats错误的分析与解决

2025-05-20 16:58:59作者：伍霜盼Ellen

NVIDIA® TensorRT™ is an SDK for high-performance deep learning inference on NVIDIA GPUs. This repository contains the open source components of TensorRT.

项目地址：https://gitcode.com/GitHub_Trending/tens/TensorRT

问题背景

在使用TensorRT的trtexec工具编译ONNX模型时，用户遇到了一个关键错误："Assertion !n->candidateRequirements.empty() failed. No supported formats for Unsqueeze"。这个错误发生在模型编译阶段，具体是在处理自注意力机制中的rotary_emb/Unsqueeze_1节点时。

错误详情

错误信息表明TensorRT无法为特定的Unsqueeze操作找到支持的格式。从日志中可以看到，错误发生在图优化阶段之后，当TensorRT尝试为计算图应用通用优化时。错误的核心是TensorRT内部格式要求检查失败，系统无法为Unsqueeze操作确定合适的数据格式。

环境信息

该问题出现在以下环境中：

TensorRT版本：8.6.0.1（24.01-py3容器）
GPU型号：NVIDIA A100-80GB
CUDA版本：12.3.2.001
cuDNN版本：8.9.7.29

问题分析

模型兼容性：该ONNX模型在其他框架（如ONNX Runtime）中可以正常运行，说明模型本身是有效的，问题特定于TensorRT的实现。
操作支持：Unsqueeze操作本身是ONNX标准操作，TensorRT理论上应该支持。问题可能出在特定上下文或参数组合下TensorRT的实现限制。
版本因素：NVIDIA官方确认该问题将在TensorRT 10.0 EA版本中修复，说明这是一个已知的版本特定问题。

解决方案

对于遇到此问题的用户，建议采取以下步骤：

等待官方更新：NVIDIA已确认该问题将在TensorRT 10.0 EA版本中修复，用户可以等待此版本发布后升级。
临时解决方案：在等待修复期间，可以考虑：
- 尝试使用不同版本的TensorRT（如较早的稳定版本）
- 修改模型结构，避免使用可能导致问题的特定Unsqueeze操作模式
- 使用其他推理引擎作为临时替代方案
模型优化：对于生产环境，建议：
- 对模型进行更详细的性能分析
- 考虑使用TensorRT的Python API进行更精细的控制
- 实施完整的CI/CD流程，包括模型验证和性能测试