TensorRT加载大尺寸ONNX模型时的外部数据路径问题解析

2025-05-20 10:15:46作者：齐冠琰

NVIDIA® TensorRT™ is an SDK for high-performance deep learning inference on NVIDIA GPUs. This repository contains the open source components of TensorRT.

项目地址：https://gitcode.com/GitHub_Trending/tens/TensorRT

在深度学习模型部署过程中，TensorRT作为NVIDIA推出的高性能推理引擎，经常被用来优化和加速ONNX格式的模型。然而，当处理大型ONNX模型时，开发者可能会遇到一个典型问题：模型权重数据被分离存储为外部文件时，TensorRT无法正确加载这些数据文件。

问题现象

当ONNX模型文件大小超过2GB时，ONNX规范会自动将模型权重数据分离存储为外部文件。这种情况下，TensorRT在尝试加载模型时会出现路径解析错误。具体表现为：

模型文件结构合理存放时（ONNX主文件和数据文件在同一目录），TensorRT却无法找到数据文件
错误信息提示无法打开数据文件，导致模型初始化失败
只有将数据文件移动到当前工作目录才能成功加载

问题根源

经过分析，这个问题源于TensorRT的ONNX解析器在查找外部数据文件时，默认只会在当前工作目录下搜索，而不会考虑ONNX主文件所在的目录。这与ONNX规范的设计初衷不符，因为ONNX导出时通常将所有相关文件放在同一目录下。

解决方案

针对这个问题，TensorRT提供了专门的接口来处理外部数据路径。开发者需要在调用解析器时显式指定数据文件的路径。具体实现方式如下：

import tensorrt as trt

# 创建TensorRT基础组件
trt_logger = trt.Logger()
builder = trt.Builder(trt_logger)
network = builder.create_network(1 << int(trt.NetworkDefinitionCreationFlag.EXPLICIT_BATCH))
config = builder.create_builder_config()

# 创建ONNX解析器
parser = trt.OnnxParser(network, trt_logger)

# 正确加载带有外部数据的ONNX模型
model_path = "path/to/your/model.onnx"
with open(model_path, 'rb') as model_file:
    # 关键步骤：传递模型文件所在目录作为搜索路径
    if not parser.parse(model_file.read(), model_path):
        for error in range(parser.num_errors):
            print(parser.get_error(error))