PyTorch-TensorRT 模型导出与保存问题解析

2025-06-29 09:29:38作者：丁柯新Fawn

问题背景

在使用PyTorch-TensorRT进行模型编译和导出时，开发者经常会遇到一些技术难题。本文将以ResNet50模型为例，深入分析两种常见的模型导出方式及其解决方案。

方法一：直接使用TorchScript保存

第一种方法尝试使用torch.jit.trace直接保存编译后的TensorRT模型：

model = resnet50().eval().to('cuda')
inputs = [torch.randn((1, 3, 224, 224)).cuda()]
trt_gm = torch_tensorrt.compile(model, ir="dynamo", inputs=inputs)
trt_traced_model = torch.jit.trace(trt_gm, inputs)
torch.jit.save(trt_traced_model, "trt_model.ts")

这种方法会报错RuntimeError: Could not get name of python class object，原因是编译后的TensorRT模型对象无法被TorchScript正确识别和序列化。

方法二：使用ExportedProgram保存

第二种方法尝试使用PyTorch 2.x的导出机制：

trt_gm = torch_tensorrt.compile(model, ir="dynamo", inputs=inputs)
trt_exp_program = torch_tensorrt.dynamo.export(trt_gm, inputs, 'ep')
torch.export.save(trt_exp_program, "trt_model.ep")

这种方法会报错AttributeError: 'ExportedProgram' object has no attribute 'named_children'，表明ExportedProgram对象与TensorRT编译后的模型存在兼容性问题。

解决方案

PyTorch-TensorRT 2.3版本引入了专门的保存API来解决这些问题：

torch_tensorrt.save(
    trt_gm, 
    file_path="/path/to/model.ts", 
    inputs=inputs, 
    output_format="torchscript"
)

这个API专门针对TensorRT编译后的模型进行了优化，能够正确处理模型序列化过程中的各种特殊情况。

技术要点

模型编译过程：TensorRT会对PyTorch模型进行优化和转换，生成特殊的执行引擎，这使得传统的保存方法可能失效。
版本兼容性：PyTorch 2.x的导出机制与TensorRT需要特定的适配层，2.3版本之前缺少这种适配。
最佳实践：对于TensorRT编译后的模型，应优先使用框架提供的专用保存API，而不是通用的PyTorch保存方法。

总结

在使用PyTorch-TensorRT时，模型保存是一个需要特别注意的环节。开发者应确保：

使用最新版本的PyTorch-TensorRT
遵循官方推荐的保存方式
理解不同保存格式的适用场景

通过正确的方法，可以确保TensorRT优化后的模型能够被持久化保存并在不同环境中稳定运行。

TensorRT

PyTorch/TorchScript/FX compiler for NVIDIA GPUs using TensorRT

项目地址：https://gitcode.com/gh_mirrors/te/TensorRT

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.1 K

611

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

PyTorch-TensorRT 模型导出与保存问题解析

问题背景

方法一：直接使用TorchScript保存

方法二：使用ExportedProgram保存

解决方案

技术要点

总结

热门内容推荐

最新内容推荐

项目优选

PyTorch-TensorRT 模型导出与保存问题解析

问题背景

方法一：直接使用TorchScript保存

方法二：使用ExportedProgram保存

解决方案

技术要点

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选