PyTorch-TensorRT 编译模型调用问题分析与解决方案

2025-06-29 05:23:18作者：范靓好Udolf

问题背景

PyTorch-TensorRT 作为 PyTorch 生态中的重要加速工具，近期在最新 nightly 版本中出现了一个关键性问题：当使用默认的 exported_program 输出格式编译模型后，直接调用编译后的模型会报错。这个问题源于 PyTorch 核心框架对 ExportedProgram 调用方式的限制性变更。

问题现象

用户在尝试调用经过 TensorRT 编译的模型时遇到两种错误情况：

直接调用编译后的模型会收到错误提示："Unable to call ExportedProgram directly. You should use exported_program.module() instead"
按照提示使用 module() 方法后，又会出现语法错误："closing parenthesis '}' does not match opening parenthesis '['"

技术分析

这个问题本质上是由 PyTorch 框架对 ExportedProgram 调用方式的限制性变更引起的。具体来说：

调用限制变更：PyTorch 核心框架现在禁止直接调用 ExportedProgram 对象，强制要求通过 module() 方法访问
代码生成问题：当尝试通过 module() 方法访问时，系统在生成 Python 源代码时出现了括号不匹配的语法错误
兼容性影响：这一变更影响了所有使用默认 exported_program 输出格式的 PyTorch-TensorRT 编译流程

临时解决方案

目前官方团队正在修复此问题，在此期间用户可以采用以下临时解决方案：

optimized_model = torch_tensorrt.compile(
    model,
    ir="dynamo",
    inputs=inputs,
    enabled_precisions={torch.half},
    debug=True,
    min_block_size=1,
    output_format="fx"  # 显式指定输出格式为fx
)

将 output_format 参数显式设置为 "fx" 可以绕过这个问题，因为：