YOLOv10模型导出TensorRT引擎文件问题解析与解决方案

2025-05-22 20:26:45作者：明树来

问题背景

在使用YOLOv10进行模型部署时，许多开发者尝试将训练好的PyTorch模型(.pt)转换为TensorRT引擎文件(.engine)以提升推理性能。然而，在TensorRT 10及以上版本中，用户遇到了导出失败的问题，错误提示显示"max_workspace_size"参数已被移除。

错误现象分析

当用户执行类似以下命令时：

yolo export model=yolov10n.pt format=engine half=True simplify opset=13 workspace=16

系统会抛出错误，指出TensorRT 8.0及以上版本已经移除了max_workspace_size参数。这是由于TensorRT API在新版本中进行了调整，将工作空间设置方式从max_workspace_size变更为set_memory_pool_limit。

技术原理

TensorRT是NVIDIA推出的高性能深度学习推理优化器和运行时引擎。在模型转换过程中：

工作空间(workspace)：指TensorRT在优化过程中可使用的临时内存大小，足够的工作空间可以帮助TensorRT找到更优的kernel实现。
API变更：TensorRT 8.0后引入了更精细的内存管理机制，废弃了简单的max_workspace_size参数，改用set_memory_pool_limit来设置不同类型的内存池限制。

解决方案

方案一：降级TensorRT版本

经过验证，将TensorRT版本降至8.6.1可以解决此问题。这是最直接的解决方案，因为8.6.1版本仍支持原有的API调用方式。

安装指定版本命令示例：

pip install tensorrt==8.6.1

方案二：修改导出代码

对于希望保持新版本TensorRT的用户，可以修改YOLOv10的export.py文件中的export_engine方法：

将原有的max_workspace_size设置替换为set_memory_pool_limit
确保workspace参数正确传递到配置中

修改后的关键代码段应类似：

config = builder.create_builder_config()
workspace = self.args.workspace
config.set_memory_pool_limit(trt.MemoryPoolType.WORKSPACE, workspace * 1 << 30)