PaddleDetection中PPYOLO模型转ONNX时去除NMS层的方法

2025-05-17 05:17:23作者：毕习沙Eudora

问题背景

在使用PaddleDetection框架训练PPYOLO系列目标检测模型后，很多开发者需要将模型导出为ONNX格式以便在不同平台上部署。但在导出过程中经常会遇到一个常见问题：即使设置了export.nms=False参数，导出的ONNX模型仍然包含NMS(Non-Maximum Suppression)层，并且会收到关于batch size限制的警告信息。

问题分析

NMS是目标检测后处理中的重要步骤，用于过滤冗余的检测框。在模型导出时，NMS层会导致以下问题：

ONNX模型只能支持batch size=1的推理
增加了模型的计算复杂度
限制了模型在不同硬件平台上的部署灵活性

解决方案

经过实践验证，可以通过修改模型配置文件来彻底去除NMS层。具体方法如下：

打开模型的配置文件（通常是runtime.yml或训练时使用的配置文件）
在PPYOLOEHead配置部分添加以下参数：

PPYOLOEHead:
  exclude_nms: True
  # 其他原有配置...

技术原理

这个解决方案的工作原理是：

exclude_nms参数会告诉模型在导出时完全排除NMS层
导出的模型将只包含检测网络的主体部分
后处理的NMS操作可以在应用层面单独实现

优势对比

相比于包含NMS的导出模型，这种方法的优势在于：

特性	包含NMS的模型	去除NMS的模型
支持的batch size	只能是1	任意大小
模型复杂度	较高	较低
部署灵活性	受限	更高
后处理控制	固定	可自定义

实践建议

对于需要批量推理的场景，强烈建议去除NMS层
去除NMS后，需要在应用代码中实现相应的后处理逻辑
不同版本的PaddleDetection可能有细微差异，建议测试验证导出结果

通过这种方法，开发者可以更灵活地部署PPYOLO系列模型，充分发挥硬件性能，适应各种实际应用场景的需求。

PaddleDetection

PaddleDetection - 一个基于 PaddlePaddle 的目标检测开发套件，提供丰富的模型和工具，适用于进行计算机视觉和深度学习研究的程序员。

项目地址：https://gitcode.com/gh_mirrors/pa/PaddleDetection

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

339

186

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.35 K

759