FastDeploy中PPYOLOE模型服务端推理结果异常问题分析

2025-06-26 10:25:49作者：鲍丁臣Ursa

⚡️An Easy-to-use and Fast Deep Learning Model Deployment Toolkit for ☁️Cloud 📱Mobile and 📹Edge. Including Image, Video, Text and Audio 20+ main stream scenarios and 150+ SOTA models with end-to-end optimization, multi-platform and multi-framework support.

项目地址：https://gitcode.com/gh_mirrors/fa/FastDeploy

问题现象

在使用FastDeploy部署PPYOLOE目标检测模型时，发现服务端返回的检测结果存在异常。具体表现为返回了大量低置信度的检测框，似乎没有经过非极大值抑制(NMS)处理或置信度阈值过滤。

原因分析

通过查看PPYOLOE模型的配置文件ppyoloe_crn.yml，发现其默认配置中的NMS参数设置如下：

nms:
  name: MultiClassNMS
  nms_top_k: 1000
  keep_top_k: 300
  score_threshold: 0.01
  nms_threshold: 0.7

关键问题在于score_threshold被设置为0.01，这是一个非常低的阈值，导致模型会输出大量低置信度的检测结果。这种设置通常在模型评估阶段使用，目的是为了计算更精确的mAP指标，但在实际部署场景下并不适用。

解决方案

要解决这个问题，可以在模型导出阶段调整NMS参数：

修改score_threshold为更合理的值（如0.5）
重新导出模型
使用调整后的模型进行部署

最佳实践建议

在实际部署PPYOLOE模型时，建议考虑以下几点：

阈值调整：根据实际应用场景调整score_threshold，平衡召回率和准确率
后处理优化：可以自定义后处理逻辑，根据业务需求过滤检测结果
性能考量：过低的阈值会增加计算量和传输数据量，影响服务性能
模型微调：针对特定场景微调模型，提高在目标阈值下的检测效果

总结

FastDeploy作为高效的推理部署工具，其性能表现依赖于模型的正确配置。在使用PPYOLOE等检测模型时，开发者需要特别注意NMS相关参数的设置，确保在实际部署场景下获得理想的推理结果。通过合理调整阈值参数，可以显著提升模型的实用性和服务性能。

FastDeploy

项目地址：https://gitcode.com/gh_mirrors/fa/FastDeploy

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

nop-entropy

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

349

200

pytorch

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理