Super-Gradients项目中ONNX模型批量预测的支持现状

2025-06-11 15:46:03作者：尤峻淳Whitney

super-gradients

Deci-AI/super-gradients: 是一个用于深度学习模型优化的库。适合用于需要训练和优化深度学习模型的研究者和开发者。特点是可以提供高效的优化算法和工具，支持多种深度学习框架。

项目地址：https://gitcode.com/GitHub_Trending/su/super-gradients

在深度学习模型部署过程中，将PyTorch模型导出为ONNX格式是一个常见需求。本文基于Super-Gradients项目中的一个实际案例，探讨了使用该框架导出支持批量预测的ONNX模型的相关技术细节。

模型导出基础流程

Super-Gradients提供了便捷的模型导出功能。以PP-YOLOE_L模型为例，用户可以通过以下代码将训练好的模型导出为ONNX格式：

best_model = models.get(
    model_name=Models.PP_YOLOE_L,
    num_classes=8,
    checkpoint_path="yolox/pp_long_run_filtered_classes/RUN_20240412_081806_035870/average_model.pth"
)
export_result = best_model.export("pp_yolo.onnx", input_image_shape=(640,640), confidence_threshold=0.75)

这段代码会生成一个输入形状为[1, 3, 640, 640]的ONNX模型，其中1表示批处理大小(batch size)，3表示RGB三个通道，640x640是输入图像的分辨率。

批量预测需求与限制

在实际生产环境中，我们通常需要对多个图像进行批量预测以提高推理效率。理想情况下，模型应该支持[N, 3, 640, 640]的输入形状，其中N是批处理大小。

当前Super-Gradients的模型导出功能确实支持通过batch_size参数显式指定批处理大小。例如：

export_result = best_model.export("pp_yolo.onnx", 
                                input_image_shape=(640,640), 
                                confidence_threshold=0.75,
                                batch_size=4)

这将生成一个支持批处理大小为4的ONNX模型。

动态批处理支持现状

关于动态批处理（即允许N在运行时变化），目前Super-Gradients框架尚未提供原生支持。这是一个已知的功能限制，项目团队表示欢迎社区贡献来实现这一特性。

技术实现建议

对于需要动态批处理的场景，开发者可以考虑以下替代方案：

模型修改：手动修改导出的ONNX模型，将固定批处理维度改为动态维度
分批处理：在应用层实现分批逻辑，将大批次拆分为模型支持的小批次
自定义导出：扩展Super-Gradients的导出功能，添加动态维度支持

总结

Super-Gradients为模型导出提供了便捷的接口，但目前对动态批处理的支持有限。开发者需要根据实际需求选择固定批处理大小或实现自定义解决方案。随着项目的持续发展，这一功能限制有望在未来版本中得到解决。

super-gradients

Deci-AI/super-gradients: 是一个用于深度学习模型优化的库。适合用于需要训练和优化深度学习模型的研究者和开发者。特点是可以提供高效的优化算法和工具，支持多种深度学习框架。

项目地址：https://gitcode.com/GitHub_Trending/su/super-gradients

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

flutter_flutter

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

ohos_react_native

React Native鸿蒙化仓库

基于golang开发的网关。具有各种插件，可以自行扩展，即插即用。此外，它可以快速帮助企业管理API服务，提高API服务的稳定性和安全性。

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理