YOLOv8 Tracking项目新增ONNX Runtime Silicon GPU支持的技术解析

2025-05-30 17:40:03作者：卓炯娓

在计算机视觉领域，YOLOv8作为当前最先进的实时目标检测算法之一，其跟踪版本YOLOv8 Tracking因其出色的性能和易用性而广受欢迎。近期，该项目迎来了一个重要更新——增加了对ONNX Runtime Silicon GPU的支持，这一改进将显著提升在苹果M系列芯片设备上的推理性能。

技术背景

ONNX Runtime是一个用于运行ONNX模型的高性能推理引擎。传统的ONNX Runtime主要针对通用CPU和NVIDIA GPU进行优化，而随着苹果自研芯片的普及，专门针对M系列芯片优化的ONNX Runtime Silicon版本应运而生。这个版本通过COREMLExecutionProvider执行提供程序，能够充分利用苹果芯片的神经网络引擎和GPU加速能力。

更新内容分析

本次YOLOv8 Tracking的更新主要包含以下技术要点：

新增依赖包支持：项目现在集成了onnxruntime-silicon包，这是专门为苹果M系列芯片优化的ONNX Runtime版本。
执行提供程序集成：新增了COREMLExecutionProvider支持，这是苹果芯片专用的执行提供程序，能够更好地利用硬件加速能力。
性能优化：通过上述改进，在M1/M2系列芯片设备上运行YOLOv8跟踪模型时，可以获得更低的延迟和更高的吞吐量。

技术实现细节

在实现层面，这一更新主要涉及以下技术调整：

后端集成：在ONNXBackend中增加了对苹果芯片的原生支持，使得推理引擎能够自动识别并利用M系列芯片的硬件加速能力。
执行提供程序管理：系统现在能够智能地选择最优的执行提供程序，在苹果设备上优先使用COREMLExecutionProvider，在其他平台上回退到默认提供程序。
性能调优：针对苹果芯片的特定架构进行了参数优化，确保神经网络运算能够充分利用苹果芯片的AMX矩阵协处理器和GPU资源。