PINTO_model_zoo中BodyPix模型在MacOS上的运行问题与解决方案

2025-06-18 10:16:15作者：邵娇湘

A repository for storing models that have been inter-converted between various frameworks. Supported frameworks are TensorFlow, PyTorch, ONNX, OpenVINO, TFJS, TFTRT, TensorFlowLite (Float32/16/INT8), EdgeTPU, CoreML.

项目地址：https://gitcode.com/gh_mirrors/pi/PINTO_model_zoo

背景介绍

BodyPix是一个基于深度学习的实时人体分割模型，能够识别图像中的人体部位并进行分割。在PINTO_model_zoo项目中，提供了BodyPix模型的ONNX格式实现，方便开发者在不同平台上部署使用。

问题现象

在MacOS系统上运行BodyPix模型时，会出现"Dilation not supported for AutoPadType::SAME_UPPER or AutoPadType::SAME_LOWER"的错误提示。这个问题主要出现在使用CPU执行提供程序时，而在使用DirectML或CUDA等GPU加速的执行提供程序时则不会出现。

问题分析

该问题源于ONNX Runtime在CPU模式下对某些卷积操作的自动填充类型支持不完善。具体来说，当卷积操作同时使用了扩张(dilation)和SAME_UPPER/SAME_LOWER自动填充时，ONNX Runtime的CPU实现会抛出错误。

解决方案

1. 使用不同的执行提供程序

最直接的解决方案是使用支持该操作的执行提供程序：

在支持CUDA的NVIDIA GPU上使用CUDA提供程序
在Windows系统上使用DirectML提供程序
使用TensorRT提供程序

2. 使用OpenVINO作为替代运行时

对于需要在CPU上运行的情况，可以考虑使用OpenVINO作为替代运行时。OpenVINO对这类操作有更好的支持，虽然性能可能不如GPU加速方案，但能够保证功能正常。

3. 模型优化方案

从模型优化的角度，可以考虑以下改进：

将模型中的阈值参数从固定值改为可输入参数，提高灵活性
优化后处理流程，特别是关于关键点提取和掩码生成的逻辑
改进仿射变换和尺寸调整的顺序，确保输出与原始图像对齐

实现细节

关键点提取优化

在原始实现中，关键点提取可能会出现重复值。可以通过以下代码优化：

unique_first_values, unique_indices = np.unique(keypoints_classidscorexy[:, 0], return_index=True)
keypoints_classidscorexy = keypoints_classidscorexy[unique_indices]