CoreMLTools中cumsum操作符参数数量问题的分析与修复

2025-06-12 02:07:57作者：董灵辛Dennis

在深度学习模型转换过程中，操作符的参数处理是一个关键环节。本文深入分析了CoreMLTools项目中cumsum操作符参数数量不一致的问题，以及其解决方案。

问题背景

cumsum（累积求和）是PyTorch中的一个常用操作，其函数签名在PyTorch文档中定义为接受1-3个参数，其中第三个参数（输出张量）是可选的。然而在CoreMLTools的转换逻辑中，发现了一个潜在的问题：代码中错误地将cumsum操作符标记为需要3个参数，而实际实现中只使用了前2个参数。

技术细节分析

在PyTorch中，cumsum的基本用法有两种形式：

torch.cumsum(input, dim)
torch.cumsum(input, dim, out=None)

CoreMLTools的转换器在处理这一操作时，出现了参数数量定义与实际使用不一致的情况。具体表现为：

在操作符注册部分，错误地将num_inputs设置为3
但在实际转换函数中，只处理了input和dim两个参数
完全忽略了可选的out参数

这种不一致会导致在模型转换过程中，当遇到只提供2个参数的cumsum调用时，转换器会错误地报出参数数量不匹配的错误。

影响范围

这一问题会影响所有使用cumsum操作且不提供out参数的PyTorch模型转换。特别是在使用较新版本的PyTorch(如2.5.0及以上)进行模型导出时，转换失败的可能性更高。

解决方案

CoreMLTools团队确认并修复了这一问题，主要变更包括：

将cumsum操作符的num_inputs从3修正为2
保持转换逻辑不变，仍只处理前两个必需参数
明确忽略可选的out参数

这一修复已包含在CoreMLTools 8.1版本中，新的实现正确处理了cumsum操作的各种调用形式。

验证方法

开发者可以通过以下方式验证修复效果：

import torch
import coremltools as ct

# 创建一个简单的测试模型
class TestModel(torch.nn.Module):
    def forward(self, x):
        return x.cumsum(dim=1)

# 模型转换测试
model = TestModel()
example_input = torch.ones(100, 100)
traced_model = torch.jit.trace(model, example_input)

# 转换应成功完成
coreml_model = ct.convert(traced_model, inputs=[ct.TensorType(shape=example_input.shape)])