AIMET项目中使用字典作为模型量化输入的实践指南

2025-07-02 04:37:12作者：秋阔奎Evelyn

引言

在模型量化领域，AIMET是一个功能强大的工具包，它提供了多种量化感知训练和后训练量化技术。在实际应用中，开发者经常会遇到模型输入形式多样化的问题，特别是当模型需要接受字典(dict)形式的输入时，如何正确处理这类输入成为了一个值得探讨的技术话题。

模型输入形式的限制与解决方案

AIMET在量化模拟器(QuantizationSimModel)的实例化阶段确实存在输入形式的限制——仅支持元组(tuple)和张量(tensor)作为输入。这一限制源于量化模拟器需要对模型进行图分析，而元组和张量形式更容易被解析和处理。

然而，在实际导出量化模型时，AIMET提供了更大的灵活性。开发者可以使用字典形式的输入作为dummy_input参数，这使得模型接口能够保持与原始模型一致的使用方式。

实际应用示例

让我们通过一个具体的代码示例来说明如何正确处理字典输入：

import torch
from aimet_torch.quantsim import QuantizationSimModel
from aimet_torch.nn.modules.custom import Add

# 定义一个简单的模型
class TinyModel(torch.nn.Module):
    def __init__(self):
        super(TinyModel, self).__init__()
        self.relu = torch.nn.ReLU()
        self.sigmoid = torch.nn.Sigmoid()
        self.add = Add()

    def forward(self, x1, x2):
        x1 = self.relu(x1)
        x2 = self.sigmoid(x2)
        return self.add(x1, x2)

# 实例化模型
model = TinyModel()

# 准备字典形式的输入
dict_input = {'x1': torch.randn(1, 3), 'x2': torch.randn(1, 3)}

# 准备元组形式的输入(用于量化模拟器实例化)
tuple_input = (dict_input['x1'], dict_input['x2'])

# 验证两种输入形式的等价性
print(model(**dict_input))
print(model(*tuple_input))

# 创建量化模拟器(必须使用元组输入)
qsim = QuantizationSimModel(model, tuple_input)

# 计算编码(可以使用字典输入)
qsim.compute_encodings(lambda m: m(**dict_input))

# 导出模型(可以使用字典输入)
qsim.export('./data', 'onnx_dict_export', dummy_input=dict_input)

关键点解析

量化模拟器实例化：在创建QuantizationSimModel时，必须使用元组或张量作为输入参数。这是因为量化模拟器需要分析模型的计算图，而元组形式更容易被解析。
编码计算阶段：在compute_encodings方法中，可以使用字典形式的输入。这时模型已经完成了初始化，可以接受原始模型支持的各种输入形式。
模型导出阶段：在导出量化模型时，dummy_input参数同样支持字典形式。这确保了导出的模型接口与原始模型保持一致。