Keras项目中处理多输入模型的SavedModel兼容性问题

2025-04-30 08:26:11作者：郜逊炳

Keras 3 是一个深度学习框架，支持 JAX、TensorFlow 和 PyTorch 多后端。轻松构建和训练图像识别、自然语言处理、音频处理等模型。加速开发流程，利用易于调试的运行时环境。实现最先进的性能，某些情况下比其他框架快 20% 至 350%。兼容从笔记本到大规模 GPU 或 TPU 集群的训练。已有近三百万开发者，包括初创企业和全球企业，信赖并使用 Keras 3。通过 `pip install keras` 即可安装，选择所需后端，开始您的高效深度学习之旅！

项目地址：https://gitcode.com/gh_mirrors/ker/keras

在TensorFlow/Keras的版本迭代过程中，SavedModel格式的兼容性是一个常见的技术挑战。本文将深入分析Keras 2和Keras 3之间在多输入模型SavedModel格式兼容性上的差异，并提供解决方案。

问题背景

当开发者尝试在Keras 3环境中加载Keras 2保存的多输入模型时，会遇到调用失败的问题。具体表现为：

单输入模型可以正常加载和调用
多输入模型加载成功但调用失败
错误信息提示"too many positional arguments"或参数绑定失败

技术分析

SavedModel格式差异

Keras 2和Keras 3的SavedModel格式在模型签名处理上有显著不同：

Keras 2保存的模型使用位置参数绑定
Keras 3保存的模型使用关键字参数绑定
多输入模型在Keras 2中保存为位置参数列表
Keras 3的TFSMLayer默认期望关键字参数调用方式

错误根源

当Keras 3的TFSMLayer尝试调用Keras 2保存的多输入模型时，参数传递机制不匹配：

模型签名期望关键字参数
但调用时传递的是位置参数列表
参数绑定系统无法正确映射输入张量

解决方案

方案一：使用tf.saved_model.load

对于Keras 2保存的多输入模型，推荐直接使用TensorFlow的低级API：

import tensorflow as tf

# 加载模型
model = tf.saved_model.load('path/to/keras2_model')

# 调用模型
outputs = model.signatures['serving_default'](
    image_input=image_tensor,
    label_input=label_tensor
)

方案二：自定义TFSMLayer子类

如果需要保持Keras层的工作流，可以创建自定义层：

class CustomTFSMLayer(tf.keras.layers.Layer):
    def __init__(self, model_path, **kwargs):
        super().__init__(**kwargs)
        self.model = tf.saved_model.load(model_path)
        
    def call(self, inputs):
        # 将输入解包为关键字参数
        return self.model.signatures['serving_default'](
            image_input=inputs[0],
            label_input=inputs[1]
        )