Keras中Sequential模型与Functional API的输入输出差异解析

2025-05-01 12:50:28作者：秋泉律Samson

在使用Keras构建深度学习模型时，开发者经常会遇到关于模型输入输出的困惑。本文将通过一个典型错误案例，深入分析Keras中Sequential模型与Functional API在处理模型输入输出时的关键区别。

问题现象

当开发者尝试从Sequential模型中获取输入输出层来构建新的Model对象时，可能会遇到类似以下的错误：

ValueError: The layer sequential_6 has never been called and thus has no defined input.

这个错误通常发生在尝试执行类似keras.Model(inputs=model.input, outputs=model.output)这样的代码时，其中model是一个Sequential模型。

根本原因分析

这个问题的根源在于Keras中两种不同的模型构建方式：

Sequential API：按顺序逐层堆叠的线性模型结构
Functional API：支持复杂拓扑结构的多输入多输出模型

Sequential模型在设计上是一个简单的层堆叠容器，它不会显式地跟踪输入和输出张量。只有在模型被实际调用（即输入数据流过模型）后，Keras才能确定输入形状。而Functional API则明确要求定义输入层，因此天然支持通过.input和.output属性访问模型的输入输出。

解决方案

针对这个问题，有两种可行的解决方案：

方案一：改用Functional API构建模型

对于需要访问输入输出层的场景，建议直接使用Functional API构建模型：

def build_cae_model(input_shape=(28, 28, 1), filters=[32, 64, 128, 10]):
    input_layer = keras.layers.Input(shape=input_shape)
    # 定义编码器部分
    x = keras.layers.Conv2D(filters[0], 5, strides=2, padding='same', activation='relu')(input_layer)
    x = keras.layers.Conv2D(filters[1], 5, strides=2, padding='same', activation='relu')(x)
    # 定义解码器部分
    x = keras.layers.Conv2DTranspose(filters[0], 5, strides=2, padding='same', activation='relu')(x)
    output_layer = keras.layers.Conv2DTranspose(input_shape[2], 5, strides=2, padding='same')(x)
    # 创建模型
    model = keras.Model(inputs=input_layer, outputs=output_layer)
    return model

方案二：先调用Sequential模型确定输入形状

如果必须使用Sequential模型，可以先通过构建模型时指定输入形状，或者通过实际数据流过模型来确立输入：

# 构建时指定输入形状
model = keras.Sequential()
model.add(keras.layers.InputLayer(input_shape=(28, 28, 1)))
# 添加其他层...

# 或者通过实际数据流过模型
dummy_input = np.random.random((1, 28, 28, 1))
_ = model.predict(dummy_input)  # 确立输入形状