Keras多输出模型自定义损失函数问题解析

2025-04-30 23:45:10作者：宗隆裙

Keras 3 是一个深度学习框架，支持 JAX、TensorFlow 和 PyTorch 多后端。轻松构建和训练图像识别、自然语言处理、音频处理等模型。加速开发流程，利用易于调试的运行时环境。实现最先进的性能，某些情况下比其他框架快 20% 至 350%。兼容从笔记本到大规模 GPU 或 TPU 集群的训练。已有近三百万开发者，包括初创企业和全球企业，信赖并使用 Keras 3。通过 `pip install keras` 即可安装，选择所需后端，开始您的高效深度学习之旅！

项目地址：https://gitcode.com/gh_mirrors/ker/keras

在使用Keras构建多输出模型时，开发者可能会遇到一个常见问题：当模型有多个输出时，自定义损失函数只能接收到第一个输出，而无法获取其他输出。本文将深入分析这一问题的原因，并提供解决方案。

问题现象

假设我们构建了一个目标检测模型，包含两个输出：

边界框回归输出（4个值）
分类输出（6个类别）

模型结构定义如下：

bbox = layers.Dense(4, name="bbox")(features)
classification_output = layers.Dense(num_classes, name="classification", activation="softmax")(features)
model = keras.Model(inputs=inputs, outputs=[bbox, classification_output])

当使用内置损失函数时，通过字典方式指定每个输出的损失函数，可以正常工作：

model.compile(
    optimizer='adam',
    loss={
        "bbox": "mse",
        "classification": "sparse_categorical_crossentropy"
    },
    loss_weights={
        "bbox": 1.0,
        "classification": 1.5
    }
)

但当尝试使用自定义损失函数时：

def custom_loss(y_true, y_pred):
    bbox_true = y_true[0]  # 期望获取边界框真值
    class_true = y_true[1]  # 期望获取分类真值
    bbox_pred = y_pred[0]  # 期望获取边界框预测
    class_pred = y_pred[1]  # 期望获取分类预测
    # 计算损失...

发现y_pred只包含边界框输出（形状为(32,4)），而分类输出缺失。

问题原因

这个问题的根源在于Keras对自定义损失函数的处理方式。当使用内置损失函数时，Keras会自动处理多输出情况，将每个输出与其对应的损失函数匹配。但使用自定义损失函数时，Keras默认将整个模型的输出视为单一输出传递给损失函数。

解决方案

方法一：使用子类化损失函数

更可靠的方式是继承keras.losses.Loss基类创建自定义损失函数：

class CustomLoss(keras.losses.Loss):
    def __init__(self, **kwargs):
        super().__init__(**kwargs)
    
    def call(self, y_true, y_pred):
        # 这里y_true和y_pred将是完整的输出
        bbox_true, class_true = y_true["bbox"], y_true["classification"]
        bbox_pred, class_pred = y_pred["bbox"], y_pred["classification"]
        # 计算损失...
        return total_loss

方法二：确保正确解包

如果坚持使用函数式自定义损失，需要确保正确解包：

def custom_loss(y_true, y_pred):
    # 假设y_true和y_pred是列表或字典
    if isinstance(y_pred, (list, tuple)):
        bbox_pred, class_pred = y_pred[0], y_pred[1]
    elif isinstance(y_pred, dict):
        bbox_pred, class_pred = y_pred["bbox"], y_pred["classification"]
    # 同理处理y_true
    # 计算损失...