Keras-IO项目：使用Keras Hub进行图像分类的完整指南

2025-06-28 06:23:32作者：裴麒琰

图像分类是计算机视觉中最基础也最广泛应用的任务之一。本文将详细介绍如何利用Keras Hub中的预训练模型来实现高效的图像分类解决方案。

图像分类基础概念

图像分类是指让计算机自动识别图像中主要物体所属类别的任务。传统方法需要从零开始训练模型，而现代深度学习实践更倾向于使用预训练模型进行迁移学习，这可以显著减少训练时间和计算资源消耗。

Keras Hub简介

Keras Hub是一个模型库，提供了大量经过预训练的深度学习模型，涵盖计算机视觉、自然语言处理等多个领域。这些模型由专业团队训练优化，用户可以直接加载使用或进行微调。

准备工作

在开始之前，需要确保已安装必要的库：

TensorFlow 2.x
Keras
KerasCV（可选，提供额外计算机视觉功能）

加载预训练模型

Keras Hub提供了多种图像分类模型，如ResNet、EfficientNet等。以下示例展示如何加载一个EfficientNet模型：

import tensorflow as tf
from tensorflow import keras

model = keras.models.load_model(
    "https://tfhub.dev/google/imagenet/efficientnet_v2_imagenet1k_b0/classification/2"
)

数据预处理

正确的数据预处理对模型性能至关重要。Keras Hub模型通常有特定的输入要求：

def preprocess_image(image):
    image = tf.image.resize(image, (224, 224))  # 调整大小
    image = tf.cast(image, tf.float32) / 255.0  # 归一化
    return image

进行预测

加载并预处理图像后，可以轻松进行预测：

image = tf.io.read_file("image.jpg")
image = tf.image.decode_jpeg(image, channels=3)
image = preprocess_image(image)
predictions = model.predict(tf.expand_dims(image, axis=0))

解释结果

模型输出是各类别的概率分布。可以使用以下代码获取最高概率的类别：

top_k = 5
top_k_values, top_k_indices = tf.math.top_k(predictions, k=top_k)

迁移学习与微调

对于特定任务，可以对预训练模型进行微调：

base_model = keras.models.load_model(...)
base_model.trainable = True  # 解冻部分层进行微调

model = keras.Sequential([
    base_model,
    keras.layers.Dense(num_classes, activation='softmax')
])

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])