【亲测免费】 Cinic-10 开源项目教程

2026-01-18 09:28:24作者：农烁颖Land

项目地址：https://gitcode.com/gh_mirrors/ci/cinic-10

项目介绍

Cinic-10 是一个开源的图像分类数据集，旨在提供一个比 CIFAR-10 数据集更大、更多样化的替代品。Cinic-10 数据集结合了 ImageNet 和 CIFAR-10 的数据，包含 9 个类别的 270,000 张图像。这个数据集特别适用于需要大规模数据进行训练的深度学习模型，同时也适用于需要多样化数据集的研究。

项目快速启动

安装依赖

首先，确保你已经安装了必要的 Python 库：

pip install numpy pandas tensorflow

下载数据集

你可以通过以下命令从 GitHub 仓库下载 Cinic-10 数据集：

git clone https://github.com/BayesWatch/cinic-10.git
cd cinic-10

加载和预处理数据

以下是一个简单的 Python 脚本，用于加载和预处理 Cinic-10 数据集：

import numpy as np
import tensorflow as tf
from tensorflow.keras.preprocessing import image_dataset_from_directory

# 设置数据集路径
data_dir = './CINIC-10'

# 加载数据集
train_dataset = image_dataset_from_directory(data_dir + '/train', image_size=(32, 32), batch_size=32)
validation_dataset = image_dataset_from_directory(data_dir + '/valid', image_size=(32, 32), batch_size=32)
test_dataset = image_dataset_from_directory(data_dir + '/test', image_size=(32, 32), batch_size=32)

# 数据增强
data_augmentation = tf.keras.Sequential([
  tf.keras.layers.experimental.preprocessing.RandomFlip('horizontal'),
  tf.keras.layers.experimental.preprocessing.RandomRotation(0.1),
])

# 构建模型
model = tf.keras.Sequential([
  data_augmentation,
  tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
  tf.keras.layers.MaxPooling2D((2, 2)),
  tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
  tf.keras.layers.MaxPooling2D((2, 2)),
  tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
  tf.keras.layers.Flatten(),
  tf.keras.layers.Dense(64, activation='relu'),
  tf.keras.layers.Dense(10)
])

# 编译模型
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# 训练模型
model.fit(train_dataset, validation_data=validation_dataset, epochs=10)