Fashion-MNIST 数据集使用教程

2026-01-16 10:06:43作者：余洋婵Anita

Fashion-MNIST 是一个用于机器学习算法基准测试的图像数据集，由 Zalando 研究中心提供。它作为原始 MNIST 数据集的手写数字识别的替代品，包含10个类别共70,000张28x28像素的灰度图像。

1. 项目目录结构及介绍

在克隆 https://github.com/zalandoresearch/fashion-mnist.git 之后，你将得到以下基本目录结构：

fashion-mnist/
│
├── dataset/    # 存放原始数据的目录
│   ├── train.csv  # 训练集标签
│   ├── test.csv   # 测试集标签
│   └── ...       # 其他可能的数据子目录
│
└── examples/    # 包含示例代码的目录
│   ├── python/     # Python 示例代码
│   ├── tensorflow/  # TensorFlow 示例代码
│   └── ...           # 可能包含其他库的示例
│
└── CONTRIBUTING.md
└── LICENSE
└── README.md
└── ...              # 其他项目文档和文件

dataset/: 包含训练和测试数据的CSV文件。
examples/: 提供了不同编程语言的使用示例，如Python和TensorFlow。

2. 项目启动文件介绍

Fashion-MNIST 是一个数据集，而不是一个带有启动文件的应用程序。但是，在 examples/ 目录下，你可以找到各种编程环境中的示例脚本，这些脚本展示了如何加载和处理数据。例如，在 python/ 子目录中，你可能会看到一个名为 load_data.py 的脚本，该脚本演示了如何在Python环境中读取并预处理Fashion-MNIST数据。

# load_data.py 示例（简化版）
import pandas as pd
from sklearn.model_selection import train_test_split

def load_fashion_mnist():
    # 加载训练集和测试集标签
    train_labels = pd.read_csv('path/to/dataset/train.csv', header=None)
    test_labels = pd.read_csv('path/to/dataset/test.csv', header=None)

    # 将标签转换为整数数组
    train_labels = train_labels.to_numpy().flatten()
    test_labels = test_labels.to_numpy().flatten()

    return train_labels, test_labels

train_labels, test_labels = load_fashion_mnist()

你可以运行这个脚本来加载数据，并根据需要修改以适应你的机器学习模型。

3. 项目的配置文件介绍

Fashion-MNIST 项目本身并不包含特定的配置文件，因为它只是一个数据集，而不是一个完整的应用程序。然而，当你在自己的项目中使用此数据集时，你可能需要创建自己的配置文件来存储像数据路径、批次大小或学习率这样的参数。

例如，你可以创建一个名为 config.py 的文件，其中包含以下内容：

# config.py 示例
class Config:
    DATA_PATH = 'path/to/dataset'
    BATCH_SIZE = 128
    LEARNING_RATE = 0.001
    ...

config = Config()  # 创建配置对象

然后，在你的代码中导入并使用这些配置参数：

# 在其他脚本中使用配置
from config import config

train_dataset = load_fashion_mnist(config.DATA_PATH, batch_size=config.BATCH_SIZE)

通过这种方式，你可以灵活地管理与数据集相关的设置，并且容易地在不同的项目环境中复用它们。

请注意，上述配置文件并不是Fashion-MNIST项目的一部分，而是基于它构建应用时的一个例子。你需要根据实际需求自行创建和调整配置。

fashion-mnist

A MNIST-like fashion product database. Benchmark :point_down:

项目地址：https://gitcode.com/gh_mirrors/fa/fashion-mnist

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

457

439

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。