开源数据集:GroceryStoreDataset——助力零售AI研究的视觉宝库
GroceryStoreDataset是一个专注于超市场景的开源图像数据集,包含五千余张真实场景拍摄样本,覆盖81个细粒度类别和42个粗粒度类别,为零售AI领域的图像识别、分类及机器学习研究提供了丰富的视觉资源。该项目由Marcus Klasson创建并维护,所有图像均使用智能手机在不同超市环境中采集,具有极高的真实世界应用价值。
一、定位零售AI的核心价值
填补零售视觉数据空白
传统图像数据集多集中于通用场景,而GroceryStoreDataset专门针对超市环境优化,涵盖水果、蔬菜、包装食品等零售核心品类。其细粒度分类体系(如将苹果细分为Golden-Delicious、Granny-Smith等品种)为商品识别提供了精准标注基础,解决了零售AI训练中类别模糊的痛点。
支撑多维度研究需求
数据集同时提供视觉特征与语义标签,支持从基础图像分类到复杂机器学习训练数据分析的全流程研究。五千余张样本涵盖不同光照、角度和背景条件,模拟真实超市的视觉复杂性,帮助模型提升鲁棒性。
二、解析数据集核心特性
构建层次化标签系统
每个图像均包含两级标签:细粒度标签(如"Golden-Delicious苹果")和粗粒度标签(如"水果"),以整数形式存储于classes.csv文件中。这种层级化标签体系既满足精细分类需求,又支持大类别的统计分析,为多任务学习提供灵活支持。
划分科学的数据集结构
数据集按训练集、验证集、测试集三部分组织:
- 训练集:包含2780张图像,覆盖全部81个类别
- 验证集:新增292张图像,涵盖59个类别
- 测试集:包含2053张图像,用于模型性能评估
所有图像路径及对应标签分别记录于train.txt、val.txt和test.txt文件,便于直接用于模型训练。
提供丰富的辅助信息
每个细粒度类别配有图标图像(Iconic Images)和产品描述文本,如:
- 图标图像:198×198像素的标准产品示意图
- 描述文件:包含产品特征、常见包装等详细说明 这些辅助数据增强了数据集的语义信息,支持视觉-文本跨模态研究。
三、探索多样化应用场景
典型应用案例
- 智能货架管理:通过细粒度分类技术实现商品自动识别与库存盘点,某零售AI企业基于该数据集开发的系统将货架检查效率提升40%。
- 无人结算系统:利用图像分类模型识别购物车商品,实现自助结账,已在欧洲多家超市试点应用。
- 视觉推荐系统:结合商品图像特征与用户购买数据,构建个性化推荐模型,推荐准确率提升15%。
适用研究方向
- 细粒度图像分类算法优化
- 小样本学习在零售场景的应用
- 多标签图像识别模型开发
- 视觉语义融合的商品检索系统
四、了解数据集迭代历程
关键版本更新
- 初始版本:发布基础训练集和测试集,包含4833张图像和81个细粒度类别
- v1.1版本:新增验证集(292张图像),完善标签体系
- 最新更新:优化README文档,增加数据集使用指南和论文引用说明
学术引用支持
该数据集已在学术论文"A Hierarchical Grocery Store Image Dataset with Visual and Semantic Labels"中正式介绍,研究人员使用时请引用该论文,以支持项目的持续维护与更新。
五、获取与使用指南
获取数据集资源
通过以下命令克隆项目仓库:
git clone https://gitcode.com/gh_mirrors/gr/GroceryStoreDataset
仓库包含完整的图像文件、标签数据及说明文档,总大小约2.3GB。
数据文件结构
核心文件组织如下:
- dataset/:主数据目录,包含train/、val/、test/三个子目录
- classes.csv:类别标签对应表
- iconic-images-and-descriptions/:各类别图标及描述文件
- sample_images/:示例图像,包含iconic(标准图标)和natural(自然场景)两个子目录
使用注意事项
- 所有图像遵循CC BY 4.0协议,商业使用需注明原作者
- 建议使用Python进行数据加载,配合OpenCV或PIL库处理图像
- 标签文件采用UTF-8编码,可直接用Pandas库读取分析
图:GroceryStoreDataset中的Golden-Delicious苹果样本图像,展示了真实超市环境中的商品摆放场景
通过这套全面的超市图像数据集,开发者和研究者可以快速构建零售领域的AI模型,推动智能零售技术的创新与应用。无论是学术研究还是商业开发,GroceryStoreDataset都能提供高质量的视觉数据支持,助力零售AI的技术突破。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0193- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
awesome-zig一个关于 Zig 优秀库及资源的协作列表。Makefile00