【亲测免费】 Tencent ML-Images：全球最大的多标签图像数据库

2026-01-23 04:47:22作者：董宙帆

tencent-ml-images

Largest multi-label image database; ResNet-101 model; 80.73% top-1 acc on ImageNet

项目地址：https://gitcode.com/gh_mirrors/te/tencent-ml-images

项目介绍

Tencent ML-Images 是由腾讯开源的一个大型多标签图像数据库，包含了17,609,752张训练图像和88,739张验证图像，这些图像被标注了多达11,166个类别。此外，该项目还提供了一个在ML-Images上预训练的Resnet-101模型，该模型通过迁移学习在ImageNet上达到了80.73%的top-1准确率。

项目技术分析

数据来源

ML-Images的数据主要来源于ImageNet和Open Images。具体来说：

ImageNet部分：采用了10,706,941张训练图像和50,000张验证图像，涵盖了10,032个类别。
Open Images部分：采用了6,902,811张训练图像和38,739张验证图像，涵盖了1,134个类别。

最终，ML-Images包含了17,609,752张训练图像和88,739张验证图像，涵盖了11,166个类别。

数据下载

由于版权问题，项目不直接提供原始图像，但用户可以通过提供的图像ID和URL文件自行下载图像。具体步骤如下：

从ImageNet下载：使用train_image_id_from_imagenet.txt和val_image_id_from_imagenet.txt文件中的图像ID从ImageNet下载图像。
从Open Images下载：使用train_urls_from_openimages.txt和val_urls_from_openimages.txt文件中的URL下载图像。

语义层次结构

ML-Images的11,166个类别根据WordNet构建了语义层次结构，包含4棵独立的树，最长语义路径长度为16，平均长度为7.47。

项目及技术应用场景

图像分类

ML-Images数据库和预训练模型可以广泛应用于图像分类任务。通过在ML-Images上预训练的Resnet-101模型，用户可以在自己的图像分类任务中进行迁移学习，显著提高模型的准确率。

特征提取

预训练的Resnet-101模型还可以用于图像特征提取，为其他计算机视觉任务（如目标检测、图像分割等）提供高质量的特征表示。

多标签分类

ML-Images的多标签标注特性使其非常适合用于多标签分类任务的研究和应用。

项目特点

规模庞大

ML-Images是目前全球最大的多标签图像数据库，包含了超过1700万张训练图像和近9万张验证图像，涵盖了11,166个类别。

高质量标注

图像的标注基于ImageNet和Open Images的原始标注，并进行了进一步的筛选和优化，确保了标注的高质量。

预训练模型

项目提供了在ML-Images上预训练的Resnet-101模型，用户可以直接使用该模型进行迁移学习，节省了大量的训练时间和计算资源。

语义层次结构

ML-Images的类别根据WordNet构建了语义层次结构，有助于模型更好地理解图像的语义信息。

结语

Tencent ML-Images作为一个开源的大型多标签图像数据库，不仅提供了丰富的图像数据，还提供了高质量的预训练模型，极大地推动了图像分类和多标签分类领域的发展。无论你是研究人员还是开发者，Tencent ML-Images都将成为你不可或缺的工具。快来体验吧！

tencent-ml-images

Largest multi-label image database; ResNet-101 model; 80.73% top-1 acc on ImageNet

项目地址：https://gitcode.com/gh_mirrors/te/tencent-ml-images

登录后查看全文

项目优选

收起

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

Ascend Extension for PyTorch

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

AI 将任意文档转换为精美可编辑的 PPTX 演示文稿 — 无需设计基础 | 包含 15 个案例、229 页内容

Cangjie-Examples

本仓将收集和展示高质量的仓颉示例代码，欢迎大家投稿，让全世界看到您的妙趣设计，也让更多人通过您的编码理解和喜爱仓颉语言。