【免费下载】 CelebA-HQ数据集:高质量人脸图像的宝库
2026-01-21 04:12:16作者:胡易黎Nicole
项目介绍
CelebA-HQ数据集是一个专为计算机视觉研究设计的高质量人脸图像数据集,包含30,000张分辨率为1024x1024的图像。作为CelebA数据集的升级版,CelebA-HQ不仅提供了更高分辨率的图像,还保留了原始数据集的详细标注信息,使其成为人脸识别、图像生成和计算机视觉等领域研究的理想选择。
项目技术分析
数据集特点
- 分辨率多样:CelebA-HQ数据集提供了多种分辨率的图像,包括64x64、128x128、256x256、512x512和1024x1024,满足不同应用场景的需求。
- 高质量图像:所有图像均为高分辨率,确保了训练模型的精度。
- 详细标注:每张图像都附带了人脸关键点和属性信息,便于进行多任务学习和数据分析。
数据集生成流程
- 下载合并解压img_celeba.7z:通过合并14个压缩包分卷,得到202,599张原图。
- 下载list_landmarks_celeba.txt:获取人脸关键点信息。
- 获取h5tool.py:从GitHub仓库中获取脚本,用于生成数据集。
- 创建目录结构:构建celeba-hq目录及其子目录。
- 下载.dat数据:获取nVidia官方提供的.dat数据。
- 配置环境:创建Python 2.7虚拟环境,并安装必要的依赖包。
- 生成数据集:运行h5tool.py脚本,生成不同分辨率的图像数据集。
项目及技术应用场景
CelebA-HQ数据集适用于多种计算机视觉应用场景,包括但不限于:
- 人脸识别:高分辨率图像有助于提升人脸识别模型的准确性。
- 图像生成:用于训练生成对抗网络(GAN)等模型,生成逼真的人脸图像。
- 计算机视觉研究:提供丰富的标注信息,支持多任务学习和数据分析。
项目特点
- 高质量数据:所有图像均为高分辨率,确保了训练模型的精度。
- 多样分辨率:提供多种分辨率的图像,满足不同应用场景的需求。
- 详细标注:附带人脸关键点和属性信息,便于多任务学习。
- 易于生成:通过简单的步骤和脚本,即可生成所需的数据集。
结语
CelebA-HQ数据集是一个高质量的人脸图像数据集,适用于多种计算机视觉应用场景。无论你是研究人员还是开发者,CelebA-HQ都能为你提供丰富的数据资源,助力你的项目取得成功。欢迎访问GitHub仓库,获取更多信息并开始使用这一强大的数据集!
联系我们:如有任何问题或建议,欢迎通过GitHub Issues联系我们。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0191
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0118
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
fun-rec推荐系统入门教程,在线阅读地址:https://datawhalechina.github.io/fun-rec/Python03
so-large-lm大模型基础: 一文了解大模型基础知识01
项目优选
收起
暂无描述
Dockerfile
765
4.97 K
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
857
1.93 K
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
680
1.33 K
Ascend Extension for PyTorch
Python
719
879
deepin linux kernel
C
32
16
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
456
438
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1.08 K
1.1 K
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
151
252
CANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。
Jupyter Notebook
303
118
昇腾LLM分布式训练框架
Python
178
220