首页
/ PVEL-AD光伏电池缺陷检测数据集使用指南

PVEL-AD光伏电池缺陷检测数据集使用指南

2026-02-06 04:49:30作者:廉皓灿Ida

项目概述

PVEL-AD(Photovoltaic Electroluminescence Anomaly Detection)是一个用于光伏电池缺陷检测的大规模开放世界数据集,包含36,543张近红外图像,涵盖多种内部缺陷和异质背景。该数据集包含1类无异常图像和12类不同类别的异常图像,提供了40,358个标注边界框。

数据集特点

缺陷类别统计

缺陷类别 训练验证集数量 测试集数量
finger(栅线中断) 2,958 22,638
crack(裂纹) 1,260 2,797
black_core(黑心) 1,028 3,877
thick_line(粗线) 981 1,585
horizontal_dislocation(水平位移) 798 1,582
short_circuit(短路) 492 1,215
vertical_dislocation(垂直位移) 137 271
star_crack(星形裂纹) 135 83
printing_error(印刷错误) 32 48
corner(角部缺陷) 9 12
fragment(碎片) 7 5
scratch(划痕) 5 3

这是一个长尾目标检测任务,对智能制造具有重要意义。

数据集获取流程

  1. 下载申请表格:获取Industrial Datasets Request Form(必须手写签名并注明日期)
  2. 使用机构邮箱:不允许使用Gmail、QQmail等商业邮箱
  3. 发送申请:将签署的申请表发送至 subinyi@vip.qq.com
  4. Google Drive下载:如需通过Google网盘下载,请同时提供Google邮箱

项目文件说明

核心脚本文件

AP50-5-95.py - 模型评估脚本

  • 用于计算mAP(平均精度)
  • 支持设置不同的IoU阈值(0.50-0.95)
  • 生成精度-召回率曲线
  • 可视化检测结果

get_gt_txt.py - 标注文件转换脚本

  • 将XML格式的标注文件转换为TXT格式
  • 为模型评估准备标准格式的标注数据

horizontal_flipping.py - 数据增强脚本

  • 实现水平翻转数据增强
  • 扩展训练数据集规模
  • 提高模型泛化能力

文档文件

README.md - 项目说明文档 包含数据集详细信息、使用说明、引用文献等

Industrial_Data_Access_Form.docx - 数据集申请表格 需要填写并签署的正式申请文档

LICENSE - Apache-2.0开源协议

技术实现

数据预处理流程

  1. 数据增强:使用horizontal_flipping.py进行水平翻转增强
  2. 标注转换:使用get_gt_txt.py将XML标注转换为TXT格式
  3. 模型训练:基于增强后的数据集训练缺陷检测模型

评估流程

  1. 生成检测结果:模型在测试集上的检测结果保存为TXT格式
  2. 转换真实标注:使用get_gt_txt.py准备真实标注
  3. 计算评估指标:运行AP50-5-95.py计算mAP等指标

学术贡献

该项目已在多个IEEE顶级期刊发表:

  • IEEE Transactions on Industrial Informatics
  • IEEE Transactions on Instrumentation and Measurement
  • IEEE Transactions on Industrial Electronics

使用建议

  1. 数据平衡:由于是长尾分布,建议采用过采样或加权损失函数
  2. 模型选择:适合使用针对小目标优化的检测模型
  3. 评估标准:建议使用AP50-5-95作为主要评估指标
  4. 数据增强:充分利用提供的数据增强脚本提升模型性能

EL图像示例

注意事项

  • 测试集标注不公开,评估请访问Kaggle竞赛平台
  • 数据集仅限研究用途,需遵守相关使用协议
  • 申请时请使用机构邮箱,商业邮箱不被接受
  • 数据集由河北工业大学和北京航空航天大学联合发布

通过本数据集,研究者可以开发先进的光伏电池缺陷检测算法,推动智能制造技术的发展。

登录后查看全文
热门项目推荐
相关项目推荐