PVEL-AD光伏电池缺陷检测数据集使用指南

2026-02-06 04:49:30作者：廉皓灿Ida

Photovoltaic cell defect detection

项目地址：https://gitcode.com/gh_mirrors/pv/PVEL-AD

项目概述

PVEL-AD（Photovoltaic Electroluminescence Anomaly Detection）是一个用于光伏电池缺陷检测的大规模开放世界数据集，包含36,543张近红外图像，涵盖多种内部缺陷和异质背景。该数据集包含1类无异常图像和12类不同类别的异常图像，提供了40,358个标注边界框。

数据集特点

缺陷类别统计

缺陷类别	训练验证集数量	测试集数量
finger（栅线中断）	2,958	22,638
crack（裂纹）	1,260	2,797
black_core（黑心）	1,028	3,877
thick_line（粗线）	981	1,585
horizontal_dislocation（水平位移）	798	1,582
short_circuit（短路）	492	1,215
vertical_dislocation（垂直位移）	137	271
star_crack（星形裂纹）	135	83
printing_error（印刷错误）	32	48
corner（角部缺陷）	9	12
fragment（碎片）	7	5
scratch（划痕）	5	3

这是一个长尾目标检测任务，对智能制造具有重要意义。

数据集获取流程

下载申请表格：获取Industrial Datasets Request Form（必须手写签名并注明日期）
使用机构邮箱：不允许使用Gmail、QQmail等商业邮箱
发送申请：将签署的申请表发送至 subinyi@vip.qq.com
Google Drive下载：如需通过Google网盘下载，请同时提供Google邮箱

项目文件说明

核心脚本文件

AP50-5-95.py - 模型评估脚本

用于计算mAP（平均精度）
支持设置不同的IoU阈值（0.50-0.95）
生成精度-召回率曲线
可视化检测结果

get_gt_txt.py - 标注文件转换脚本

将XML格式的标注文件转换为TXT格式
为模型评估准备标准格式的标注数据

horizontal_flipping.py - 数据增强脚本

实现水平翻转数据增强
扩展训练数据集规模
提高模型泛化能力

文档文件

README.md - 项目说明文档包含数据集详细信息、使用说明、引用文献等

Industrial_Data_Access_Form.docx - 数据集申请表格需要填写并签署的正式申请文档

LICENSE - Apache-2.0开源协议

技术实现

数据预处理流程

数据增强：使用horizontal_flipping.py进行水平翻转增强
标注转换：使用get_gt_txt.py将XML标注转换为TXT格式
模型训练：基于增强后的数据集训练缺陷检测模型

评估流程

生成检测结果：模型在测试集上的检测结果保存为TXT格式
转换真实标注：使用get_gt_txt.py准备真实标注
计算评估指标：运行AP50-5-95.py计算mAP等指标

学术贡献

该项目已在多个IEEE顶级期刊发表：

IEEE Transactions on Industrial Informatics
IEEE Transactions on Instrumentation and Measurement
IEEE Transactions on Industrial Electronics

使用建议

数据平衡：由于是长尾分布，建议采用过采样或加权损失函数
模型选择：适合使用针对小目标优化的检测模型
评估标准：建议使用AP50-5-95作为主要评估指标
数据增强：充分利用提供的数据增强脚本提升模型性能

注意事项

测试集标注不公开，评估请访问Kaggle竞赛平台
数据集仅限研究用途，需遵守相关使用协议
申请时请使用机构邮箱，商业邮箱不被接受
数据集由河北工业大学和北京航空航天大学联合发布

通过本数据集，研究者可以开发先进的光伏电池缺陷检测算法，推动智能制造技术的发展。

Photovoltaic cell defect detection

项目地址：https://gitcode.com/gh_mirrors/pv/PVEL-AD

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

昇腾LLM分布式训练框架

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

ohos_react_native

React Native鸿蒙化仓库