风力发电机叶片表面缺陷识别检测数据集yolo数据集 共7000张

devtools/2024/9/25 8:08:01/

风力发电机叶片表面缺陷识别检测数据集yolo数据集 共7000张

风力发电机叶片表面缺陷识别数据集(Wind Turbine Blade Defects Recognition Dataset, WTBDRD)

摘要

WTBDRD 是一个专门为风力发电机叶片表面缺陷识别而设计的数据集,旨在为相关领域的研究人员提供一个标准化的训练和评估平台。该数据集包含了7000张高分辨率的叶片图像,这些图像来自多个不同型号的风力发电机叶片。每张图像都被详细地标注了叶片表面的各种缺陷类型和位置,包括腐蚀、裂纹、隐藏裂纹、表面附着物、表面腐蚀、表面损伤、表面油污以及雷击痕迹等。数据集的设计目标是帮助研究人员更好地理解叶片表面缺陷的特征和规律,从而提高叶片维护和管理的效率。

数据集特点

  • 全面的叶片缺陷分类数据集涵盖了常见的叶片表面缺陷类型,包括腐蚀、裂纹、隐藏裂纹、表面附着物、表面腐蚀、表面损伤、表面油污以及雷击痕迹等。
  • 高质量的叶片图像:所有的图像都是由专业的工业相机拍摄,具有高分辨率和清晰度,能够准确反映叶片的真实状态。
  • 详细的标注信息:每张图像都经过专业人员的仔细标注,包括缺陷的位置、形状、大小等关键信息。
  • 丰富的叶片型号数据集中的叶片来自多种型号的风力发电机,可以满足不同研究需求。
  • 易于使用数据集已经按照YOLO格式整理,可以直接用于训练和评估YOLO系列的目标检测模型。
  • 广泛的应用场景:适用于风电行业叶片维护与管理、故障预测等领域。
数据集构成

  • 图像数量:总共有7000张叶片图像。
  • 类别数:8类
  • 类别名称及对应数量
    • corrosion: 腐蚀 (1058张)
    • craze: 裂纹 (36张)
    • hide_craze: 隐藏裂纹 (1172张)
    • surface_attach: 表面附着物 (1410张)
    • surface_corrosion: 表面腐蚀 (6714张)
    • surface_eye: 表面损伤 (206张)
    • surface_injure: 表面油污 (3182张)
    • thunderstrike: 雷击痕迹 (240张)
示例代码

以下是一个简单的Python脚本示例,用于加载数据集中的一对图像-标签对,并可视化其中的标注信息:

 

python

深色版本

import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle# 数据集目录路径
data_dir = 'path/to/wtbdrd_dataset'
train_image_dir = os.path.join(data_dir, 'images/train')
train_label_dir = os.path.join(data_data, 'labels/train')# 选取一张训练图像及其对应标签
image_files = os.listdir(train_image_dir)
image_file = image_files[0]  # 假设取第一张图
label_file = os.path.splitext(image_file)[0] + '.txt'image_path = os.path.join(train_image_dir, image_file)
label_path = os.path.join(train_label_dir, label_file)# 加载图像
image = cv2.imread(image_path, cv2.IMREAD_COLOR)
height, width, _ = image.shape# 解析YOLO格式标签
def parse_yolo_label(label_path, image_width, image_height):bboxes = []with open(label_path, 'r') as f:lines = f.readlines()for line in lines:class_id, x_center, y_center, box_width, box_height = map(float, line.strip().split())x_min = int((x_center - box_width / 2) * image_width)y_min = int((y_center - box_height / 2) * image_height)box_width = int(box_width * image_width)box_height = int(box_height * image_height)bboxes.append((class_id, x_min, y_min, box_width, box_height))return bboxes# 解析标签
bboxes = parse_yolo_label(label_path, width, height)# 可视化标注
fig, ax = plt.subplots(figsize=(10, 10))
ax.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
colors = ['red', 'blue', 'green', 'orange', 'purple', 'yellow', 'pink', 'brown', 'gray']
names = ['corrosion', 'craze', 'hide_craze', 'surface_attach', 'surface_corrosion', 'surface_eye', 'surface_injure', 'thunderstrike']
for bbox, color_name in zip(bboxes, colors):class_id, x, y, w, h = bboxrect = Rectangle((x, y), w, h, linewidth=2, edgecolor=color_name, facecolor='none')ax.add_patch(rect)ax.text(x, y - 10, names[int(class_id)], color=color_name, fontsize=8)plt.title('Wind Turbine Blade Defects Recognition Dataset')
plt.axis('off')
plt.show()
数据集使用指南
  1. 数据准备

    • 确认数据集路径是否正确,并且图像和标签文件均存在指定的目录下。
    • 检查数据集是否有损坏或缺失的文件,确保所有图像和对应的标注文件都是完整的。
  2. 数据集划分

    • 数据集已经划分为训练集、验证集和测试集,可以直接使用。
  3. 配置文件

    • 根据所使用的深度学习框架创建相应的配置文件。对于YOLOv5等模型,通常需要一个data.yaml文件来描述数据集路径和类别信息。

    • data.yaml示例内容如下:

       yaml 

      深色版本

      train: path/to/wtbdrd_dataset/images/train
      val: path/to/wtbdrd_dataset/images/validation
      test: path/to/wtbdrd_dataset/images/testnc: 8
      names: ['corrosion', 'craze', 'hide_craze', 'surface_attach', 'surface_corrosion', 'surface_eye', 'surface_injure', 'thunderstrike']
  4. 模型训练

    • 选择适合任务的深度学习框架(如YOLOv5, YOLOv7, Detectron2等)。
    • 配置训练参数,包括学习率、批次大小、迭代次数等。
    • 使用提供的数据集开始训练模型。确保在训练过程中监控模型的

 


http://www.ppmy.cn/devtools/116868.html

相关文章

智慧照明,安全度夏:揭秘如何前置防御暴雨中的路灯杆漏电隐患

随着夏季暴雨频发,多地近期发生的多起路人因路灯杆漏电触电身亡的悲剧,再次为公众安全敲响了警钟。从河南郑州到辽宁营口,一起起触目惊心的触电事故,不仅夺走了宝贵的生命,也引发了社会各界对暴雨天气下公共设施安全隐…

微服务架构---Ribbon\Feign

Ribbon(负载均衡) Ribbon概述 在 SpringCloud 中, Nacos⼀般配合Ribbon进行使用,Ribbon提供了客户端负载均衡的功能,Ribbon利用从Nacos中读取到的服务信息,在调用服务节点提供的服务时,会合理的进行负载。 Ribbon作…

耐人寻味:UTF-8的优缺点

Unicode的编码方式有三种:UTF-8、UTF-16、UTF-32,为什么只有UTF-8成为最耀眼的明星了呢? 首先说这三种编码的区别,8、16、32可看作每种编码存储字符所需的最少的位数。光从占用存储空间这一指标看,UTF-16、UTF-32就注…

shell脚本定时任务通知到钉钉

shell脚本定时任务通知到钉钉 1、背景 ​ 前两天看了一下定时任务,垃圾清理、日志相关、系统巡检这些,有的服务器运行就有问题,或者不运行,正好最近在做运维标准重制运维手册,顺便把自动化这块优化一下,所…

【系统架构设计师】专题:中间件技术

更多内容请见: 备考系统架构设计师-核心总结目录 文章目录 一、中间件概述二、中间件特点三、中间件的分类四、中间件产品介绍一、中间件概述 中间件(middleware) 是基础软件的一大类,属于可复用软件的范畴。顾名思义,中间件处在操作系统、网络和数据库之上,应用软件的下层…

每日论文3——一种用于锁相环的超低电流失配和变化电荷泵

《A Novel Charge Pump with Ultra-Low Current Mismatch and Variation for PLL》 2020 IEEE International Symposium on Circuits and Systems (ISCAS) State Key Laboratory of ASIC & System, Fudan University 本文的结构在解决失配问题的基础上,控制电…

vulnhub(11):derpnstink(hydra爆破用户名和密码、验证的文件上传)

端口 nmap主机发现 nmap -sn 192.168.159.120/24 ​ Nmap scan report for 192.168.159.120 Host is up (0.00020s latency). ​ 120是新出现的机器,他就是靶机 nmap端口扫描 nmap -Pn 192.168.159.120 -p- --min-rate 10000 -oA nmap/scan 扫描开放端口保存到 nma…

unix中如何查询和修改进程的资源限制

一、前言 一个进程在运行时,会用到各种资源,比如cpu的使用时间、内存空间、文件等等。那么,一个进程能够占用多少资源呢?cpu使用的时间有多长?进程空间有多大?能够创建多少个文件?这个就是本文…