基于YOLOv8的缺陷检测任务模型训练

devtools/2024/9/26 1:23:09/

在这里插入图片描述

文章目录

  • 一、引言
  • 二、环境说明
  • 三、缺陷检测任务模型训练详解
    • 3.1 PCB数据集
      • 3.1.1 数据集简介
      • 3.1.2 数据集下载
      • 3.1.3 构建yolo格式的数据集
    • 3.2 基于ultralytics训练YOLOv8
      • 3.2.1 安装依赖包
      • 3.2.2 ultralytics的训练规范说明
      • 3.2.3 创建训练配置文件
      • 3.2.4 下载预训练模型
      • 3.2.5 训练模型
      • 3.2.6 训练结果
  • 四、基于YOLO8的PCB缺陷检测系统

一、引言

  • 在当今快速发展的工业生产领域,自动化和智能化已成为提高生产效率和产品质量的关键因素。缺陷检测作为智能制造的重要组成部分,对于确保产品质量和降低生产成本具有重要意义。
  • 随着计算机视觉技术的不断进步,基于深度学习的对象检测算法,尤其是YOLO(You Only Look Once)系列算法,因其速度快、精度高而在工业缺陷检测中得到了广泛应用。YOLOv8作为该系列的最新版本之一,以其更高效的网络结构和更准确的检测性能,为缺陷检测任务带来了新的突破。
  • 本文将深入探讨基于YOLOv8的缺陷检测任务训练过程,从数据准备、模型训练到性能评估,全面解析如何利用这一先进技术提升工业缺陷检测的自动化水平。通过实际案例分析,本文旨在为相关领域的研究者和工程师提供实用的技术参考和指导。

注意:学习本文的训练过程需要相关的前置知识,如有需要可参考文章:Python基础(千锋篇)专栏介绍、 Jupyter Notebook、PyTorch

二、环境说明

  1. 本文介绍的训练过程,使用ModelScope提供的Notebook的线上环境。分为CPU环境/GPU环境,均可使用。

ModelScope–我的Notebook

在这里插入图片描述
2. 本文的YOLOv8的训练过程,使用了ultralytics的训练技术方案。相关文档可参考:https://docs.ultralytics.com/modes/train/

三、缺陷检测任务模型训练详解

完整代码资源:https://download.csdn.net/download/weixin_44063529/89645813

3.1 PCB数据集

3.1.1 数据集简介

PCB缺陷检测数据集:印刷电路板(PCB)瑕疵数据集由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。我们选取了其中适用与检测任务的693张图像,下载内容包括JSON和VOC格式版。

3.1.2 数据集下载

!git lfs install
!git clone https://www.modelscope.cn/datasets/ModelBulider/PCB_DATASET_JSON.git!tar -xvf ./PCB_DATASET_JSON/PCB_DATASET_JSON.tar

3.1.3 构建yolo格式的数据集

  1. 创建训练集与测试集的标签文件
import json
import osdef refactor_data_format(json_path, yolo_paths):with open(json_path) as f:data = json.load(f)imgs = {}for img in data['images']:imgs[img['id']] = {'h': img['height'],'w': img['width'],'file_name': img['file_name'],}tmp = ''for anno in data['annotations']:print(imgs[anno['image_id']]['file_name'])txt_path = os.path.join(yolo_paths, imgs[anno['image_id']]['file_name'].split('.')[0] + '.txt')with open(txt_path, 'w') as txt_file:if imgs[anno['image_id']] != tmp:# xywh --> xywh(归一化)bbox = [anno['bbox'][0] / imgs[anno['image_id']]['w'],anno['bbox'][1] / imgs[anno['image_id']]['h'],anno['bbox'][2] / imgs[anno['image_id']]['w'],anno['bbox'][3] / imgs[anno['image_id']]['h']]cls_id = anno['category_id'] - 1# 保存txt_file.write(str(cls_id) + ' ' +" ".join([str(a) for a in bbox])+"\n")  # 生成格式0 cx,cy,w,htmp = imgs[anno['image_id']]else:# xywh --> xywh(归一化)bbox = [anno['bbox'][0] / imgs[anno['image_id']]['w'],anno['bbox'][1] / imgs[anno['image_id']]['h'],anno['bbox'][2] / imgs[anno['image_id']]['w'],anno['bbox'][3] / imgs[anno['image_id']]['h']]cls_id = anno['category_id'] - 1# 保存txt_file.write(str(cls_id) + ' ' +" ".join([str(a) for a in bbox])+"\n")  # 生成格式0 cx,cy,w,h    # 生成训练与测试的label文件(.txt)
train_json_path = "./PCB_DATASET/Annotations/train.json"
train_yolo_paths = "./datasets/PCB_DATASET/labels/train2024"val_json_path = "./PCB_DATASET/Annotations/val.json"
val_yolo_paths = "./datasets/PCB_DATASET/labels/val2024"if not os.path.exists(train_yolo_paths):os.makedirs(train_yolo_paths)if not os.path.exists(val_yolo_paths):os.makedirs(val_yolo_paths)refactor_data_format(train_json_path, train_yolo_paths)
refactor_data_format(val_json_path, val_yolo_paths)
  1. 创建训练集与测试集的数据集
import os
import shutilImages_path = r'./PCB_DATASET/images'  # 源图路径train_labels = r'./datasets/PCB_DATASET/labels/train2024'  # train标签路径
val_labels = r'./datasets/PCB_DATASET/labels/val2024'  # val标签路径train_images = r'./datasets/PCB_DATASET/images/train2024'  # 保存train图像路径
val_images = r'./datasets/PCB_DATASET/images/val2024'  # 保存val图像路径if not os.path.exists(train_images):os.makedirs(train_images)if not os.path.exists(val_images):os.makedirs(val_images)# 判断文件夹是否存在,不存在即创建
if not os.path.exists(train_images):os.mkdir(train_images)
if not os.path.exists(val_images):os.mkdir(val_images)# 按照标签名移动对应图像
for label_name in os.listdir(train_labels):img_name = label_name[:-3] + 'jpg'shutil.move(os.path.join(Images_path, img_name), os.path.join(train_images, img_name))for label_name in os.listdir(val_labels):img_name = label_name[:-3] + 'jpg'shutil.move(os.path.join(Images_path, img_name), os.path.join(val_images, img_name))

YOLOv8_133">3.2 基于ultralytics训练YOLOv8

3.2.1 安装依赖包

!pip install ultralytics

3.2.2 ultralytics的训练规范说明

  1. YOLO训练标签示例如下(转换目标):
类别id 归一化后框中心点x坐标 归一化后框中心点y坐标 归一化后框的宽度 归一化后框的高度
  1. 训练YOLOv8时,需要存放数据集的目录结构如下(图像与标签路径必须对应):
├─datasets
│  ├─images
│  │  ├─train2024   # jpg/png 训练集图片
│  │  └─val2024     # jpg/png 验证集图片
│  ├─labels
│  │  ├─train2024   # txt 训练集标签
│  │  └─val2024     # txt 验证集标签

3.2.3 创建训练配置文件

content = """path: ./PCB_DATASET # 数据集的根目录
train: images/train2024 # train images
val: images/val2024 # val images# 分类类别
names:0: missing_hole1: mouse_bite2: open_circuit3: short4: spur5: spurious_copper
"""with open(r"dataset.yaml", mode='w', encoding='UTF-8') as f:f.write(content)

3.2.4 下载预训练模型

# 下载预训练的yolo8模型
import os
from modelscope.hub.api import HubApi
api = HubApi()
api.login('Your Modelscope SDK 令牌') # 通过访问:https://www.modelscope.cn/my/myaccesstoken 进行获取,需要提交下载申请# 不同大小YOLO8模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('ModelBulider/yolo8', local_dir="./modelscope_downloads")yolo_version = 'yolov8l' # 选择训练使用yolo8的版本,可以在modelscope_downloads中查看所有的YOLO8版本
yolov8_model_path = os.path.abspath(os.path.join(model_dir, f'{yolo_version}.pt'))
print(yolov8_model_path)
  • YOLO8包含了各种大小版本的模型,各模型大小、性能等参数比较如下:
    在这里插入图片描述
  • 如需要下载,可CSDN私信联系博主,佛系回复敬请谅解~
  • 可在yolo_version 处选择特定版本的YOLOv8预训练模型进行加载

3.2.5 训练模型

import os
from ultralytics import YOLOdef download_train_file():"""下载训练所需的文件"""os.system("cp ./modelscope_downloads/Arial.ttf /root/.config/Ultralytics/")if __name__ == '__main__':download_train_file()# Load a model# model = YOLO("yolov8n.yaml")  # build a new model from scratchmodel = YOLO(f'{yolo_version}.yaml').load(yolov8_model_path)  # load a pretrained model (recommended for training)# Use the modelmodel.train(data="dataset.yaml", imgsz=640, batch=16, workers=8, cache=True, epochs=100)  # train the modelmetrics = model.val()  # evaluate model performance on the validation set# results = model("ultralytics\\assets\\bus.jpg")  # predict on an imagepath = model.export(format="onnx", opset=13)  # export the model to ONNX format
  • 训练日志:

在这里插入图片描述

  • 更多训练参数配置,可参考:https://docs.ultralytics.com/modes/train/

3.2.6 训练结果

  • 训练产生的数据会生成在runs/detect/train路径下。其中,weight种存储了,训练过程中表现最好的模型参数(best.pt)以及最后一次训练得到的模型参数(last.pt)
    在这里插入图片描述
  • 训练结果验证
from ultralytics import YOLO# Load a model
model = YOLO(r'runs/detect/train/weights/best.pt')  # pretrained YOLOv8n model# Run batched inference on a list of images
results = model([r"datasets/PCB_DATASET/images/train2024/01_missing_hole_01.jpg", r"datasets/PCB_DATASET/images/train2024/01_missing_hole_17.jpg"])  # return a list of Results objects# Process results list
for idex, result in enumerate(results):boxes = result.boxes  # Boxes object for bounding box outputsmasks = result.masks  # Masks object for segmentation masks outputskeypoints = result.keypoints  # Keypoints object for pose outputsprobs = result.probs  # Probs object for classification outputsobb = result.obb  # Oriented boxes object for OBB outputsresult.show()  # display to screenresult.save(filename=f"result_{idex}.jpg")  # save to disk

在这里插入图片描述
在这里插入图片描述

YOLO8PCB_255">四、基于YOLO8的PCB缺陷检测系统

  • 使用训练得到模型,开发缺陷检测系统

在线体验:https://www.modelscope.cn/studios/ModelBulider/yolo_pcb_dec

在这里插入图片描述


http://www.ppmy.cn/devtools/95891.html

相关文章

网络编程:OSI协议,TCP/IP协议,IP地址,UDP编程

目录 国际网络通信协议标准: 1.OSI协议: 2.TCP/IP协议模型: 应用层 : 传输层: 网络层: IPV4协议 IP地址 IP地址的划分: 公有地址 私有地址 MA…

UDS诊断系列之十八故障码的状态掩码

在谈19服务的子功能之前,先说一下故障码(DTC)的状态掩码是什么。 一、状态掩码 状态掩码由八个状态位构成,客户端利用它向服务器请求与其状态相匹配的DTC信息。当服务器接收到来自客户端的请求时,它会通过过滤匹配的…

uniapp 生成二维码

一般常用到的二维码生成库,在使用的过程中,都需要设置到指定的dom元素上, 但是在 uniapp 项目中,想要像vue项目中一样,获取标签的dom元素是比较难操作的。所以在 uniapp 中生成二维码,就需要换一种思路&…

八股面试大总结②——Linux系统

2.1 进程线程区别 进程是资源分配的基本单位,线程是资源调度的基本单位每个进程有自己的私有地址空间、私有栈、堆,上下文切换需要切换虚拟地址空间线程之间公有一个地址空间、公有堆,但是栈和程序计数器是私有的,用来保存线程的…

蓝桥·算法赛——第06场

文章目录 小白入门赛1-元宵节快乐2-猜灯谜3-数学奇才4-你不干?有的是帕鲁干!5-等腰三角形6-计算方程 强者挑战赛1-你不干?有的是帕鲁干!2-等腰三角形3-计算方程4-谁是帕鲁?5-源石开采6-集合划分 小白入门赛 1-元宵节快…

《SPSS零基础入门教程》学习笔记——05.模型入门

文章目录 5.1 回归模型5.2 分类模型5.3 降维和刻度模型5.4 生存分析和时间序列模型 5.1 回归模型 线性回归(分析 -> 回归 -> 线性)曲线估计(分析 -> 回归 -> 曲线估计) 二元Logistic回归(分析 -> 回归…

ArduPilot二次开发零基础教程

文章目录 前言一、概述二、开发环境搭建三、多旋翼MAVROS自主控制接口四、无人船(车)MAVROS自主控制接口五、二次开发基础六、控制LED灯七、自定义串口驱动八、Guided控制接口九、输出自定义PWM信号十、添加自定义MAVLINK消息和QGC通信十一、自定义日志十…

优化 SQL 查询性能:深入理解 EXPLAIN 命令

优化 SQL 查询性能:深入理解 EXPLAIN 命令 在 MySQL 数据库管理中,优化 SQL 查询性能是确保高效数据处理的关键。EXPLAIN 命令是分析和优化 SQL 查询的强大工具,它帮助我们理解查询执行计划,从而找到性能瓶颈并进行优化。本文将详细解释 EXPLAIN 命令返回的各个列的含义,…