目标检测——数据处理

server/2025/3/4 0:20:37/

1. Mosaic 数据增强

Mosaic 数据增强步骤:

(1). 选择四个图像:

  • 从数据集中随机选择四张图像。这四张图像是用来组合成一个新图像的基础

(2) 确定拼接位置:

  • 设计一个新的画布(输入size的2倍),在指定范围内找出一个随机点(如图1所示: 范围在320 ~ 960之间)
  • 每一张小图按照长边resize到输入的输入size的大小,然后依次拼接到对应位置
    图像1

图示2

(3) 调整图像大小和裁剪:

  • 对每个选定的图像进行缩放和裁剪,使其适合分配给它的区域。 这样可以确保每个图像都能很好地适应其对应的象限,并且不会超出边界。

(4) 调整标签:

  • 如果你在进行目标检测任务,还需要调整每个图像中的目标框(bounding boxes)的坐标,使其适应新的复合图像的位置。具体来说,需要根据图像在复合图像中的位置重新计算目标框的位置和尺寸。

(5) 应用其他增强操作(可选):

  • 生成的复合图像上可以进一步应用其他常见的数据增强技术,如颜色抖动(color jittering)、水平翻转(horizontal flipping)、旋转(rotation)等,以进一步丰富数据集。

2. CutMix 数据增强

CutMix一种数据增强技术,旨在通过将两张图像的一部分区域进行混合,并相应地调整标签,来增加训练样本的多样性。这种方法不仅能够提高模型的泛化能力,还能有效防止过拟合。

CutMix 数据增强的具体步骤:

(1) 选择两张图像和标签:

  • 从数据集中随机选择两张图像 image1image2 及其对应的标签 label1label2

(2) 确定混合区域:

  • image1 中随机选择一个矩形区域 (x, y, w, h),其中 (x, y) 是矩形的左上角坐标,(w, h)是矩形的宽度和高度。

  • 通常使用均匀分布来随机选择这些参数,例如:

    lam = np.random.beta(beta, beta)  # Beta分布参数,用于控制混合比例
    x = np.random.randint(0, image1.shape[1])
    y = np.random.randint(0, image1.shape[0])
    w = int(image1.shape[1] * np.sqrt(1 - lam))
    h = int(image1.shape[0] * np.sqrt(1 - lam))
    

(3) 裁剪并混合区域:

  • 将 image2 中对应区域的图像裁剪出来,并将其粘贴到 image1 的选定区域中。

  • 这一步可以通过简单的图像操作完成:

    def cutmix(image1, image2, x, y, w, h):mixed_image = image1.copy()mixed_image[y:y+h, x:x+w] = image2[y:y+h, x:x+w]return mixed_image
    

(4) 调整标签:
对于分类任务,标签可以根据混合区域的比例进行线性插值。假设 lam 是混合区域占总面积的比例,则新图像的标签可以表示为:

new_label = lam * label1 + (1 - lam) * label2

对于目标检测任务,需要调整每个目标框的位置和标签,以反映混合后的图像内容。具体来说:

  • 如果目标框完全位于混合区域之外,则保留原标签
  • 如果目标框部分位于混合区域之内,则需要根据交集区域调整目标框的位置和大小

http://www.ppmy.cn/server/172200.html

相关文章

火绒终端安全管理系统V2.0网络防御功能介绍

网络防御是指通过一系列技术、策略和措施,保护网络系统、数据和资源免受未经授权的访问、攻击、破坏或泄露。 火绒终端安全管理系统:网络防御功能包含网络入侵拦截、横向渗透防护、对外攻击检测、僵尸网络防护、Web服务保护、暴破攻击防护、远程登录防护…

广东GZ033-任务E:数据可视化(15 分)-用柱状图展示销售金额最高的6 个月

广东GZ033-任务E:数据可视化(15 分) 用柱状图展示销售金额最高的6 个月 编写Vue 工程代码, 读取虚拟机bigdata-spark 的/opt/data 目录下的 supermarket_visualization.csv,用柱状图展示2024 年销售金额最高的6 个月&a…

大白话解释深度学习中多尺度特征融合及其意义

想象一下,你正在看一幅城市街道的照片。在这张照片中,你可能会看到: 远处的小汽车,它们在图像中看起来很小。近处的大巴士,它们在图像中看起来很大。还有一些行人,他们可能在不同的距离上,大小…

HTTP四次挥手是什么?

四次挥手,这是TCP协议用来关闭连接的过程。四次挥手是确保两个主机之间能够安全、可靠地关闭连接的重要机制。我会用简单易懂的方式来讲解,帮助你理解它的原理和过程。 1. 什么是四次挥手? 定义 四次挥手是TCP协议用来关闭连接的过程。它通…

fortify安全扫描Access Control: Database问题解决

概述 Access Control: Database说白了就是权限控制。在访问数据库(sql和nosql)需要加入当前用户的权限控制。不然会被fortify扫描出来,认为客户端可能不挟持和假冒,从而导致数据被泄露。 但是这个并不是任何时候都需要的,有的接口本来…

centos 7 停更后如何升级kernel版本 —— 筑梦

centos 6/7 内核升级(bios/uefi两种引导方式) —— 筑梦之路_centos7 更新efi-CSDN博客 此处主要说明kernel rpm离线包可以从哪里下载,安装升级参考之前的文章 # 历史kernel版本rpm包http://mirrors.coreix.net/elrepo-archive-archive/kernel/el7/x86_64/RPMS/…

算法:判断链表是否有环

/*** brief 判断链表是否有环* * 该函数使用快慢指针法来判断链表中是否存在环。* 快指针每次移动两步,慢指针每次移动一步。* 如果链表中存在环,那么快指针最终会追上慢指针;* 如果链表中不存在环,快指针会先到达链表末尾。* * p…

技术问题汇总:前端怎么往后端传一个日期?

场景 现在有一个笔记软件&#xff0c;需要根据用户设置的两个日期&#xff0c;删选出来创建日期位于这两个日期中间的笔记。 思路 把日期放到一个对象里边传到后端 参考代码 前端代码&#xff0c;提交一个含日期的对象。 <template><div class"demo-date-p…