目标检测——数据处理

news/2025/3/3 5:13:07/

1. Mosaic 数据增强

Mosaic 数据增强步骤:

(1). 选择四个图像:

  • 从数据集中随机选择四张图像。这四张图像是用来组合成一个新图像的基础

(2) 确定拼接位置:

  • 设计一个新的画布(输入size的2倍),在指定范围内找出一个随机点(如图1所示: 范围在320 ~ 960之间)
  • 每一张小图按照长边resize到输入的输入size的大小,然后依次拼接到对应位置
    图像1

图示2

(3) 调整图像大小和裁剪:

  • 对每个选定的图像进行缩放和裁剪,使其适合分配给它的区域。 这样可以确保每个图像都能很好地适应其对应的象限,并且不会超出边界。

(4) 调整标签:

  • 如果你在进行目标检测任务,还需要调整每个图像中的目标框(bounding boxes)的坐标,使其适应新的复合图像的位置。具体来说,需要根据图像在复合图像中的位置重新计算目标框的位置和尺寸。

(5) 应用其他增强操作(可选):

  • 生成的复合图像上可以进一步应用其他常见的数据增强技术,如颜色抖动(color jittering)、水平翻转(horizontal flipping)、旋转(rotation)等,以进一步丰富数据集。

2. CutMix 数据增强

CutMix一种数据增强技术,旨在通过将两张图像的一部分区域进行混合,并相应地调整标签,来增加训练样本的多样性。这种方法不仅能够提高模型的泛化能力,还能有效防止过拟合。

CutMix 数据增强的具体步骤:

(1) 选择两张图像和标签:

  • 从数据集中随机选择两张图像 image1image2 及其对应的标签 label1label2

(2) 确定混合区域:

  • image1 中随机选择一个矩形区域 (x, y, w, h),其中 (x, y) 是矩形的左上角坐标,(w, h)是矩形的宽度和高度。

  • 通常使用均匀分布来随机选择这些参数,例如:

    lam = np.random.beta(beta, beta)  # Beta分布参数,用于控制混合比例
    x = np.random.randint(0, image1.shape[1])
    y = np.random.randint(0, image1.shape[0])
    w = int(image1.shape[1] * np.sqrt(1 - lam))
    h = int(image1.shape[0] * np.sqrt(1 - lam))
    

(3) 裁剪并混合区域:

  • 将 image2 中对应区域的图像裁剪出来,并将其粘贴到 image1 的选定区域中。

  • 这一步可以通过简单的图像操作完成:

    def cutmix(image1, image2, x, y, w, h):mixed_image = image1.copy()mixed_image[y:y+h, x:x+w] = image2[y:y+h, x:x+w]return mixed_image
    

(4) 调整标签:
对于分类任务,标签可以根据混合区域的比例进行线性插值。假设 lam 是混合区域占总面积的比例,则新图像的标签可以表示为:

new_label = lam * label1 + (1 - lam) * label2

对于目标检测任务,需要调整每个目标框的位置和标签,以反映混合后的图像内容。具体来说:

  • 如果目标框完全位于混合区域之外,则保留原标签
  • 如果目标框部分位于混合区域之内,则需要根据交集区域调整目标框的位置和大小

http://www.ppmy.cn/news/1576207.html

相关文章

快速列出MS Word中所有可用字体

Word中有很多字体,虽然在字体下拉列表中提供了字体的样例,但是并不全面,例如使用Batang字体的话,数字会显示成什么效果,就无法直观的看到。 打开Word应用程序,新建一个空白文档,按AltF11打开VBE…

C++中不同维度的数据保存与读取

C中不同维度的数据保存与读取 一、保存csv数据1.1 一维vector1.2 二维vector1.3 三维vector1.4 五维vector 二、读取csv数据2.1 一维vector2.2 二维vector2.3 三维vector2.4 五维vector 一、保存csv数据 1.1 一维vector void Save_bias(vector<double> &bias, stri…

【JavaWeb13】了解ES6的核心特性,对于提高JavaScript编程效率有哪些潜在影响?

文章目录 &#x1f30d;一. ES6 新特性❄️1. ES6 基本介绍❄️2. 基本使用2.1 let 声明变量2.2 const 声明常量/只读变量2.3 解构赋值2.4 模板字符串2.5 对象拓展运算符2.6 箭头函数 &#x1f30d;二. Promise❄️1. 基本使用❄️2. 如何解决回调地狱问题2.1回调地狱问题2.2 使…

TS二次封装axios学习总结

1.put请求 put请求一般用的很少&#xff0c;主要有两点区别。 1.PUT请求&#xff1a;如果两个请求相同&#xff0c;后一个请求会把第一个请求覆盖掉。&#xff08;所以PUT用来改资源&#xff09; Post请求&#xff1a;后一个请求不会把第一个请求覆盖掉。&#xff08;所以Pos…

【银河麒麟高级服务器操作系统】服务器测试业务耗时问题分析及处理全流程分享

更多银河麒麟操作系统产品及技术讨论&#xff0c;欢迎加入银河麒麟操作系统官方论坛 https://forum.kylinos.cn 了解更多银河麒麟操作系统全新产品&#xff0c;请点击访问 麒麟软件产品专区&#xff1a;https://product.kylinos.cn 开发者专区&#xff1a;https://developer…

学习笔记-单片机蓝桥杯大模板更新-米醋

一&#xff0c;Seg 底层&#xff1a; 高电平灭&#xff0c;共阳极 ‘,’的ASCII码是44 不消隐的话&#xff1a; 显示完3&#xff0c;想显示5&#xff1a;显示5时有视觉残留 消隐&#xff1a; 显示完3&#xff0c;想显示5&#xff1a;流程&#xff1a;先显示3&#xff0c…

C++ Qt使用命令自动添加exe依赖的Qt库

进入exe文件夹下&#xff0c;打开对应Qt版本的Cmd工具&#xff1a;QT 5.12.2cmd命令工具 执行以下命令&#xff0c;进入exe文件目录&#xff1a; cd E:\proj\bin 如果cd 没有反应&#xff0c;可按顺序执行以下代码进入指定目录&#xff1a; cd \ cd E: cd E:\proj\bin …

深度探索:DeepSeek与鸿蒙HarmonyOS应用开发的深度融合

文章目录 一、概述1.1 什么是DeepSeek&#xff1f;1.2 鸿蒙HarmonyOS的特点 二、技术优势与应用场景2.1 技术优势2.2 应用场景 三、开发指南3.1 环境搭建3.2 集成AI模型3.3 分布式任务调度 四、实际案例分析4.1 智能家居控制4.2 智能健康监测 五、未来展望《AI智能化办公&#…