深度学习:数据增强

devtools/2024/9/25 5:42:16/

目录

前言

一、为什么要使用数据增强?

二、数据增强有哪些方法?

1. 几何变换

2. 颜色变换

3. 噪声添加

4. 裁剪

5. 混合技术

6. 其他方法

三、代码实现


前言

        数据增强是深度学习中常用的一种技术,旨在通过对训练数据进行各种变换来增加数据集的多样性,从而提高模型的泛化能力。

 

一、为什么要使用数据增强?

  1. 数据量不足:训练样本较少时,增强可以生成更多样本。
  2. 数据不平衡:某些类别样本较少,需要平衡各类别。
  3. 过拟合风险:模型在训练集上表现很好,但在验证集上差时。
  4. 模拟多样性:希望模型能适应不同的实际应用场景。

 

二、数据增强有哪些方法?

1. 几何变换

  • 旋转:随机旋转图像一定角度。
  • 平移:在水平或垂直方向上随机平移图像。
  • 缩放:随机缩放图像,使其大小发生变化。
  • 翻转:水平或垂直翻转图像。

 

2. 颜色变换

  • 亮度调整:随机改变图像的亮度。
  • 对比度调整:调整图像的对比度,使得高光和阴影部分更加明显。
  • 色相/饱和度调整:随机改变图像的色相和饱和度。

 

3. 噪声添加

  • 高斯噪声:在图像中添加高斯噪声,增加训练数据的鲁棒性。
  • 椒盐噪声:随机在图像中添加黑白噪点。

 

4. 裁剪

  • 随机裁剪:随机裁剪图像的一部分,保留部分信息以进行训练。

 

5. 混合技术

  • Mixup:将两张图像及其标签进行线性组合,生成新的训练样本。
  • CutMix:在一张图像中裁剪出一部分并将其替换为另一张图像的部分。

 

6. 其他方法

  • 透视变换:对图像进行透视变换,以模拟不同的视角。
  • 模糊处理:对图像应用模糊效果,例如高斯模糊。

 

三、代码实现

from torchvision import transformsdata_transforms = {'train':transforms.Compose([transforms.Resize([300, 300]),transforms.RandomRotation(45),   # 随机旋转45度transforms.CenterCrop(256),      # 从图像中心裁剪(256,256)transforms.RandomHorizontalFlip(p=0.5),  # 随机水平旋转transforms.RandomVerticalFlip(p=0.5),  # 随机垂直旋转transforms.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1),  # 图像随机调整颜色transforms.RandomGrayscale(p=0.1),  # 图像随机转换成灰度图transforms.ToTensor(),transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])  # 为 ImageNet 数据集计算的标准化参数]),'test':transforms.Compose([transforms.Resize([256, 256]),transforms.ToTensor(),transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])  # 为 ImageNet 数据集计算的标准化参数])
}

http://www.ppmy.cn/devtools/116828.html

相关文章

计算机毕业设计之:宠物互助平台的微信小程序系统(源码+文档+讲解)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

低代码中实现数据映射的必要性与方案

在数字化转型的浪潮中,低代码平台因其快速开发和灵活性而受到越来越多企业的青睐。然而,随着业务需求的复杂化,单纯依赖低代码工具往往难以满足企业在数据处理和业务逻辑上的要求。数据映射作为连接不同数据源和业务逻辑的桥梁,显…

【C++篇】手撕 C++ string 类:从零实现到深入剖析的模拟之路

文章目录 C string 类的模拟实现:从构造到高级操作前言第一章:为什么要手写 C string 类?1.1 理由与价值 第二章:实现一个简单的 string 类2.1 基本构造与析构2.1.1 示例代码:基础的 string 类实现2.1.2 解读代码 2.2 …

WPF 中的线程池

WPF 中的线程池 在 WPF 中,虽然应用程序主要运行在 UI 线程上,但我们可以使用 线程池 来执行后台任务而不会阻塞 UI 线程。WPF 中常用的线程池是 .NET 线程池,可以通过 ThreadPool 类或 Task 来管理后台任务。以下是 WPF 中如何使用线程池及…

TCP/IP协议详解:现代网络通信的基石

在现代网络通信中,TCP/IP协议(Transmission Control Protocol/Internet Protocol,传输控制协议/互联网协议)是核心基础。几乎所有的互联网通信都依赖于它,它为网络中的设备提供了标准的通信方法。在本文中,…

SAP B1 认证考试习题 - 解析版(一)

一、基础 1. 下列哪个产品不是以中小型企业为目标客户的 A. mySAP All-in-One B. SAP Business One C. mySAP Business Suite 答案:C 解析:SAP Business One -- 为小型企业定制的解决方案(250人以下);mySAP All-…

002.k8s(Kubernetes)一小时快速入门(先看docker30分钟)

简介(免费开源,google开源) 关键概念: 容器(Containers):Kubernetes 管理容器,通常使用 Docker,允许应用程序在隔离的环境中运行。节点(Nodes)&am…

前端html+css+js 基础总结

​​​HTML 行级元素 标签分为行级元素与块级元素 行级元素占据区域由其显示内容决定&#xff0c;如span&#xff0c;img(图片)&#xff0c;<a></a>基本格式: <a href"链接" target"_blank"></a>用于跳转到其他网站&#xff0c…