深度学习:数据增强

server/2024/9/25 4:50:11/

目录

前言

一、为什么要使用数据增强?

二、数据增强有哪些方法?

1. 几何变换

2. 颜色变换

3. 噪声添加

4. 裁剪

5. 混合技术

6. 其他方法

三、代码实现


前言

        数据增强是深度学习中常用的一种技术,旨在通过对训练数据进行各种变换来增加数据集的多样性,从而提高模型的泛化能力。

 

一、为什么要使用数据增强?

  1. 数据量不足:训练样本较少时,增强可以生成更多样本。
  2. 数据不平衡:某些类别样本较少,需要平衡各类别。
  3. 过拟合风险:模型在训练集上表现很好,但在验证集上差时。
  4. 模拟多样性:希望模型能适应不同的实际应用场景。

 

二、数据增强有哪些方法?

1. 几何变换

  • 旋转:随机旋转图像一定角度。
  • 平移:在水平或垂直方向上随机平移图像。
  • 缩放:随机缩放图像,使其大小发生变化。
  • 翻转:水平或垂直翻转图像。

 

2. 颜色变换

  • 亮度调整:随机改变图像的亮度。
  • 对比度调整:调整图像的对比度,使得高光和阴影部分更加明显。
  • 色相/饱和度调整:随机改变图像的色相和饱和度。

 

3. 噪声添加

  • 高斯噪声:在图像中添加高斯噪声,增加训练数据的鲁棒性。
  • 椒盐噪声:随机在图像中添加黑白噪点。

 

4. 裁剪

  • 随机裁剪:随机裁剪图像的一部分,保留部分信息以进行训练。

 

5. 混合技术

  • Mixup:将两张图像及其标签进行线性组合,生成新的训练样本。
  • CutMix:在一张图像中裁剪出一部分并将其替换为另一张图像的部分。

 

6. 其他方法

  • 透视变换:对图像进行透视变换,以模拟不同的视角。
  • 模糊处理:对图像应用模糊效果,例如高斯模糊。

 

三、代码实现

from torchvision import transformsdata_transforms = {'train':transforms.Compose([transforms.Resize([300, 300]),transforms.RandomRotation(45),   # 随机旋转45度transforms.CenterCrop(256),      # 从图像中心裁剪(256,256)transforms.RandomHorizontalFlip(p=0.5),  # 随机水平旋转transforms.RandomVerticalFlip(p=0.5),  # 随机垂直旋转transforms.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1),  # 图像随机调整颜色transforms.RandomGrayscale(p=0.1),  # 图像随机转换成灰度图transforms.ToTensor(),transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])  # 为 ImageNet 数据集计算的标准化参数]),'test':transforms.Compose([transforms.Resize([256, 256]),transforms.ToTensor(),transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])  # 为 ImageNet 数据集计算的标准化参数])
}

http://www.ppmy.cn/server/121666.html

相关文章

研1日记15

1. 文心一言生成: 在PyTorch中,nn.AdaptiveAvgPool1d(1)是一个一维自适应平均池化层。这个层的作用是将输入的特征图(或称为张量)在一维上进行自适应平均池化,使得输出特征图的大小在指定的维度上变为1。这意味着&…

《微信小程序实战(4) · 地图导航功能》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 CSDN入驻不久,希望大家多多支持,后续会继续提升文章质量,绝不滥竽充数…

24年蓝桥杯及攻防世界赛题-MISC-1

2 What-is-this AZADI TOWER 3 Avatar 题目 一个恐怖份子上传了这张照片到社交网络。里面藏了什么信息?隐藏内容即flag 解题 ┌──(holyeyes㉿kali2023)-[~/Misc/tool-misc/outguess] └─$ outguess -r 035bfaa85410429495786d8ea6ecd296.jpg flag1.txt Reading 035bf…

Redis常见知识点

数据类型 String Redis字符串存储字节序列,包括文本、序列化对象和二进制数组。 默认情况下 单个Redis字符串最大值不能超过512m 常用命令 SETNX仅当键不存在时才存储字符串值。对于实现锁很有用。MGET在一次操作中检索多个字符串值。INCRBY原子地增加&#xff…

详解 C++中的模板

目录 前言 一、函数模板 1.定义 2.函数模板的实现 3.模板函数的实例化 4.模板参数的省略 1.函数模板的实参推导 2.类模板的实参推导 3.默认模板参数 4.特殊情况:无法推导的模板 5.推导失败的情况 二、类模板 1.概念和定义 2.类模板定义 3.类模板的使用 4.类模板…

23个Python在自然语言处理中的应用实例

在自然语言处理(NLP)领域,Python作为一门功能强大的编程语言,凭借其丰富的库和工具集,成为了实现各种NLP任务的首选。以下是一个关于Python在NLP中应用的广泛实例的前言,旨在概述Python在NLP领域的多样性和…

力扣 中等 1901.寻找峰值II

文章目录 题目介绍题解 题目介绍 题解 需要明白一个事实:从任意一个点出发,可以经过一个递增路径,找到一个极大值点。 求出一行的最大值,如果这行最大值比上面的要小,那峰值(之一)就会在上面 …

sqoop的安装与简单使用

文章目录 一、安装1、上传,解压,重命名2、修改环境变量3、修改配置文件4、上传驱动包5、拷贝jar包 二、import命令1、将mysql的数据导入到hdfs上2、将mysql的数据导入到hive上3、增量导入数据 三、export命令1、从hdfs导出到mysql中2、从hive导出到mysql…