我们知道,对于深度学习算法,要想训练出一个效果不错的模型,一个好的训练数据集是非常重要的;本文记录一下我制作YOLOv8分类算法数据集的过程;当然也适用于YOLOv8的其他算法,甚至其他深度学习算法也是可以使用的。
在计算机视觉任务中,数据的多样性是提高模型性能的关键。为了训练一个高效的模型,我们需要一个丰富且多样化的数据集。
对于训练所用数据集来说,图片数量越多,信息越丰富,训练的效果越好;但是如果我们希望数据集有一万张图片,那我们一张一张的去拍,拍一万张,显然是不现实的;但是我们拍500张原始图片,还是比较容易的;再根据这500张原始图片,通过一系列的处理,生成一万张就可以了。
所以我们的目标就是,通过少量的原始图片,生成信息量丰富、图片数量丰富的数据集。
特点:
1、最终生成的数据集的图片总数量可灵活选择;
2、支持.heic
格式(iPhone手机拍摄)的图片作为原始图片;
3、对原始图像进行翻转、旋转、缩放、调节亮度、添加高斯噪声、应用高斯默许、调整对比度、调整像素值、边缘裁剪等处理,用以丰富生成的图像数据,从而提高YOLOv8模型的鲁棒性和泛化能力。
4、最终生成的图片均为jpg格式
文章目录
- 一、环境搭建
- 1.1 安装python3.8
- 1.2 创建虚拟环境
- 1.2 安装所需的库
- 方法1:一步步按下面方法安装
- 方法2:直接从我的requirements.txt一键安装
- 二、使用 Python 自动处理和增强数据集
- 2.1 准备数据集和python代码
- 2.2 控制最终数据集的数量
- 2.3 运行脚本
- 2.4 运行结果
一、环境搭建
我使用的是Win10;
1.1 安装python3.8
必须安装python3.8,从官网下载安装包