遥感影像-实例分割数据集:iSAID 从切图到YOLO格式数据集制作详细介绍

embedded/2024/10/19 12:17:27/

背景介绍

开源数据集isaid标注包含实例分割,但是原始影像太大,很吃显存,一般显卡无法用原始影像直接训练,所以需要对影像进行裁剪,并生成对应的标签,因为想用yolo系列跑模型,所以将标签需要转为txt格式。

制作流程

数据下载及目录整理

影像下载:https://captain-whu.github.io/DOTA/dataset.html,下载DOTA-v1.0就行

标签下载:https://captain-whu.github.io/iSAID/dataset.html

统计一下数据集数量,其中:

训练集影像:1411张原始图像;1411张实例标签;1411张语义标签。将所有训练图像放置在一起创建iSAID/train/
验证集影像:458张原始图像;458张实例标签;458张语义标签。将所有验证图像放置在一起创建iSAID/val/
测试集影像:937张原始图像;

目录结构如下:

iSAID
├── test
│   └── images
│       ├── P0006.png
│       └── ...
│       └── P0009.png
├── train
│   └── images
│       ├── P0002_instance_color_RGB.png
│       ├── P0002_instance_id_RGB.png
│       ├── P0002.png
│       ├── ...
│       ├── P0010_instance_color_RGB.png
│       ├── P0010_instance_id_RGB.png
│       └── P0010.png
└── val└── images├── P0003_instance_color_RGB.png├── P0003_instance_id_RGB.png├── P0003.png├── ...├── P0004_instance_color_RGB.png├── P0004_instance_id_RGB.png└── P0004.png
影像裁剪

下载裁剪代码:见博客末尾

进行下列步骤:

创建环境,根据environment.yml文件中的python库安装环境,源码中创建的环境比较老,很容易安装失败,安装的库新一点也没关系;(注意:如果安装lycon失败,先执行下面命令再重新安装包)

sudo apt-get install cmake build-essential libjpeg-dev libpng-dev

安装依赖库,执行下面命令:

# 库1(可装可不装,反正我没装)
cd cocoapi/PythonAPI
make
python setup.py install# 库2
cd preprocess/cityscapesScripts
python setup.py install# 库3
cd preprocess/Detectron
python setup.py install

执行裁剪代码split.py,注意需要修改裁剪文件的路径,裁剪小图的大小,以及裁剪窗口的重叠度,执行下面代码:

cd preprocess
python split.py --set train,val
python split.py --set test
# 上面代码执行时间很长
json标签生成

执行json标签生成代码preprocess.py,这一步没啥要注意的,如果前面环境都安装没问题,那就可以正常执行,不过执行时间也是很久,运行完毕后将生成coco格式的大json文件

python preprocess.py --set train,val
json转yolo格式

在转为yolo格式之前可以先利用coco官方API统计一下目标类别,代码如下./preprocess/statistical_category.py:

# -*- coding: utf-8 -*-from pycocotools.coco import COCO# 文件路径
dataDir = r'l/'
dataType = 'train2017' #val2017
annFile = '{}/instances_{}.json'.format(dataDir, dataType)# initialize COCO api for instance annotations
coco_train = COCO(annFile)# display COCO categories and supercategories
# 显示所有类别
cats = coco_train.loadCats(coco_train.getCatIds())
cat_nms = [cat['name'] for cat in cats]
print('COCO categories:\n{}'.format('\n'.join(cat_nms)) + '\n')
# 统计单个类别的图片数量与标注数量
for cat_name in cat_nms:catId = coco_train.getCatIds(catNms=cat_name)if cat_name == "person":print(catId)imgId = coco_train.getImgIds(catIds=catId)annId = coco_train.getAnnIds(imgIds=imgId, catIds=catId, iscrowd=False)print("{:<15} {:<6d}     {:<10d}\n".format(cat_name, len(imgId), len(annId)))if cat_name == "motorcycle":print(catId)imgId = coco_train.getImgIds(catIds=catId)annId = coco_train.getAnnIds(imgIds=imgId, catIds=catId, iscrowd=False)print("{:<15} {:<6d}     {:<10d}\n".format(cat_name, len(imgId), len(annId)))
# 统计全部的类别及全部的图片数量和标注数量
print("NUM_categories: " + str(len(coco_train.dataset['categories'])))
print("NUM_images: " + str(len(coco_train.dataset['images'])))
print("NUM_annotations: " + str(len(coco_train.dataset['annotations'])))# Classes
ship
storage_tank
baseball_diamond
tennis_court
basketball_court
Ground_Track_Field
Bridge
Large_Vehicle
Small_Vehicle
Helicopter
Swimming_pool
Roundabout
Soccer_ball_field
plane
Harbor

然后根据官方转换代码:见博客末尾
将coco格式的大json数据转换成多个yolo格式的txt文件,其中第一个数字为类别,后面每两个数字代表一个点对于整张图像的相对位置,每一行代表图像中的一个mask。txt文件内容如下:
在这里插入图片描述

需要本博客相关数据集的小伙伴可私信哦!
01、官方原始数据集;
02、本博客全套代码;
03、裁剪后可直接训练的小图数据集;


http://www.ppmy.cn/embedded/120015.html

相关文章

详解Java之继承与多态

目录 继承 派生类和基类各部分执行顺序 protected 访问权限总结 final关键字 组合 多态 向上转型 向下转型 动态绑定 静态绑定 方法重载 方法重写 super关键字 super和this的对比 在构造方法中调用重写方法 继承 继承是为了解决多个类具有一些相同的属性和方…

网络安全入门

1. 简介 1.1. 概述 网络安全是一个复杂而重要的领域,它涉及保护网络系统的硬件、软件及其数据免受未经授权的访问、使用、泄露、中断、修改或破坏。网络安全是指通过采取必要措施,防范对网络的攻击、侵入、干扰、破坏和非法使用以及意外事故,使网络处于稳定可靠运行的状态,…

Java | Leetcode Java题解之第438题找到字符串中所有字母异位词

题目&#xff1a; 题解&#xff1a; class Solution {public List<Integer> findAnagrams(String s, String p) {int sLen s.length(), pLen p.length();if (sLen < pLen) {return new ArrayList<Integer>();}List<Integer> ans new ArrayList<Int…

Qt QIntValidator详解

一、介绍 QIntValidator是Qt框架中用于验证整数输入的验证器类。它可以限制用户输入的整数范围&#xff0c;确保输入的整数在指定的范围内。通过QIntValidator&#xff0c;可以轻松地实现整数输入的有效性和范围限制。 二、 常用方法 QIntValidator(QObject *parent Q_NULLPT…

Python 课程18-SQLAlchemy

前言 SQLAlchemy 是一个功能强大的 Python SQL 工具包和对象关系映射&#xff08;ORM&#xff09;库&#xff0c;它使得开发者能够通过 Python 代码与数据库进行交互&#xff0c;而不必编写 SQL 查询。SQLAlchemy 提供了对多种数据库的支持&#xff0c;包括 MySQL、PostgreSQL…

机器人顶刊IEEE T-RO发布无人机动态环境高效表征成果:基于粒子的动态环境连续占有地图

摘要&#xff1a;本研究有效提高了动态环境中障碍物建模的精度和效率。NOKOV度量动作捕捉系统助力评估动态占用地图在速度估计方面的性能。 近日&#xff0c;上海交通大学、荷兰代尔夫特理工研究团队在机器人顶刊IEEE T-RO上发表题为Continuous Occupancy Mapping in Dynamic …

【AI大模型-文心-思维树解读-仓颉精通之路-4】

提问&#xff1a;对于每个解决方案&#xff0c;加深思考过程。生成潜在场景、实施策略、任何必要的资源、如何克服障碍与风险以及意外结果和意外结果的处理 回答&#xff1a;如下 版本&#xff1a;文心大模型3.5 解决方案一&#xff1a;系统化自学方案 潜在场景&#xff1a; …

Mac通过ssh连接工具远程登录服务器( Royal TSX安装及使用)

一、Royal TSX软件下载地址 Royal Apps 二、Royal TSX 汉化 汉化包地址&#xff1a;GitCode - 全球开发者的开源社区,开源代码托管平台 三、基础配置 Royal TSX 是一款基于插件的应用&#xff0c;刚安装时还不具备使用条件&#xff0c;需要进行一些基础配置 1 安装基础插件…