1.VisDrone

2.DOTA

3.UCAS-AOD

4.UAVDT

5.UAV123

6.CARPK

7.AU-Air

8.ERA

9.VEDAI

10.ITCVD

11.DLR3kVehicle

12.OIRDS

13.NWPU

14.DIOR

1.VisDrone

VisDrone2022数据集由中国天津大学机器学习与数据挖掘实验室的AISKYEYE团队收集。基准数据集由 265，228 帧和 10，209 张静态图像组成的 400 个视频片段组成，由各种无人机摄像头捕获，涵盖广泛的方面，包括位置（取自中国相隔数千公里的 14 个不同城市）、环境（城市和乡村）、物体（行人、车辆、自行车等）和密度（稀疏和拥挤的场景）。请注意，数据集是使用各种无人机平台（即具有不同型号的无人机）在不同的场景以及各种天气和照明条件下收集的。这些帧使用超过 260 万个边界框或经常感兴趣的目标点（如行人、汽车、自行车和三轮车）手动注释。还提供了一些重要属性，包括场景可见性、对象类和遮挡，以提高数据利用率。

Introduction – VISDRONE (aiskyeye.com)

ppyoloe实战之VisDrone2019无人机数据-pudn.com

2.DOTA

DOTA 数据集是用于航拍图像中的目标检测的大型图像数据集。它可用于发现和评估航拍图像中的物体。无论从数量还是质量上来说，在同类型数据集中都具有很大优势

作为计算机视觉的重要数据之一，遥感图像对于分析地球信息具有重要的作用。

遥感图像一般来自卫星，航拍图像可能来自大型飞机、无人机、直升机等。这些数据通常被用来进行计算机视觉分类、检测、分割、跟踪任务的训练，以及该领域特定的建筑重建、地物提取、地物属性（高度等）预测等。

2806 幅航拍图，15 个类别详细标注

DOTA 数据集便是用于航拍图像中目标检测的图像数据集，其被用于发现和评估航拍图像中的物体。

这些图像来源包含不同传感器和平台，包括 Google Earth、JL–1 卫星拍摄，以及中国资源卫星数据和应用中心的 GF–2 卫星拍摄。

数据集共计 2806 幅航拍图，每张图像的像素尺寸在 800*800 到 4000*4000 的范围内，其中包含不同尺度、方向和形状的物体。之后这些 DOTA 图像经由专家使用 15 个常见目标类别进行注释，包括：飞机，轮船，储罐，棒球场，网球场，篮球场，地面跑道，港口，桥梁，大型车辆，小型车辆，直升机，环形交叉路口，足球场和篮球场。

完全注释的 DOTA 图像包含 188282 个实例，每个实例均由任意四边形进行标记。

数据集中用标注有定向的边界框标注

实发布机构：武汉大学

包含数量：2806 张航拍图片

数据格式：txt.pnd

图片尺寸：800 * 800~4000*4000

数据大小：35 GB

类别数：15 类

发布时间：2017 年 11 月

DOTA 数据集：2806 张遥感图像，近 19 万个标注实例_HyperAI超神经的博客-CSDN博客

3.UCAS-AOD

Dataset of Object Detection in Aerial Images，中国科学院大学模式识别与智能系统开发实验室标注的，只包含两类目标：汽车，飞机，以及背景负样本。样本数量如下：

相关链接：http://www.ucassdl.cn/resource.asp

DownLoad: Dataset 及其基本情况概述Instruction Instruction-cn

References:[1]H. Zhu, X. Chen, W. Dai, K. Fu, Q. Ye, J. Jiao, "Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network," IEEE Int'l Conf. Image Processing, 2015.

4.UAVDT

UAVDT是一个具有大规模的挑战性的无人机检测和跟踪基准（即10小时原始视频中约8万帧的代表性帧），用于3项重要的基本任务，即目标检测（DET）、单目标跟踪（SOT）和多目标跟踪（MOT）。

数据集由无人机在各种复杂场景中捕获。本基准中关注的对象是车辆。使用边界框和一些有用的属性（例如，车辆类别和遮挡）对帧进行手动注释。

UAVDT基准由100个视频序列组成，这些视频序列是从城市地区多个地点的UAV平台拍摄的超过10小时的视频中选择的，代表各种常见场景，包括广场、主干道、收费站、高速公路、交叉口和T形交叉口。视频以每秒30帧（fps）的速度录制，JPEG图像分辨率为1080×540像素。

该数据集包含的是原始图片，不包括注释

来源：https://sites.google.com/view/grli-uavdt/%E9%A6%96%E9%A1%B5

参考：D. Du, Y. Qi, H.g Yu, Y. Yang, K. Duan, G. Li, W.g Zhang, Q. Huang, Q. Tian, " The Unmanned Aerial Vehicle Benchmark: Object Detection and Tracking", European Conference on Computer Vision (ECCV), 2018.

UAVDT：无人机目标检测与跟踪数据集 - 飞桨AI Studio (baidu.com)

5.UAV123

数据集图片：

数据集内容：UAV123是一个从低空无人机捕获的视频跟踪数据集，目标功能在于长期空中跟踪（UAV20L）。

数据集数量：UAV123数据集，包含总共123个视频序列和超过110K帧，使其成为仅次于ALOV300 ++的第二大对象跟踪数据集。

UAV123数据集可以分为3个子集

第一，103个视频序列，由专业的高级的无人机稳定可控的相机捕获，高度5~25meters，frame rates30

96fps，resolution·720p4K。最后所有的视频提供720p，30fps，并完全手工标注。

第二，12个视频序列，由价格比较低的无人机不稳定的相机捕获，这些序列拥有低的质量和分辨率，还包含合理的噪声，并完全手工标注。

第三，8个合成的视频序列，由我们提出的UAV模拟器。目标随着预先定义的轨迹移动，使用Unreal Game Engine rendered，同时自动标注在30fps，同时也可以获得目标mask/segmentation

UAV123数据集包含了大量的场景，目标，和动作。很自然的，这些序列包含了通常目标跟踪的一些挑战。

下图是很现有数据集的一个比较：

目标跟踪数据集整理（六）-----UAV_xwmwanjy666的博客-CSDN博客_uav数据集

6.CARPK

汽车停车场数据集(CARPK)包含了无人机(PHANTOM 3 PROFESSIONAL)从4个不同的停车场收集的近9万辆汽车。这些图像是在大约40米高度的无人机视角下收集的。每辆车用边界框标注图像集。所有标记的边界框都已很好地记录了左上角的点和右下角的点。它支持对象计数、对象本地化以及对边界框中的注释格式的进一步研究。

CARPK Dataset | Papers With Code

7.AU-Air

数据集图片：

数据集内容：AU-AIR数据集是第一个用于目标检测的多模式UAV数据集。

数据集来自不同机载传感器的，多模式数据的无人机视觉和机器人技术，并推动了空中监视的计算机视觉和机器人算法的开发。

数据集数量：AU-AIR数据集包括2小时的原始视频，32823个标记的帧，132034个对象实例，与交通监控有关的8个对象类别

数据集功能：目标检测

无人机视角的这10个数据集，千万不要错过！ - 知乎 (zhihu.com)

8.ERA

数据集图片：

数据集内容：随着无人驾驶飞机（UAV）的广泛普及，已经制作了大量的航拍视频。人们筛选如此大的数据并理解其内容是不现实的。因此，对无人机视频自动理解的方法学研究至关重要。

数据集数量：在这项工作中，提出了一个大型的数据集，称为ERA（航拍视频中的事件识别），由2864个视频组成，每个视频都包含一个来自25个不同类别的标签，对应于展开5秒640*640大小的视频。

数据集功能：视频分析、目标检测

9.VEDAI

数据集介绍

数据集背景：

VEDAI数据集
包含9种类型的遥感地物目标
提取自Utah AGRC
由卡昂大学于2015年发布
采用oriented bounding boxes(OBB)标注格式

数据集内容：

包括512*512、1024*1024两种尺寸数据，每种数据包含rgb、nir2种图像，共4波段

影像信息：

image size: 512 * 512 * 4；1024 * 1024 * 4
image number: 1210
object number: 3640
pixel resolution: 0.125 m

标注信息：

9类，共3640个目标

plane,
boat,
camping car,
car,
pick-up,
tractor,
truck,
van,
other

来源：

Vehicle Detection in Aerial Imagery (VEDAI) : a benchmark

遥感目标检测——VEDAI - 飞桨AI Studio (baidu.com)

10.ITCVD

数据集介绍

数据集背景：

ITCVD数据集
包含1种类型的遥感地物目标
提取自航拍影像
由University of Twente Research Information于2018年发布
采用horizontal bounding boxes (HBB)标注格式

数据集内容：

影像信息：

image size: 5616 * 3744 * 3
image number: 135
object number: 23543
resolution: 0.1m

标注信息：

1类，共23543个目标

vehicle

来源：

ITCVD Dataset — University of Twente Research Information

遥感目标检测——ITCVD - 飞桨AI Studio (baidu.com)

11.DLR3kVehicle

DLR 3K车辆:DLR 3K车辆数据集(Liu and Mattyus, 2015)是另一个设计用于车辆检测的数据集。它包含20张5616 3744航拍图像，空间分辨率为13厘米。它们是在距地面1000米的高空使用DLR 3K摄像机系统(一种近乎实时的机载数字监控系统)在德国慕尼黑地区拍摄的。有14235辆车是通过在图片中使用定向包围框手动标记的。

其bbox不是coco的格式，给出的是中心点的坐标，宽度和长度以及与x轴形成的角度，具体信息在Dataset Description.pdf中有解释。

12.OIRDS

数据集介绍

数据集背景：

OIRDS数据集
包含5种类型的遥感地物目标
提取自USGS、DARPA、VIVID
由雷神公司等于2009年发布
采用oriented bounding boxes(OBB)标注格式

数据集内容：

影像信息：

image size: 256~640 * 256~640 * 3
image number: 900
object number: 1800
pixel resolution: 约0.15m

标注信息：

5类，共1800个目标

car
pick-up
truck
van
unknown

来源：

Overhead Imagery Research Data Set download | SourceForge.net

遥感目标检测——OIRDS - 飞桨AI Studio (baidu.com)

13.NWPU

NWPU Dataset 是一个遥感影像数据集，其中 NWPU-RESISC45 Dataset 是由西北工业大学创建的遥感图像场景分类可用基准，该数据集包含像素大小为 256*256 共计 31500 张图像，涵盖 45 个场景类别，其中每个类别有 700 张图像。

这 45 个场景类别包括飞机、机场、棒球场、篮球场、海滩、桥梁、丛林、教堂、圆形农田、云、商业区、密集住宅、沙漠、森林、高速公路、高尔夫球场、地面田径、港口、工业地区、交叉口、岛、湖、草地、中型住宅、移动房屋公园、山、立交桥、宫、停车场、铁路、火车站、矩形农田、河、环形交通枢纽、跑道、海、船舶、雪山、稀疏住宅、体育场、储水箱、网球场、露台、火力发电站和湿地。

该数据集由西北工业大学发布，相关论文有《Remote Sensing Image Scene Classification: Benchmark and State of the Art》。

NWPU Data Set 遥感影像数据集 - 数据集下载 - 超神经 (hyper.ai)

14.DIOR

西工大韩军伟课题组提出了一种用于光学遥感图像中目标检测的大规模基准数据集“DIOR”，由23463幅图像和190288个目标实例组成，并对近年来基于深度学习的目标检测方法进行了综述。目标类别如下图。大小800 * 800，分辨率0.5m到30m。包括不同季节、不同天气。位置增强。来源Google Earth。