ade20k 街景图像【数据集】及其【论文出处】ADE20K数据集 超过25000张图像的语义分割数据集

news/2024/10/12 21:08:06/

 

 ade20k 街景图像【数据集】及其【论文出处】ADE20K数据集介绍 是一个包含超过25000张图像的语义分割数据集,这些图像被密集注释,覆盖室内和室外场景。

它由MIT发布,包含100个事物类别和50个物质类别, 用于训练和验证的图像数量分别为20210和2000。 ADE20K数据集的特点包括丰富的场景多样性和详细的语义标注,使得它成为训练和评估语义分割模型的重要资源。

数据集组成: ADE20K数据集分为训练集、验证集和测试集,其中训练集包含20,210张图像,验证集包含2,000张图像。测试集的图像将在稍后发布。 图像和注释: 每个图像都完全标注了对象和部分,这对于训练深度学习模型以进行像素级的语义分割至关重要。注释信息以PNG文件的形式提供,其中对象分割掩码包含有关对象类分割的信息,每个类分隔为实例。 应用领域: ADE20K数据集适用于计算机视觉和机器学习领域的研究,特别是在语义分割、场景解析等方面。

它为研究人员提供了一个标准化的数据集,以便评估算法的性能并促进该领域的研究进展。 特点: ADE20K数据集的图像涵盖了室内和室外场景,包括自然场景等,具有丰富的场景多样性。此外,数据集中的图像被标注了150个不同的类别,这些类别包括事物和物质,为训练和评估模型提供了丰富的语义信息

ADE20K 数据集介绍

数据集名称

ADE20K (Scene Parsing and Semantic Segmentation Dataset)

数据集概述

ADE20K 是一个广泛使用的语义分割数据集,由麻省理工学院(MIT)发布。该数据集包含超过25,000张图像,这些图像被密集注释,覆盖了室内和室外场景。ADE20K 旨在为语义分割任务提供丰富的场景多样性和详细的标注信息,是训练和评估语义分割模型的重要资源。

论文出处
数据集规格
  • 总图像数量:超过25,000张
    • 训练集:20,210张图像
    • 验证集:2,000张图像
    • 测试集:稍后发布
  • 类别:涵盖150个不同的类别,包括100个事物类别和50个物质类别。
  • 标注格式
    • PNG文件:每个图像都提供了像素级别的语义分割掩码,其中每个类分隔为实例。
    • JSON文件:包含详细的注释信息,如对象的边界框、多边形等。
数据集结构
 

深色版本

ADE20K/
├── images/                  # 存放原始图像文件
│   ├── training/            # 训练集图像
│   ├── validation/          # 验证集图像
└── annotations/             # 存放语义分割标签文件├── training/            # 训练集标签└── validation/          # 验证集标签
  • images/ 目录下存放的是原始图像文件。
  • annotations/ 目录下存放的是对应的语义分割标签文件,以PNG格式存储。
数据集配置文件

在使用深度学习框架进行训练时,可以创建一个类似于以下的配置文件 data.yaml

# 训练集图像路径
train: path_to_your_train_images
# 验证集图像路径
val: path_to_your_val_images
# 测试集图像路径(如果有的话)
test: path_to_your_test_images# 类别数量
nc: 150
# 类别名称
names: ['wall', 'building', 'sky', 'floor', 'tree', 'ceiling', 'road', 'bed ', 'windowpane', 'grass','cabinet', 'sidewalk', 'person', 'earth', 'door', 'table', 'mountain', 'plant', 'curtain', 'chair',# ... 其他130个类别
]
标注统计
  • 总计 (total)
    • 训练集:20,210张图像
    • 验证集:2,000张图像
使用说明
  1. 准备环境

    • 确保安装了必要的软件库以支持所选版本的语义分割模型。例如,对于PyTorch中的DeepLabV3+,可以使用以下命令安装依赖库:
      pip install -r requirements.txt
  2. 数据预处理

    • 将图像和标注文件分别放在相应的目录下。
    • 修改配置文件中的路径以匹配你的数据集位置。
    • 如果需要,可以使用脚本将PNG格式的标注文件转换为其他格式(如NumPy数组),或者反之。
  3. 修改配置文件

    • 更新配置文件以反映正确的数据路径。
    • 如果使用特定版本的语义分割模型,还需要更新相应的模型配置文件(如configs/deeplabv3plus.py)。
  4. 开始训练

    • 使用提供的训练脚本启动模型训练过程。例如,对于DeepLabV3+,可以使用以下命令进行训练:
      python train.py --config configs/deeplabv3plus.yaml
  5. 性能评估

    • 训练完成后,使用验证集或测试集对模型进行评估,检查mIoU等指标是否达到预期水平。例如,对于DeepLabV3+,可以使用以下命令进行评估:
      python eval.py --config configs/deeplabv3plus.yaml
  6. 部署应用

    • 将训练好的模型应用于实际场景中,实现语义分割功能。例如,可以使用以下命令进行推理:
      python infer.py --config configs/deeplabv3plus.yaml --image_path path_to_your_image
注意事项
  • 数据增强:可以通过调整数据增强策略来进一步提高模型性能,例如随机裁剪、旋转、亮度对比度调整等。
  • 超参数调整:根据实际情况调整学习率、批大小等超参数,以获得最佳训练效果。
  • 硬件要求:建议使用GPU进行训练,以加快训练速度。如果没有足够的计算资源,可以考虑使用云服务提供商的GPU实例。
  • 平衡数据:注意数据集中各类别之间的不平衡问题,可以通过过采样、欠采样或使用类别权重等方式来解决。
  • 复杂背景:图像中的背景可能非常复杂,因此在训练时需要注意模型对这些特性的适应性。
  • 多目标分割:在同一张图像中可能同时出现多个目标,确保模型能够正确区分并定位这些目标。

通过上述步骤,你可以成功地使用ADE20K数据集进行多种计算机视觉任务的研究和开发。该数据集是语义分割、场景解析等领域的重要基准之一,广泛应用于监督学习中的标签数据提供,支持语义分割、场景理解等多类任务。


http://www.ppmy.cn/news/1538028.html

相关文章

Windows绕过火绒添加用户

目录 背景 绕过火绒 背景 1. 已攻入windows系统 2. 已提权 3. 准备添加一个用户进行远程桌面 4. 该windows系统存在火绒 绕过火绒 1. 尝试添加用户远程连接 net user newuser password123 /add net localgroup administrators newuser /add 但添加用户时又回显超时,想…

毕设开源 大数据电影数据分析与可视化系统(源码+论文)

文章目录 0 前言1 项目运行效果2 设计概要3 最后 0 前言 🔥这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师…

java 自定义填充excel并导出

首先在resources下面放一个excel模板 1. 方法签名和请求映射 RequestMapping(value "/ExportXls") public ResponseEntity<byte[]> rwzcExportXls(HttpServletRequest request, RequestBody JSONArray jsonArray) throws IOException { RequestMapping(val…

智汇云舟亮相WAFI世界农业科技创新大会,并参编数字农业产业图谱

10月10日&#xff0c;2024WAFI世界农业科技创新大会农食行业创新与投资峰会在北京金海湖国际会展中心举行。中国农业大学MBA教育中心主任、教授付文阁、平谷区委常委、统战部部长刘堃、华为公共事业军团数字政府首席专家刘丹、荷兰瓦赫宁根大学前校长Aalt Dijkhuizen、牧原食品…

OpenCV-风格迁移

文章目录 一、原理二、关键步骤三、实现方法四、可选参数五、示例代码六、总结 OpenCV中的风格迁移是一种计算机视觉技术&#xff0c;它允许用户将一种图像的风格转移到另一幅图像上&#xff0c;从而创造出具有独特美学效果的新图像。这种技术在艺术、设计和娱乐等领域有着广泛…

以证候本体数据库量化病-证-方关联度

本报讯&#xff08;记者张梦雪&#xff09;日前&#xff0c;国际权威期刊《科学通报》刊登了中国中医科学院中药研究所与北京交通大学医学智能研究所科研团队联合研究成果《面向精准医学的中医证侯本体及“病-证-方”网络关联定量计算平台》&#xff0c;该平台包括国际首个证侯…

【瑞昱RTL8763E】音频

1 音乐播放控制 1.1 播放列表更新 文件系统在sd卡中保存header.bin及name.bin两份文件用于歌曲名称的存储。为方便应用层进行歌曲显示及列表管理&#xff0c;可将这两个bin文件信息读取并保存到nor flash中。需要播放指定名称的歌曲时&#xff0c;将对于歌曲名称传递给文件系…

在 MariaDB 中创建一个新的数据库实例

1. 登录 MariaDB 首先&#xff0c;使用 mysql 命令登录到 MariaDB&#xff1a; sudo mysql -u root -p 系统会提示你输入 MariaDB root 用户的密码。输入密码后&#xff0c;你将进入 MariaDB 命令行界面。 2. 创建数据库 在 MariaDB 命令行界面中&#xff0c;运行以下命令来…