深度学习之目标检测从入门到精通——json转yolo格式

ops/2024/10/22 12:29:31/

记录点:

import json
import osname2id = {'person':0,'helmet':1,'Fire extinguisher':2,'Hook':3,'Gas cylinder':4}def convert(img_size, box):dw = 1./(img_size[0])dh = 1./(img_size[1])x = (box[0] + box[2])/2.0 - 1y = (box[1] + box[3])/2.0 - 1w = box[2] - box[0]h = box[3] - box[1]x = x*dww = w*dwy = y*dhh = h*dhreturn (x,y,w,h)def decode_json(json_floder_path,json_name):txt_name = 'E:\\eclipse-workspace\\PyTorch\\PyTorch-YOLOv3\\data\\custom\\labels\\' + json_name[0:-5] + '.txt'txt_file = open(txt_name, 'w')json_path = os.path.join(json_floder_path, json_name)data = json.load(open(json_path, 'r', encoding='gb2312'))img_w = data['imageWidth']img_h = data['imageHeight']for i in data['shapes']:label_name = i['label']if (i['shape_type'] == 'rectangle'):x1 = int(i['points'][0][0])y1 = int(i['points'][0][1])x2 = int(i['points'][1][0])y2 = int(i['points'][1][1])bb = (x1,y1,x2,y2)bbox = convert((img_w,img_h),bb)txt_file.write(str(name2id[label_name]) + " " + " ".join([str(a) for a in bbox]) + '\n')if __name__ == "__main__":json_floder_path = 'G:\\sinopec\\label-data-test\\json'json_names = os.listdir(json_floder_path)for json_name in json_names:decode_json(json_floder_path,json_name)
解读成博客,并附上关键代码

功能解析

JSON格式的标记文件中提取对象检测数据,并将其转换为适合训练YOLO模型的格式。主要功能包括读取标记信息,转换坐标系统,并生成对应的文本文件保存处理后的数据。以下是详细的解读和关键代码部分。

导入必要的模块
import json
import os
标签到ID的映射

定义字典name2id,用于将对象的名称映射到一个唯一的ID。

name2id = {'person':0, 'helmet':1, 'Fire extinguisher':2, 'Hook':3, 'Gas cylinder':4}
坐标转换函数

定义了convert函数,将标注的坐标转换为归一化坐标。这个步骤是因为YOLO模型需要归一化的边界框坐标作为输入。

def convert(img_size, box):dw = 1./(img_size[0])dh = 1./(img_size[1])x = (box[0] + box[2])/2.0 - 1y = (box[1] + box[3])/2.0 - 1w = box[2] - box[0]h = box[3] - box[1]x = x*dww = w*dwy = y*dhh = h*dhreturn (x,y,w,h)
JSON解码和文件写入

decode_json函数负责读取JSON文件,解析其中的对象标注数据,并使用convert函数转换坐标。然后,它将转换后的坐标写入新的文本文件中。

def decode_json(json_floder_path, json_name):txt_name = 'E:\\...\\' + json_name[0:-5] + '.txt'txt_file = open(txt_name, 'w')json_path = os.path.join(json_floder_path, json_name)data = json.load(open(json_path, 'r', encoding='gb2312'))img_w = data['imageWidth']img_h = data['imageHeight']for i in data['shapes']:if i['shape_type'] == 'rectangle':x1 = int(i['points'][0][0])y1 = int(i['points'][0][1])x2 = int(i['points'][1][0])y2 = int(i['points'][1][1])bb = (x1,y1,x2,y2)bbox = convert((img_w, img_h), bb)txt_file.write(str(name2id[i['label']]) + " " + " ".join([str(a) for a in bbox]) + '\n')
主函数

给定文件夹中的所有JSON文件,并对每个文件调用decode_json函数处理。

if __name__ == "__main__":json_floder_path = 'G:\\sinopec\\label-data-test\\json'json_names = os.listdir(json_floder_path)for json_name in json_names:decode_json(json_floder_path, json_name)

总结

将JSON格式的标记数据中提取信息,转换为YOLO模型训练所需的格式。通过自动化这一过程,可以大大减少准备数据的时间和复杂性,提高机器学习项目的效率。


http://www.ppmy.cn/ops/5520.html

相关文章

2024Guitar Pro 8.1 Mac 最新下载、安装、激活、换机图文教程

吉他爱好者必备神器:Guitar Pro v8.1.1 Build 17深度解析 随着数字音乐制作和学习的日益普及,越来越多的吉他爱好者开始寻找能够帮助他们提升技能、创作音乐的专业工具。在众多吉他制作软件中,Guitar Pro因其强大的功能和易用的界面备受推崇…

线性代数基础2矩阵

矩阵是什么 矩阵就是二维数组,下面是一个 m 乘 n 的矩阵,它有 m 行,n 列,每行每列上面都有元素,每个元素都有行标i 和列标 j, a ij 。简称m n矩阵,记作: 注意a11的索引是 A[0,0]。…

JAVA 项目<果园之窗>_2

上节主要是理论流程,这次直接用实际例子过一遍整个流程 目标是向数据库添加一个员工 上述是前端页面,点击保存 浏览器向我后端发送http请求 后端这一部分专门接收employee请求 在这里对http post请求进行转换成JAVA数据,并处理数据&#xff…

Uni-app中实现数据选择并回传给上个页面的方法

当我们在Uni-app中进行页面间数据传递时,通常会涉及到数据的选择以及回传给上个页面的需求。为了达到这个目的,我们可以利用Uni-app提供的事件机制和页面导航方法来实现。以下是一种实现方式: 数据选择并回传给上个页面的方法 第一步&#…

Qt编译静态链接库和动态链接库(WindowsLinux)

最近需要在Linux中编译相关程序动态库,对相关经验总结。 使用到的工具为Qt5.13.2 QT编译 1. WINDOWS1.1 静态库制作1.2 静态库的使用1.3 动态库制作1.4 动态库使用 2. LINUX2.1 静态链接库2.2动态库 附录gcc 编译程序查找顺序:Linux 程序运行时查找顺序&…

算法训练营day14

二叉树理论基础 种类 满二叉树,数上只有度为0或2的节点完全二叉树,(h - 1)层都满了,h层都集中在左侧若干位置 存储方式 链式存储,指针顺序存储,数组 遍历方式 深度优先 前序遍历(递归,迭代)中序遍历(递归…

新项目应该选mongodb还是postgresql?

文章目录 MongoDBPostgreSQL大数据处理时的优势对比实际使用经验 选择MongoDB还是PostgreSQL作为新项目的数据库,主要取决于项目的具体需求、数据模型、应用场景以及团队熟悉程度等因素。下面将从几个关键角度对两者进行对比分析。 MongoDB 数据模型:Mo…

Docker - 入门基础

原文地址,使用效果更佳! Docker - 入门基础 | CoderMast编程桅杆https://www.codermast.com/dev-tools/docker/docker-basic.html Docker架构 Docker 使用的是客户端-服务端(C/S)架构模式,使用远程 API 来管理和创建…