YOLO系列,从V1~V10,持续更新(Pytorch实现)

news/2024/12/18 18:56:46/

YOLOV1_0">关于YOLOV1

本文主要偏向代码实战,详细的算法原理着墨不多
主要创新:
实现了实时的目标检测
附上YOLOV1论文地址:
https://arxiv.org/abs/1506.02640
关于数据
首先要了解该网络架构的输入和输出,以及网络是如何进行训练的。这里主要讲一下数据集的格式以及使用labelme制作数据集(当然还有其他更好的工具,这里只做参考)
如果已经安装了python,使用以下命令直接安装labelme工具,没安python的先安python

pip install labelme

之后在cmd中输入labelme,然后回车就能看到labelme的前端UI界面了
(ps:在启动labelme时也可以指定很多参数,比如 --flags可以启动时指定有哪些类别,具体不在赘述,感兴趣的读者自行搜索)

labelme --flags F:\python\yolo系列\yolov1\flags.txt

在这里插入图片描述
之后OpenDir打开图片所在的文件夹路径,然后鼠标右键Create Rectangle夸夸框就完事了,之后会save为json格式的文件。(把自动保存打开的话会保存到图片的路径下如图:随便标了十五张)
在这里插入图片描述
如何你有仔细看过YOLOV1的论文会发现json根本不是我们训练所需要的格式,json多了很多无用的信息,甚至Rectangle也只标记了左上和右下两个点。别慌,我们用脚本转化一下:

import json
import osdef convert(img_size, box):x1 = box[0]y1 = box[1]x2 = box[2]y2 = box[3]center_x = (x1 + x2) * 0.5 / img_size[0]center_y = (y1 + y2) * 0.5 / img_size[1]w = abs((x2 - x1)) * 1.0 / img_size[0]h = abs((y2 - y1)) * 1.0 / img_size[1]return (center_x, center_y, w, h)def decode_json(jsonfloder_path, json_name):txt_name = jsonfloder_path + json_name[0:-5] + '.txt'txt_file = open(txt_name, 'w')  # te filesjson_path = os.path.join(json_folder_path, json_name)data = json.load(open(json_path, 'r'))img_w = data['imageWidth']  # json是一个字典的形式img_h = data['imageHeight']for i in data['shapes']:if (i['shape_type'] == 'rectangle'):x1 = int(i['points'][0][0])y1 = int(i['points'][0][1])x2 = int(i['points'][1][0])y2 = int(i['points'][1][1])if x1 < 0 or x2 < 0 or y1 < 0 or y2 < 0:continueelse:bb = (x1, y1, x2, y2)bbox = convert((img_w, img_h), bb)## 这里标签要对其if i['label'] == "person":txt_file.write("0 " + " ".join([str(a) for a in bbox]) + '\n')elif i['label'] == "plane":txt_file.write("1 " + " ".join([str(a) for a in bbox]) + '\n')elif i['label'] == "dog":txt_file.write("2 " + " ".join([str(a) for a in bbox]) + '\n')elif i['label'] == "cat":txt_file.write("3 " + " ".join([str(a) for a in bbox]) + '\n')elif i['label'] == "car":txt_file.write("4 " + " ".join([str(a) for a in bbox]) + '\n')elif i['label'] == "horse":txt_file.write("5 " + " ".join([str(a) for a in bbox]) + '\n')elif i['label'] == "can":txt_file.write("6 " + " ".join([str(a) for a in bbox]) + '\n')elif i['label'] == "train":txt_file.write("7 " + " ".join([str(a) for a in bbox]) + '\n')if __name__ == "__main__":json_folder_path = r'F:\python\yolo系列\yolov1\images'        # json的pathjson_names = os.listdir(json_folder_path)  # file namefor json_name in json_names:  # output all filesprint(json_name)if json_name[-5:] == '.json':  # just work for json filesdecode_json(json_folder_path, json_name)

不出意外的话会得到如下图所示的txt标签,这才是训练模型所需要的格式
在这里插入图片描述


http://www.ppmy.cn/news/1556182.html

相关文章

workman服务端开发模式-应用开发-gateway的onWebSocketConnect开发

一、onWebSocketConnect安全开发一 为什么叫安全开发一&#xff0c;是因为还有两种情况没有考虑好&#xff0c;需要实测中进行修改。第一种情况&#xff1a;个人如果打开两个窗口&#xff0c;访问同一个系统或个人如果打开两种浏览器&#xff0c;两个窗口同时访问一个系统&…

gpu硬件架构

1.简介 NVIDIA在视觉计算和人工智能&#xff08;AI&#xff09;领域处于领先地位&#xff1b;其旗舰GPU已成为解决包括高性能计算和人工智能在内的各个领域复杂计算挑战所不可或缺的。虽然它们的规格经常被讨论&#xff0c;但很难掌握各种组件的清晰完整的图景。 这些GPU的高性…

多线程----互斥

以下是关于多线程中互斥相关的详细知识点介绍以及C语言代码示例&#xff1a; 一、互斥的概念与重要性 在多线程编程中&#xff0c;多个线程可能会同时访问和操作共享资源&#xff08;如全局变量、共享的数据结构等&#xff09;。如果没有适当的控制机制&#xff0c;就可能导致…

Java 系统稳定性进阶之路:策略、实践与优化

前言 最近在做系统的稳定性治理&#xff0c;有一点心得和感悟&#xff0c;分享、记录和输出一下&#xff0c;走几步要回头看看&#xff0c;沉淀一下。 稳定性建设-八股文 H-热点(Hotkey)R-限流(RateLimiter)A-授权(Authorize)B-隔离(BulkHead)C-熔断(CircuitBreaker)(服务熔…

RK3588平台上YOLOv8模型转换与CentOS 7.8 Docker镜像拉取超时问题解决指南

RK3588平台上YOLOv8模型转换与CentOS 7.8 Docker镜像拉取超时问题解决指南 一、RK3588平台上YOLOv8模型从PT转换为RKNN 背景介绍 YOLOv8的原生模型包含了后处理步骤&#xff0c;其中一些形状超出了RK3588的矩阵计算限制&#xff0c;因此需要对输出层进行一些裁剪。本文将详细…

SpringCloud--SpringCloudAlibaba 对应的版本选择

SpringCloud--SpringCloudAlibaba 对应的版本选择 1、进入官网查看 输入Spring Cloud Alibaba官网_基于Springboot的微服务教程-阿里云 网址&#xff0c;选择文档->点击版本&#xff08;2023.x&#xff09; ​ 2、选择版本发布说明&#xff0c;可以看到Spring Cloud Ali…

禁用硬件合成 (Hardware Composer, HWC)

要禁用硬件合成 (Hardware Composer, HWC)&#xff0c;通常需要根据具体的设备平台和系统环境选择适合的方法。以下是通用的解决方案&#xff1a; 1. 修改系统属性 在 Android 系统中&#xff0c;可以通过设置系统属性来禁用 HWC 合成&#xff1a; a. 使用 setprop 命令临时禁…

3.2.1.2 汇编版 原子操作 CAS

基本原理说明 在 x86 和 ARM 架构上&#xff0c;原子操作通常利用硬件提供的原子指令来实现&#xff0c;比如 LOCK 前缀&#xff08;x86&#xff09;或 LDREX/STREX&#xff08;ARM&#xff09;。以下是一些关键的原子操作&#xff08;例如原子递增和比较交换&#xff09;的汇…