基于YOLOv5的教室人数检测统计系统

news/2024/12/23 6:03:53/

基于YOLOv5的教室人数检测统计系统可以有效地用于监控教室内的学生数量,适用于多种应用场景,比如

以下是如何构建这样一个系统的概述,包括环境准备、数据集创建、模型训练以及如何处理不同类型的媒体输入。

代码布置

.
├── dataset # 数据集
│   ├── annotations # XML 标签
│   ├── images # 图片
│   └── labels # txt 标签
├── detect.sh # detect shell 脚本
├── hellodata.py # 数据探索、预处理
├── LICENSE
├── README.md
├── res
│   ├── demo_picture1.png # 样例图片
│   └── demo_picture2.png
├── runs
│   ├── detect # 训练后的文件结果
│   └── train # 训练后的权重
├── train.sh # train shell 脚本
├── xml2txt.py # 将 XML 转换为 txt 标签
└── yolov5 # 从 @ultralytics/yolov5 clone├── data│   ├── coco.yaml│   ├── headset.yaml # 自定义训练集│   ├── hyp.scratch.yaml│   ├── images # 存放 detect 输入数据│   │   ├── bus.jpg│   │   └── zidane.jpg│   └── videos # 存放 detect 输入数据├── detect.py├── Dockerfile├── hubconf.py├── models # 预训练模型 YAML 文件├── requirements.txt # Python 依赖库├── test.py├── train.py├── utils└── weights # 预训练权重

数据排布

目标检测 (Object Detection) 在教室人数统计上的应用尝试
先借助 YOLOv5 预训练模型对图片数据集进行训练,再测试多种输入流
数据集下载:Classroom Monitoring Dataset - kaggle
images 图片

partA 2000张,格式: [PartA_num].jpg
partB 2405张,格式:[PartB_num].jpg
annotations 标签,标注了图片中 目标的类别和坐标位置
partA 2000条,格式:[PartA_num].xml
partB 2405条,格式:[PartB_num].xml

主要工具包版本为 PyTorch 1.7.1+cu110 和 Python 3.8.5

代码运行

安装 Python 库依赖:pip3 install -r yolov5/requirements.txt
下载预训练权重,把下载的 .pt 文件部署在 yolov5/weights/ 路径下

代码训练

为了方便执行,编写了脚本 detect.sh 和 train.sh,分别进行训练与预测测试
根据训练效果调整 train.sh 文件中常用参数:

-epochs # 训练的 epoch,默认值 300
--batch-size # 默认值 16
--cfg yolov5s.yaml --weights '' # 从头开始训练
--cfg yolov5s.yaml --weights yolov5s.pt # 从预训练模型开始训练
--data # 数据集的配置文件,默认为 data/coco128.yaml
--resume # 是否从最新的 last.pt 中恢复训练,布尔值
--evolve # 进化超参数 (Evolve Hyperparameters),布尔值
--cache-images # 缓存图片可以更快的开始训练,布尔值
--weights # 初始化参数路径,默认值 ''
--adam # 使用 adam 优化器,布尔值

一般只需改动这两个脚本文件就可,如需训练自定义的数据集,请参考官方文档:Train Custom Data - YOLOv5 Documentation

其他

自定义数据集
观察数据
数据集大小
数据集样本
图像分辨率
数据预处理
数据清洗,观察发现,有一些图像的 label 存在缺失,在 XML 转换 TXT 的过程中一并丢弃
YOLOv5 原生预处理
搭建模型,可视化分析

分析与调整训练,提高模型泛化能力

结果

多视角 稳定识别!
demo 的 detect 结果:
在这里插入图片描述

最后

计算机视觉、图像处理、毕业辅导、作业帮助、代码获取,远程协助,代码定制,私聊会回复!

http://www.ppmy.cn/news/1528405.html

相关文章

notepad++的json查看

json文件查看 因为接触到3dtile模型,所以经常需要和json打交道,但是很多模型是下面这种情况,不好阅读,所以可以使用notepad的插件查看 正常打开是这样的 加载notepad插件 搜索json下载安装就可以了 如果网络抽象,下载…

内网渗透- 内网渗透的基本知识

攻击流程讲解 内网介绍 内网也指局域网,是指在某一区域内由多台计算机互联而成的计算机组,组网范围通常在数千米以内。在局域网中,可以实现文件管理、应用软件共享、打印机共享、工作组内的日程安排、电子邮件和传真通信服务等。内网是封闭的…

平安养老险阜阳中心支公司开展金融教育宣传专项活动

为全面深入开展“金融教育宣传月”的各项工作,不断完善金融惠民利民举措,提升金融服务质效,帮助基层群众增强维权意识、防非反诈的自我保护能力。近日,平安养老保险股份有限公司(以下“平安养老险”)阜阳中…

WPF DataGrid 赋值与修改

WPF DataGrid 赋值与修改 下方绑定给 DataGrid 控件的类模型public record DataGridModel{public string GongNeng{get; set;}public DataGridModel(string gongNeng){GongNeng gongNeng;}}一、DataGrid 绑定对应的属性 DataGrid 绑定列,将对应的属性绑定给对应的…

07_Python数据类型_集合

Python的基础数据类型 数值类型:整数、浮点数、复数、布尔字符串容器类型:列表、元祖、字典、集合 集合 集合(set)是Python中一个非常强大的数据类型,它存储的是一组无序且不重复的元素,集合中的元素必须…

css实现居中的方法

水平居中 1. 行内设置text-align 给父元素设置text-align为center,一般用于实现文字水平居中 2. 给当前元素设置margin:0 auto 原理:块级独占一行,表现为在水平方向上占满整个父容器,当水平方向padding,…

2.Seata 1.5.2 集成Springcloud-alibaba

一.Seata-server搭建已完成前提下 详见 Seata-server搭建 二.Springcloud 项目集成Seata 项目整体测试业务逻辑是创建订单后(为了演示分布式事务,不做前置库存校验),再去扣减库存。库存不够的时候,创建的订单信息数…

Lua发邮件:实现自动化邮件发送教程指南!

Lua发邮件高级技巧有哪些?如何利用Lua发送电子邮件? 自动化邮件发送是一个非常实用的功能,广泛应用于各种场景,如通知、提醒、报告生成等。Lua作为一种轻量级脚本语言,因其简洁和高效而受到广泛欢迎。AokSend将详细介…