Datawhale第五期夏令营-CV竞赛

news/2024/9/17 20:56:11/ 标签: python, 计算机视觉

CV竞赛

  • 0.赛事报名
    • 租用4090
  • 1.开始运行
    • 下载文件提交结果
  • 2.内容解释
    • 赛题背景
    • 赛题目标
    • 社会价值
    • 评分规则
    • baseline精读代码
      • 什么是YOLO
    • 主要代码内容精读
    • 使用Ultraalytics运行代码

0.赛事报名

赛事官网:https://www.marsbigdata.com/competition/details?id=3839107548872

租用4090

使用到的平台为厚德云:https://portal.houdeyun.cn/console/apparatus/gpu/generic
选择新建
在这里插入图片描述
选择合适的进行下载
在这里插入图片描述
选择环境,然后立即下单:
在这里插入图片描述

1.开始运行

下面就可以进行正常的使用
打开终端,输入如下代码:

apt install git-lfs
git lfs install
git clone https://www.modelscope.cn/datasets/Datawhale/AI_Camp5_baseline_CV.git

在这里插入图片描述
这一步主要的作用就是为了下载数据集
然后选择task1.ipynb进行运行即可
在这里插入图片描述

下载文件提交结果

然后将result.zip进行下载然后上传到比赛官网的提交平台上即可,以下是我的运行结果:

在这里插入图片描述

2.内容解释

赛题背景

城市治理赛道——随着城市化进程的加快,城市管理面临着前所未有的挑战。占道经营、垃圾堆放和无照经营游商等问题对城市管理提出了更高的要求。本赛道聚焦城市违规行为的智能检测,要求选手研究开发高效可靠计算机视觉算法,提升违规行为检测识别的准确度,降低对大量人工的依赖,提升检测效果和效率,从而推动城市治理向更高效、更智能、更文明的方向发展,为居民创造一个安全、和谐、可持续的居住环境。

赛题源自于生活当中的对城市违规的行为进行智能检测,要求要提出更加高效率的方法来保障人们的生活

赛题目标

利用图像处理和计算机视觉技术 开发一套智能识别系统,自动检测分类摄像头捕获的视频中,城市管理中的违规行为

社会价值

通过对摄像头捕获的视频进行分析,自动准确识别违规行为,并及时向管理部门发出告警,以实现更高效的城市管理。

评分规则

主要使用到的评分方法如下:
F1score  = 2 Recall  ∗ Precision  Recall  + Precision  MOTA  = 1 − ∑ F N + F P + I D S W ∑ G T score  = 0.8 5 ∗ F1score  + 0.1 5 ∗ MOTA  \begin{array}{c} \text { F1score }=2 \frac{\text { Recall } * \text { Precision }}{\text { Recall }+ \text { Precision }} \\ \text { MOTA }=1-\frac{\sum F N+F P+I D S W}{\sum G T} \\ \text { score }=0.85^{*} \text { F1score }+0.15^{*} \text { MOTA } \end{array}  F1score =2 Recall + Precision  Recall  Precision  MOTA =1GTFN+FP+IDSW score =0.85 F1score +0.15 MOTA 

对每个json文件得到两个指标的加权求和,最终得分为所有文件得分取均值。
注1:若真实目标框与预测框IOU大于0.5,则判定目标正确识别。若MOTA指标为负,则该类别精度得分为0。
注2:若该视频中没有某个类别的目标,则此类别计算均值时,忽略该视频。

baseline精读代码

什么是YOLO

yolo是一种目标检测算法,全称为"You Only Look Once"表示你只需要看一次,这个也是给该系统起了一个非常顺口且好记的名字,也表明了作者对于他们所提出的模型有极高的自信,yolo也算是在工业界应用较为广泛的一个目标检测算法了,因为它的成本以及效率相对来说还是比较可观的
在这里插入图片描述

主要代码内容精读

主要是对如何将给到的视频分解成图片然后分析(内容写在了代码当中),如下:

python"># 读取训练集视频
for anno_path, video_path in zip(train_annos[:5], train_videos[:5]):print(video_path)anno_df = pd.read_json(anno_path)cap = cv2.VideoCapture(video_path)#利用cv2对视频当中的内容进行截断和读取frame_idx = 0 #标注对应帧,表示读取从0开始# 读取视频所有画面while True:ret, frame = cap.read()if not ret:breakimg_height, img_width = frame.shape[:2]# 将画面写为图frame_anno = anno_df[anno_df['frame_id'] == frame_idx]cv2.imwrite('./yolo-dataset/train/' + anno_path.split('/')[-1][:-5] + '_' + str(frame_idx) + '.jpg', frame)#上述内容完成了从视频向图片的转换,更加有利于模型的分析# 如果存在标注if len(frame_anno) != 0:with open('./yolo-dataset/train/' + anno_path.split('/')[-1][:-5] + '_' + str(frame_idx) + '.txt', 'w') as up:for category, bbox in zip(frame_anno['category'].values, frame_anno['bbox'].values):category_idx = category_labels.index(category)# 计算yolo标注格式x_min, y_min, x_max, y_max = bboxx_center = (x_min + x_max) / 2 / img_width#提取x中心点y_center = (y_min + y_max) / 2 / img_height#提取y中心点width = (x_max - x_min) / img_widthheight = (y_max - y_min) / img_heightif x_center > 1:print(bbox)up.write(f'{category_idx} {x_center} {y_center} {width} {height}\n')frame_idx += 1#每完成一次就加1,运行下一帧的内容

使用Ultraalytics运行代码

Ultraalytics提供多个计算机视觉的模型库,如下图所示:

python">from ultralytics import YOLO# 设置模型版本
model = YOLO("yolov8n.pt") # 设定数据集和训练参数
results = model.train(data="yolo-dataset/yolo.yaml", epochs=2, imgsz=1080, batch=16)

http://www.ppmy.cn/news/1517069.html

相关文章

密码强度验证——js基础积累

//密码强度等级 getPwdLevel:function (pwd,minLength8) {var level 0;if (pwd.length < minLength) return level;if (/\d/.test(pwd)) level; //数字if (/[a-z]/.test(pwd)) level; //小写if (/[A-Z]/.test(pwd)) level; //大写if (/\W/.test(pwd)) level; //特殊字符ret…

第四章:照相机模型与增强现实

目录 1 针孔照相机模型 1.1 照相机矩阵 1.2 三维点的投影 1.3 照相机矩阵的分解 1.4 计算照相机中心 2 照相机标定 3 以平面和标记物进行姿态估计 4 增强现实 4.1 PyGame和PyOpenGL 4.2 从照相机矩阵到OpenGL格式 4.3 在图像中放置物体 1 针孔照相机模型 针孔照相机…

MYSQL集群技术

---------------第一部分---------------------- 一.mysql源码部署 环境&#xff1a;rhel7.9 1.1.下载安装包 官网&#xff1a;http://www.mysql.com 1.2.在linux下部署mysql 1.创建登录用户和数据目录&#xff0c;并给数据目录赋权&#xff0c;因为配置文件读取需要权限&…

WPF中如何根据数据类型使用不同的数据模板

我们在将一个数据集合绑定到列表控件时&#xff0c;有时候想根据不同的数据类型&#xff0c;显示为不同的效果。 例如将一个文件夹集合绑定到ListBox时&#xff0c;系统文件夹和普通文件夹分别显示为不同的效果&#xff0c;就可以使用模板选择器功能。 WPF提供了一个模板选择…

机器学习-训练集、验证集、测试集(附:分割方法+交叉验证)【随记】

训练集、验证集、测试集&#xff08;附&#xff1a;分割方法交叉验证&#xff09; 1. 训练集&#xff08;Training Set&#xff09; 2. 验证集&#xff08;Validation Set&#xff09; 3. 测试集&#xff08;Test Set&#xff09; 4. 数据集的分割方法 5. 交叉验证&#x…

2024.8.15(python管理mysql、Mycat实现读写分离)

一、python管理mysql 1、搭建主mysql [rootmysql57 ~]# tar -xf mysql-5.7.44-linux-glibc2.12-x86_64.tar.gz [rootmysql57 ~]# cp -r mysql-5.7.44-linux-glibc2.12-x86_64 /usr/local/mysql [rootmysql57 ~]# rm -rf /etc/my.cnf [rootmysql57 ~]# mkdir /usr/local/mysql…

pdf与canvas结合使用的场景1——为pdf增加水印

title: pdf与canvas结合使用的场景 date: 2024-08-28 10:03:45 tags: javascript 场景1:生成新的pdf水印 添加水印场景分析 这种情况下&#xff0c;不用再次封装好的一些水印工具的话&#xff0c;纯vue3前端的话就是使用pdfjscanvas来生成。 思路&#xff1a;1.上传并读取p…

《第二十八章:性能优化 - 电量优化》

一、引言 在 Android 应用开发中&#xff0c;电量优化是提升用户体验、延长设备续航的重要环节。一个电量消耗过高的应用可能会导致用户不满&#xff0c;甚至卸载。在这一章中&#xff0c;我们将重点探讨如何通过合理使用传感器和优化网络请求来降低应用的电量消耗。 二、合理使…

Tower for Mac Git客户端管理软件

Mac分享吧 文章目录 效果一、下载软件二、开始安装1、双击运行软件&#xff0c;将其从左侧拖入右侧文件夹中&#xff0c;等待安装完毕2、应用程序显示软件图标&#xff0c;表示安装成功 三、运行测试1、打开软件&#xff0c;测试2、克隆项目&#xff0c;测试 安装完成&#xf…

java-Mybatis框架02

1.#{} 和${}区别 #{} 是占位符&#xff0c;是采用编译方式向sql中传值&#xff0c;可以防止sql注入&#xff0c;如果往sql中传值&#xff0c;使用#{}${} 是将内容直接拼接到sql语句中&#xff0c;一般不用于向sql中传值&#xff0c;一般用于向sql中动态传递列名。区别&#xff…

代理IP的来源、工作原理与应用

在数字化时代&#xff0c;代理IP已经成为网络活动中不可或缺的一部分&#xff0c;尤其在跨境电商、网络营销、网络爬虫等领域&#xff0c;代理IP发挥着至关重要的作用。本文将深入探讨代理IP的来源、工作原理、应用以及潜在风险&#xff0c;帮助读者更好地理解并合理利用这一网…

Git下载安装配置

Git的下载与安装 Git是一种分布式版本控制系统&#xff0c;用于跟踪文件和文件夹的变化。它最初由Linus Torvalds开发&#xff0c;用于管理Linux内核的源代码。Git的设计目标是&#xff1a;速度快、开发效率高、数据完整性和可靠性强。 Git通过创建一个存储库&#xff08;rep…

(一) 初入MySQL 【认识和部署】

前置资源 一、数据库概述 1.1、数据库基本概念 数据(Data) 描述事物的符号记录称为数据。数字、文字、图形、图像、声音、档案记录等都是数据。数据是以“记录”的形式按照统一的格式进行存储的&#xff0c;而不是杂乱无章的。 相同格式和类型的数据统一存放在一起&#xff0…

Python实现RSA加解密算法

目录 深入了解RSA加密算法一、RSA算法概述1.1 关键步骤1.2 安全性分析 二、RSA算法的Python实现2.1 辅助函数2.2 密钥生成2.3 加密与解密2.4 使用示例 三、总结 深入了解RSA加密算法 RSA&#xff08;Rivest-Shamir-Adleman&#xff09;是一种非对称加密算法&#xff0c;由Ron …

如何快速熟悉一个软件

当入职一家新公司时&#xff0c;必然要熟悉一些新的软件项目&#xff0c;这个时候&#xff0c;如何才能快速熟悉软件项目&#xff0c;以达到快速上手的目的。 1大忌 还记得自己刚毕业的第一份工作&#xff0c;一上来就去看代码&#xff0c;看代码的细节。在看代码的时候&…

[C++]set和map的介绍及使用

关于set和map的接口函数部分&#xff0c;只重点介绍一些相较于别的容器有特殊地方的接口&#xff0c;set和map的接口可以触类旁通。 一、概念 &#xff08;一&#xff09;、关联式容器 关联式容器存储的元素是一个个的键值对<key,value>。通过键&#xff08;key&#x…

MATLAB 生成指定范围、角度、厚度的含噪平面点云(77)

模拟生成点云并可视化显示,可以验证算法有效性,尤其是针对验证算法的某方面 MATLAB 生成指定范围、角度、厚度的含噪平面点云(77) 一、算法介绍二、使用步骤1.代码2.效果一、算法介绍 如题,模拟生成一组平面点云,含有噪声点,确定算法稳定性,可以指定生成平面的范围,厚…

Java集合—Map系列集合(习题一)

文章目录 Java集合—Map集合&#xff08;习题&#xff09;1.使用泛型修改根据学员姓名找学员对象2.运用Map的三种遍历方式进行遍历迭代器遍历键值对遍历增强遍历 综合要求 Java集合—Map集合&#xff08;习题&#xff09; 1.使用泛型修改根据学员姓名找学员对象 2.运用Map的三…

【JAVA]DAY 2在网页中输出日期和时间,实时还是静止?

一、如何输出日期文本 使用document.write(Date()); 会在网页中输出当前的日期和时间。在 2024 年 8 月 28 日星期三执行这段代码&#xff0c;可能会输出类似 “Wed Aug 28 2024 [具体时间]” 这样的内容。 Date()是 JavaScript 中的一个内置对象&#xff0c;用于处理日期和…

UE5 多个类选择界面生成

在Unreal Engine 5 (UE5) 中&#xff0c;如果你想要创建一个可以选择多个类的界面&#xff0c;你可以使用SClassPicker小部件。以下是一个简单的例子&#xff0c;展示如何在UE5的编辑器模块中创建一个自定义的编辑器工具栏按钮&#xff0c;并打开一个类选择器。 #include &quo…