Yolo-Z

news/2024/12/5 13:30:46/

yolo太卷了...这里是改进的YOLOv5用于小目标检测

论文地址:https://arxiv.org/pdf/2112.11798.pdf

随着自动驾驶汽车和自动驾驶赛车越来越受欢迎,对更快、更准确的检测器的需求也在增加。

虽然我们的肉眼几乎可以立即提取上下文信息,即使是在很远的地方,但图像分辨率和计算资源的限制使得检测较小的对象(即在输入图像中占据小像素区域的对象)对机器来说是一项真正具有挑战性的任务和广阔的研究领域。

本研究探讨了如何修改流行的YOLOv5目标检测器以提高其在检测较小对象方面的性能,特别是在自主赛车中的应用。为了实现这一点,研究者研究了替换模型的某些结构元素(以及它们的连接和其他参数)如何影响性能和推理时间。为此,研究者提出了一系列不同尺度的模型,将其命名为“YOLO-Z”,当以50%的IoU检测较小的物体时,这些模型的mAP提升高达6.9%,而代价与原始YOLOv5相比,推理时间增加了 3ms。

研究者们的目标是为未来的研究提供有关调整流行检测器(例如YOLOv5)以解决特定任务的潜力的信息,并提供有关特定更改如何影响小物体检测的见解。这些发现应用于更广泛的自动驾驶汽车环境,可以增加此类系统可用的环境信息量。

检测图像中的小物体具有挑战性,主要是由于模型可用的分辨率和上下文信息有限。许多实现目标检测的系统都以实时速度执行此操作,从而对计算资源提出了特定要求,尤其是在处理要在捕获图像的同一设备上进行时。许多自动驾驶车辆系统就是这种情况,其中车辆本身实时捕获和处理图像,通常是为了通知其下一步行动。在这种情况下,检测较小的物体意味着检测距离汽车较远的物体,从而可以更早地检测到这些物体,有效地扩大了车辆的检测范围。这一特定领域的改进将更好地为系统提供信息,使其能够做出更稳健和可行的决策。由于目标检测器的性质,较小对象的细节在其卷积主干的每一层处理时失去了意义。在本研究中,“小物体”是指在输入图像中占据小像素区域的物体。

目前,已经有很多研究者努力改进对较小物体的检测[如An Evaluation of Deep Learning Methods for Small Object Detection],但许多都围绕着图像的特定区域进行处理或集中在two-stages检测器周围,这些检测器以实现以推理时间为代价获得更好的性能,使其不太适合实时应用程序。这也是为此类应用开发了如此多的单级检测器的原因。增加输入图像分辨率是绕过此问题的另一种明显方法,但会导致处理时间显着增加。

已经投入了一些努力来开发将处理导向输入图像的某些区域的系统,这使我们能够调整分辨率,从而绕过定义对象的像素较少的限制。然而,这种方法更适合对时间不敏感的系统,因为它们需要多次通过不同规模的网络。这种更加关注特定尺度的想法仍然可以激发我们处理某些特征图的方式。此外,通过查看如何处理特征图而不是仅仅修改主干可以学到很多东西。不同类型的特征金字塔网络(FPN)可以不同地聚合特征图,以不同方式增强主干。这种技术被证明是相当有效的。

YOLOv5框架

YOLOv5为其模型提供了四种不同的尺度,S、M、L和X,分别代表Small、Medium、Large和Xlarge。这些比例中的每一个都将不同的乘数应用于模型的深度和宽度,这意味着模型的整体结构保持不变,但每个模型的大小和复杂性都会按比例缩放。

在实验中,我们在所有尺度上分别对模型结构进行更改,并将每个模型视为不同的模型,以评估其效果。为了设置基线,我们训练并测试了YOLOv5四个未修改版本。然后,分别测试了对这些网络的更改,以便根据我们的基线结果分别观察它们的影响。在进入下一阶段时,那些似乎对提高准确性或推理时间没有贡献的技术和结构被过滤掉了。然后,尝试了所选技术的组合。重复这个过程,观察某些技术是相互补充还是相互削弱,并逐渐增加更复杂的组合。

Proposed architectural changes

YOLOv5使用yaml文件来指示解析器如何构建模型。我们使用此设置编写自己的高级指令,说明如何构建模型的不同构建块以及使用哪些参数,从而修改其结构。为了实现新结构,我们安排并为每个构建块或层提供参数,并在必要时指示解析器如何构建它。用我们的话来说,我们利用了YOLOv5提供的基础和实验网络块,同时在需要的地方实现了额外的块来模拟所需的结构。

其中,neck的修改:

在这项工作中,将当前的Pan-Net[Path aggregation network for instance segmentation]简化为FPN,并将其替换为biFPN[EfficientDet: Scalable and Efficient Object Detection]。在这两种情况下,neck都保留了类似的功能,但复杂性有所不同,因此实现它们所需的层数和连接数也有所不同。

其他修改可见论文。

可以在包含性和排他性的结构方面实现如何支持较小的特征图的示例

实验分析

Results of applying individual architectural changes to YOLOv5 at each scale

YOLOv5和YOLO-Z的比较

whaosoft aiot http://143ai.com 


http://www.ppmy.cn/news/213950.html

相关文章

Z变换(Z-transform)

Z变换(Z-transform) 定义 X ( z ) ∑ n − ∞ ∞ x ( n ) z − n x ( n ) 1 2 π j ∮ c X ( z ) z z − 1 d z X(z)\sum_{n-\infty}^{\infty}x(n)z^{-n}\\ x(n)\frac{1}{2\pi j}\oint_c X(z)z^{z-1}dz X(z)n−∞∑∞​x(n)z−nx(n)2πj1​∮c​X(z)zz−1dz 收敛域&#…

linux黑域补丁,努比亚Z17mini+Z17+Z17S Nubia6.0典藏版 独家黑域 ROOT XP 特别推荐

>>> 刷 机 须 知 <<< 【本ROM源于努比亚UI6.0制作,转载请注明出处】 如果你喜欢丰富的高级设置,那就不要继续往下看了,本ROM以简洁为主,纯净为本,追求最本真的一加 这也许是最简洁的ROM,因为仅仅针对用户喜欢的,来做了添加,删繁就简,快如闪电 如果你…

E. MinimizOR

题目E. MinimizOR 前置知识&#xff1a;线段树求区间最值、理论&#xff08;如果所有的数字都小于 2 k 2^k 2k &#xff0c;那么考虑区间中k1个最小的数字就可以找出 min ⁡ i ̸ j a i ∣ a j \min_{i\notj}{a_i|a_j} mini​j​ai​∣aj​ &#xff09; 证明&#xff1a;来…

【正点原子STM32连载】 第六十二章 UCOSII实验2-信号量和邮箱 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1

1&#xff09;实验平台&#xff1a;正点原子MiniPro H750开发板 2&#xff09;平台购买地址&#xff1a;https://detail.tmall.com/item.htm?id677017430560 3&#xff09;全套实验源码手册视频下载地址&#xff1a;http://www.openedv.com/thread-336836-1-1.html 4&#xff…

miniUI

miniUI笔记与问题 作为刚刚入职的小白&#xff0c;公司的很多项目都使用到miniUI&#xff0c;我自己接收的第一个比较正式的活便是关于miniUI的。 对于miniUI官方文档&#xff0c;我个人认为很不友好&#xff0c;易读性差。 mini.parse() 将html标签解析为miniui控件。 我们…

第一次刷机心得(努比亚Z17mini刷MIUI10)

自己有一个努比亚的手机&#xff0c;但是系统UI的优化太差了&#xff0c;会有一些小毛病&#xff08;比如通知栏白色等&#xff09;&#xff0c;除了当初觉得努比亚相机功能做的不错&#xff0c;但可能上一个用的是miui觉得努比亚的UI非常不习惯&#xff0c;所以萌生出了刷机这…

一键刷入twrp_努比亚Z17-Z17S-Z17mini 刷入MIUI10系统刷机教程

很对小伙伴们都问努比亚Z17系列如果刷入MIUI10&#xff0c;今天小编就和大家整理一下&#xff0c;根 据教程走&#xff0c;基本上可以完整刷好的 一、备份手机上需要的资料 刷机千万步&#xff0c;备份第一步&#xff0c;好好备份需要的资料&#xff0c;非常重要 二、解锁BL及刷…

win10动态桌面软件

win10动态桌面配置 分享一设置windows 10 利用软件设置实现动态桌面的效果&#xff1a; 其实&#xff0c;这需要一款软件&#xff0c;来实现&#xff0c;如果要似乎用正版&#xff0c;小伙伴可以购买序列号&#xff0c;有30天试用&#xff1b;但奈何money不足呀&#xff0c;经…