计算机视觉—YOLO V4

news/2025/1/13 3:38:40/

计算机视觉—YOLO V4

  • 1、YOLO V4
    • 1.1、网络结构
      • 1.1.1、BackBone:CSPDarknet53
      • 1.1.2、Neck:SPP结构
      • 1.1.3、Neck:PAN结构
      • 1.1.4、YOLO v4整体结构
    • 1.2、优化策略

1、YOLO V4

原论文下载地址:https://arxiv.org/abs/2004.10934

1.1、网络结构

相比之前的YOLOv3,改进了下Backbone,在Darknet53中引入了CSP模块(来自CSPNet)。在Neck部分,采用了SPP模块(Ultralytics版的YOLOv3 SPP就使用到了)以及PAN模块(来自PANet)。Head部分没变还是原来的检测头。
YOLO v4的网络结构包括的三部分:

  1. Backbone: CSPDarknet53
  2. Neck: SPP,PAN
  3. Head: YOLO v3

在这里插入图片描述

1.1.1、BackBone:CSPDarknet53

在YOLO v3中使用的主干网络是 Darknet53,在YOLO v4中运用的主干网络叫:CSPDarknet53,引入了CSP结构
CSP结构有什么具体的作用呢?原论文是这么说的:(换句话说就是YOLO v4的优点)

  • Strengthening learning ability of a CNN(增强CNN学习能力)
  • Removing computational bottlenecks(降低计算瓶颈)
  • Reducing memory costs(减少内存使用)

也就是说加入CSP结构以后不仅从网络上做了提升,还在物理性能上做了优化,减少显存的使用。

1、这个CSP结构来自于CSPDenseNet这篇论文,具体结构如何:如下图
在这里插入图片描述

通过CNN特征抽取的到特征层:

  1. 对于输入的特征层,首先分成两部分Part1,Part2(在通道方向进行均分操作)
  2. 对Part2分支首先通过一系列的DenseBlock,在通过Transition
  3. 将Patr1和Part2的输出进行一个融合,也就是concat拼接
  4. 拼接以后在通过Transition

但是YOLO v4中的CSP结构和CSPDenseNet的优点不一样:
在这里插入图片描述

  1. 分割方式不一样:在CSP模块之前进行一个下采样,下采样的结果进行两次1 x 1 x C(输入通道数的一半)的卷积,作为两个Part
  2. 在part2上接一系列的ResBlock,在通过1 x 1 x C的卷积层
  3. part2的结果与part1进行concat通道数上的拼接
  4. 拼接后的结果进行 1 x 1 x 2C的卷积

2、知道了CSP的结构以后,看一下CSPDarknet53的整体结构:
还是用上面提到的UP主的杰作

k代表卷积核的大小
s 代表步距
c 代表通过该模块输出的特征层channels
注意,CSPDarknet53 Backbone中所有的激活函数都是Mish激活函数
在这里插入图片描述
注意每一个ResBlock中的通道数发生了变化,作者在DownSample中的ResBlock就展开画了。并且DownSample1中的part分支并没有减半。从DownSample2才开始减半。

1.1.2、Neck:SPP结构

在这里插入图片描述

  1. 将特征层输入进行三个不同大小池化核的MaxPool2d
  2. 将1得到的三个输出与SPP输入特征层进行Concat拼接

通过SSP结构在一定程度上解决多尺度问题

1.1.3、Neck:PAN结构

PAN(Path Aggregation Network)结构其实就是在FPN(从顶到底信息融合)的基础上加上了从底到顶的信息融合,如下图(b)所示。图中最左边的部分就是BackBlone主干网络。
在这里插入图片描述
但YOLOv4的PAN结构和原始论文的融合方式又略有差异,如下图所示。图(a)是原始论文中的融合方式,即特征层之间融合时是直接通过相加的方式进行融合的,但在YOLOv4中是通过在通道方向Concat拼接的方式进行融合的。
在这里插入图片描述

1.1.4、YOLO v4整体结构

还是采用UP主:太阳花的小绿豆的图片https://blog.csdn.net/qq_37541097/article/details/123229946?spm=1001.2014.3001.5502
在这里插入图片描述

1.2、优化策略

待更新。。。。。。。。。。


http://www.ppmy.cn/news/163193.html

相关文章

报错解决——腾讯QQ安装无法正常安装

安装QQ时遇到此报错, 目录没有写入权限: 解决办法: 修改注册表 1.打开“运行”,输入regedit 按下列顺序打开 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\StorageDevicePolicies] ①若有该文件 此时会看到右边的条目…

java怎么连接手机软件_如果是山寨机支持JAVA怎么用电脑往手机上下载软件

目前国内的大多数国产手机均支持mpr格式软件!也许你的手机就支持,只是你没有发现,本文将教你如何测试或安装! MRP格式的手机QQ2008软件介绍:较QQ2007,QQ2008支持,支持好友分组,且可显…

彩虹QQ显IP v2.5 正式版支持QQ2008正式版

彩虹显IP是新一代的腾讯QQ辅助增强软件。兼容QQ2008正式版等主流QQ版本。 主要特色: 1.显QQ好友IP地址 2.显QQ隐身好友、隐身好友蓝名显示、靠前排序 3.繁体字输入法、聊天可设置自动加前后缀符号 4.可设置简化QQ界面、屏蔽QQ侧边栏 5.老板键、虚拟摄像头功能 6.无广…

ubuntu9.10稳定运行QQ2008和迅雷

支持组件 1.首先确定装上了wine和cabextract,如果没有安装,执行如下命令安装 sudo apt-get wine sudo apt-get install cabextract 2.用winetricks(见附件)安装一些组件,命令如下 sh winetricks msxml3 gdiplus riched…

破解QQ2008会员涂鸦QQ表情

非会员也能用QQ编辑 QQ表情 具体方法如下: 用UltraEdit打开QQ2008安装目录中的QQhelper.dll文件,查找C36880000000(如图),在这前面第七个开始,改为B8010000009090可以了。 UltraEdit下载地址: h…

去掉QQ2008的腾讯迷你首页和聊天时的广告

一、去除QQ聊天窗口右上角的广告 首先找到QQ的安装目录:比如我的QQ安装在C:\Program Files\Tencent\QQ\NewSkins\QQ2008\IMSkin(根据妳正在使用的版本有关,2007版好像在C:\Program Files\QQ\NewSkins\QQ2007) 找到IMSkin.ini这个文…

IT资源下载

fromhttp://topic.csdn.net/u/20090116/14/bbe94537-4d1a-44e3-b4bb-01e8c4bd5998.htmlgoogle北电华为腾讯网易迅雷中兴试题及面试经验 sql语句妙用,各种sql语句的详细用法与讲解 仿QQ2008聊天程序(c#源码) 要想精通java必须看的经典书籍(强顶&#x…

apk改之理 java源码_ApkIDE改之理最新版+环境包下载

【实例简介】 ApkIDE改之理最新版环境包下载 【实例截图】 【核心代码】 ec93e511-2306-457d-90f2-c1fa4bf55175 └── ApkIDE ├── aapt.exe ├── adb.exe ├── AdbWinApi.dll ├── AdbWinUsbApi.dll ├── APKIDE七少月DES加密解密工具.exe ├── APKIDE七少月ELF…