- 快速通道:https://blog.csdn.net/u014608435/article/details/144497816
介绍
YOLOv4(You Only Look Once v4)是YOLO系列目标检测算法的又一个重要版本,它在2020年由Alexey Bochkovskiy、Chien-Yao Wang和Hong-Yuan Mark Liao提出。YOLOv4在保持实时性能的同时,进一步提升了检测精度,尤其是在小物体检测方面。以下是YOLOv4的主要特点和改进:
主要改进
- 增强的特征提取网络
- CSPDarknet53:YOLOv4采用了CSPDarknet53作为其主干网络。CSPNet(Cross Stage Partial Network)通过分隔梯度路径来减少计算量并提高学习效率,同时引入了残差结构以促进信息流动。这种设计不仅提高了模型的准确性,还减少了所需的训练时间。
- 强大的颈部设计
- SPP(Spatial Pyramid Pooling):空间金字塔池化层被用于捕捉不同尺度的上下文信息。
- PANet(Path Aggregation Network):路径聚合网络增强了特征融合,促进了低层次的空间信息与高层次的语义信息之间的交流,从而改善了多尺度目标检测的能力。
- 先进的激活函数和正则化技术
- Mish 激活函数:YOLOv4引入了Mish作为激活函数,相比ReLU,Mish可以提供更好的非线性映射能力,并有助于缓解梯度消失问题。
- CIoU Loss:为了更精确地调整边界框的位置,YOLOv4使用了CIoU损失函数,该函数综合考虑了IoU、中心点距离以及长宽比差异。
- 数据增强
- Mosaic Data Augmentation:YOLOv4引入了一种名为Mosaic的数据增强方法,这种方法将四张不同的图片拼接成一张大图进行训练,增加了样本多样性,有助于提高模型对复杂场景的理解。
- Self-Adversarial Training (SAT):这是一种对抗性的自我训练机制,旨在使模型更加鲁棒,能够更好地应对测试时可能遇到的各种变化。
- Bag of Freebies 和 Bag of Specials
- Bag of Freebies:指的是那些可以在不增加推理成本的情况下提升模型性能的技术,如CutMix、MixUp等。
- Bag of Specials:包括了一系列专门用于优化检测任务的方法,比如上面提到的Mish激活函数、CIoU Loss等。
性能提升
YOLOv4在多个基准数据集上实现了优异的表现,特别是在COCO数据集上的平均精度(mAP)显著高于前代产品和其他竞争模型。此外,它仍然保持了极高的速度优势,能够在普通GPU上实现实时检测。
网络架构
- CSPDarknet53:作为主干网络,负责提取图像特征。
- SPP + PANet:构成“颈部”,加强特征融合和多尺度表示。
- YOLOv3 Head:最终输出预测结果的部分,保留了YOLOv3中有效的头部设计,但结合了上述改进点。
整体介绍
- 虽然作者换了,但精髓没变
- 如果CV界有劳模奖,一定非他莫属
- 整体看还是那个味,细还是他细
- 江湖传闻最高的武功:嫁衣神功
V4贡献
Bag of freebies(BOF)
Mosaic data augmentation
数据增强
Self-adversarial-training(SAT)
DropBlock
Label Smoothing
IOU损失
GIOU损失
DIOU损失
CIOU损失
DIOU-NMS
SOFT-NMS
Bag of specials(BOS)
SPPNet(Spatial Pyramid Pooling)
CSPNet(Cross Stage Partial Network)
CBAM
Spatial attention module
PAN(Path Aggregation Network)