YOLOv8改进 | 主干篇,YOLOv8改进主干网络为GhostNetV2(华为的轻量化架构)

news/2024/10/21 11:46:14/

在这里插入图片描述


摘要

在这里插入图片描述

摘要:轻量级卷积神经网络(CNN)专为移动设备上的应用而设计,具有更快的推理速度。卷积操作只能在窗口区域内捕捉局部信息,这限制了性能的进一步提升。将自注意力引入卷积可以很好地捕捉全局信息,但会极大地拖累实际速度。本文提出了一种硬件友好的注意力机制(称为 DFC 注意力),并展示了一种用于移动应用的新 GhostNetV2 架构。提出的 DFC 注意力基于全连接层构建,不仅能在常见硬件上快速执行,还能捕捉远距离像素之间的依赖关系。作者进一步重新审视了之前 GhostNet 中的表达瓶颈,并提出通过 DFC 注意力增强由廉价操作生成的扩展特征,使得 GhostNetV2 块能够同时聚合局部和远距离信息。


理论介绍

GhostNetV2 提供了以下几种常见的模型权重,不同宽度缩放因子(Width Scaling):

  • 1.0x: 标准模型。
  • 1.3x: 模型深度比1.0x更深。
  • 1.6x: 更大的模型版本,适用于计算资源较多的设备。

大家可以根据不同场景选择合适的模型宽度缩放因子,本文选择 1.0,具体可见第二章的代码。

GhostNet、GhostNetV2、GhostNetV3 模型在 参数量(M)、FLOPs(M)及 ImageNet 的 top1 结果对比情况如下:
在这里插入图片描述

GhostNetV1 和 GhostNetV2 架构示意图如下图所示。Ghost 块是一个反向残差瓶颈,包含两个 Ghost 模块,其中 DFC 注意力增强了扩展特征以提高表达能力。
在这里插入图片描述
GhostNetV1 是一种轻量化模型,通过“Ghost 模块”减少冗余计算。Ghost 模块将 1×1 卷积和深度卷积结合在一起,生成一部分特征图后,通过廉价的操作生成剩余的特征图。这一设计虽然大幅减少了计算成本,但也削弱了模型捕捉空间信息的能力。
GhostNetV2 架构通过引入 DFC 注意力,提升了网络的表达能力,同时保持了在移动设备上的高效性。DFC 注意力机制使用两个解耦的全连接层来处理特征图的水平和垂直方向。通过将输入特征图沿水平方向和垂直方向进行特征聚合,DFC注意力机制能够捕捉到全局信息,并提升模型的表达能力。DFC注意力的计算过程如下:

  • 将输入特征图 Z 视为多个 token,并通过全连接层生成注意力图。
  • DFC 将计算过程分解为两个步骤:首先沿水平方向进行特征聚合,然后沿垂直方向进行聚合,最终生成注意力图。
  • 将 Ghost 模块输出的特征与 DFC 注意力图进行点乘,生成最终的输出特征。

DFC 注意力的信息流,如下图所示,水平和垂直的全连接层分别沿两个方向捕捉长距离信息。
在这里插入图片描述


http://www.ppmy.cn/news/1532796.html

相关文章

Linux操作系统中dubbo

1、简介 dubbo框架是做微服务通信的,是由阿里巴巴开发,后捐赠给阿帕奇基金会。 2、与OpenFeign的区别 dubbo是采用RPC协议实现微服务通信,OpenFeign是采用Http请求的方式实现的。 OpenFeign 最简单的,就是Spring公司开发的&am…

php email功能实现:详细步骤与配置技巧?

php email发送功能详细教程?如何使用php email服务? 无论是用户注册、密码重置,还是订单确认,电子邮件都是与用户沟通的重要手段。AokSend将详细介绍如何实现php email功能,并提供一些配置技巧,帮助你更好…

联邦学习(三只决策和大数据分析)(学习笔记)

联邦学习模型按照数据重叠形式分成了三类,分别是横向联邦学习、纵向联邦学习和联邦迁移学习。 横向联邦学习模型针对特征一致但ID不一致的数据; 纵向联邦学习模型针对ID一致但特征不一致的数据; 联邦迁移学习模型针对ID和特征都不一致的数据。…

对比学习训练是如何进行的

对比学习(Contrastive Learning)是一种自监督学习的方法,旨在通过拉近相似样本的表示、拉远不相似样本的表示来学习特征表示。在训练过程中,模型并不依赖标签,而是通过样本之间的相似性进行学习。以下是对比学习的基本…

基于ESP8266—AT指令连接阿里云+MQTT透传数据(3)

MQTT_RX设备为接收(订阅)数据的Topic,使用ESP8266通过AT指令实现。 首先需要串口通信软件,如 SSCOM、PuTTY、SecureCRT 等串口调试工具,功能丰富,支持常见的串口调试功能,用于发送AT指令。 以下是ESP8266通过AT指令连接阿里云MQTT服务的步骤: 1、初始化WiFi 发送下面…

RabbitMQ高级特性-持久性

对于RabbitMQ的可靠性机制 引入:当RabbitMQ服务停掉以后, ⽣产者发送的消息不丢失呢. 默认情况下, RabbitMQ 退出或者由于某种原因崩溃时, 会忽视队列和消息, 除⾮告知他不要这么做。 RabbitMQ的持久化分为三个部分:交换器的持久化、队列的持久化和消息的持久化。…

AI换脸技术新纪元:直播与视频创作的新利器

在数字媒体时代,实时面部交换技术正变得越来越流行。它不仅为视频创作者提供了新的表达方式,也为直播行业带来了革命性的变化。以下是一些目前市场上领先的实时面部交换软件: 🌟 FaceFusion FaceFusion 是一款功能强大的实时面部…

实用工具推荐---- PDF 转换

直接上链接:爱PDF |面向 PDF 爱好者的在线 PDF 工具 (ilovepdf.com) 主要功能如下: 全免费!!!!