SSD7~

news/2024/10/31 3:27:35/

又搬来了一个适合嵌入式的框架哦

对计算和内存的高需求是将现有目标检测网络部署到嵌入式设备中的最大挑战。现有的轻量级目标检测器直接使用轻量级神经网络架构,如MobileNet或在大尺度分类数据集上预先训练,导致网络结构灵活性差,不适用于某些特定场景。

在今天分享中,有研究者提出了一种轻量级目标检测网络Single-Shot MultiBox Detector(SSD)7种特征融合和注意机制(FFAM),该网络通过减少卷积层数,节省了存储空间,减少了计算量。研究者有提出了一种新的特征融合和注意机制(FFAM)方法来提高检测精度。首先,FFAM方法将高级语义信息丰富的特征图与低级特征图进行融合,提高了小目标的检测精度。采用由通道和空间注意模块级联的轻量级注意机制,增强目标的上下文信息,引导网络关注其易于识别的特征。

在NWPU VHR-10数据集上,SSD7-FFAM实现了83.7%的mAP、1.66MB参数和0.033s的平均运行时间。结果表明,该SSD7-FFAM更适合于部署到嵌入式设备上进行实时目标检测。

如果这种技术应用在现在的幼儿园,再和行为识别共同作用,是不是就可以保障小孩子的安全及行迹跟踪。

近年来,对可应用于嵌入式设备的轻量级目标检测网络的研究吸引了越来越多的研究者。不同的人工设计的轻量级神经网络架构已被用于目标检测,如谷歌提出的轻量级网络架构MobileNet,它使用深度可分离卷积而不是标准卷积。Face++通过逐点群卷积核信道变换技术,提出了ShuffleNet。

 

由Iandola等人介绍的SqueezeNet,它由两个部分组成,一个压缩层(压缩)和一个膨胀层(膨胀),通过减少压缩层中的通道数,减少了整个模型所需的计算量。AF-SSD应用了MobileNetV2和额外的卷积层,以ShuffleNetV2和深度可分离卷积作为轻量级主干。实验结果表明,AF-SSD是一种快速、准确、参数较少的检测器。许多其他研究表明,使用这些轻量级网络作为主干的目标探测器取得了最先进的结果。然而,这些轻量级网络在使用它们作为目标检测的主干网络之前,需要在通用数据集如ImageNet上进行预训练。预训练通常在一般图像分类任务的数据集上进行,因此很难将它们移植到特定的应用场景中,如医学图像检测。同时,这些预训练的网络模型具有大量的参数和固定的结构,使得难以优化。

  • Single-Shot MultiBox Detector  

 

Single-Stage Detectors代表之一——SSD

Deep Feature Fusion

 

特征融合就有很多类似的案例,我们今天就不专门讲解了!

 

新框架

 

Specific Structure of SSD7-FFAM

上图就描述了提出的SSD7-FFAM的具体结构。在SSD中,由VGG提取的特征图和附加卷积层分别用于目标的定位和分类。然而,初始的浅层特征图缺乏重要的语义信息,这个问题导致检测精度低于两级检测器。因此,SSD不利于对小物体的检测。

与SSD7不同的是,所提出的SSD7-FFAM采用了两个新的模块:特征融合模块和基于SSD7的注意模块,以弥补由于卷积层的下降所导致的检测精度的降低。特征融合模块将两个不同尺度的特征图组合成转换后的新的特征图。该模块增强了浅层特征图的语义信息。注意模块是一个结合了通道注意和空间注意的轻量级模块。它显著地提高了网络性能,同时提供了少量的计算和参数。

Feature Fusion Module

 

上图显示了SSD7-FFAM中使用的特征融合模块结构示例。新的Conv4特征图与其他两个特征图一起传递到注意模块。

Attention Module

   Channel Attention Module

 

   Spatial Attention Module

[Paying more attention to attention: Improving the performance of convolutional neural networks via attention transfer. In Proceedings of the ICLR 2017]的作者指出,通道维度中的合并操作可以突出显示特征图的信息区域。在通道注意模块之后,研究者引入了一个空间注意模块,以关注特征有意义的地方。

与信道注意类似,鉴于信道注意模块之后的特征图F0,空间注意模块首先执行信道尺寸的平均池化和最大池化,以获得两个H×W×1信道特征,并根据信道将这两个特征缝合在一起。然后,在7×7卷积层后得到权重系数MS,激活函数为sigmoid。空间注意模块如上图b所示,计算结果为:

实验及分析

 

在NWPU VHR-10数据集上的测试结果

 

For each pair, the left (a,c,e) is the original image and right (b,d,f) is the result of the SSD7-FFAM. Each color corresponds to an object category in that image.

在VOC数据上的结果,如下表:

 

 

 whaosoft aiot http://143ai.com   


http://www.ppmy.cn/news/307843.html

相关文章

iOS开发 静态库和动态库

库是程序代码的集合,是程序开发者与其他开发者之间进行代码共享的一种方式。库根据源代码的公开情况可以分为开源库和闭源库。开源库的源代码可见,比如afnetworking;闭源库的源代码不可见,是一段编译好的二进制代码。闭源库又根据…

C#学习笔记(七):ListProduct list = new ListProduct()

// 商品集合信息List<Product> list new List<Product>(){new Product() {Id 1,Name "IPhone4",Price 1999,Remark "心动不如行动"},new Product() {Id 2,Name "IPhone4s",Price 2999,Remark "心动不如行动"},ne…

js中文对象数组转换为普通数组对象

后台返回的是这样的都是中午并且是动态的&#xff0c;都没有属性值 {“颜色”:[“红色}”,“黑色”],“型号”:[“iphone6s”,“iphone7s”],“内存”:[“2G”]} 第一步转换为json对象 let specListData JSON.parse(res.data.data.objs) let temp [] //定义空数组 //获取元素…

想要学习C++,就必须要学习C语言吗?

在学习C之前&#xff0c;你必须先学习C语言吗&#xff1f; C读作C加&#xff0c;简称CPlusPlus。顾名思义&#xff0c;C是在C语言的基础上增加新特性&#xff0c;玩新花样&#xff0c;所以叫CPlusPlus&#xff0c;就像iPhone7S和iPhone7.Win10和Win7的关系一样。 在学习C之前&…

苹果手机还原后无法激活

写在前面&#xff0c;当我们使用的手机是iPhone7s plus 及其以下版本手机时&#xff0c;系统还原会出现【无法激活】的问题。下面就告诉你如何解决这一问题&#xff1a; 找一台联网电脑下载最新版本的iTunes -> 在苹果官网上下载将苹果手机连接Wifi -> 此时&#xff0c;…

Java语法核心——面向对象编程

目录 面向过程思想概述 面向对象思想概述 面向对象思想特点及举例 类与对象的关系 类的定义 类与对象的案例(demo02) 对象内存存储机制 成员变量和局部变量的区别 private关键字 封装 ​编辑 this关键字 ​编辑 构造方法 ​编辑 标准类的代码写法和测试 面向对象…

苹果iPhone7s怎么查询激活时间?

摘要: 之前有一些网友给小编留言问苹果iphones7s怎么查询激活时间&#xff0c;小编一开始并没有把这个问题放心上。不过最近问苹果怎么查询激活时间的人甚至有时候比问 苹果手机找回方法的人还要多&#xff01;因为现在市面上购买到假iPhone7的 ... 之前有一些网友给小编留言问…

NLP自然语言处理-机器学习和自然语言处理介绍(四)

NLP自然语言处理-机器学习和自然语言处理介绍-事件抽取 一&#xff0e;案例介绍 1.背景 事件抽取技术的核心价值&#xff0c;是可以把半结构化、非结构化数据转换为对事件的结构化描述&#xff0c;进而支持丰富的下游应用。 比如说我们要为一些人物整理年表&#xff0c;如图&am…