Fully Attentional Network for Semantic Segmentation

news/2024/11/26 2:32:11/

背景:
非局部注意力使用一个简单的相似度矩阵,因此会造成attention miss,为了解决这个问题,提出了fully attentional network,同时进行位置和通道编码。本文主要解决在通道非局部中的位置问题。
attention miss
什么是attention miss?对于通道非局部注意力来说,两个维度分别为c x hw和hw x c的输入相乘得到通道注意力map,但是空间的信息融合了,每一个空间位置不能感知到其他位置的特征响应。空间非局部注意力同理。
为什么每一个空间位置不能感知到其他位置的特征响应?在我看来注意力map是二维的,为了进行相乘,feature map需要变成二维的,因此就将h x w转换成了hw,将二维转换成一维了,位置信息就消失了。
在这里插入图片描述

插曲
首先空间非局部在小物体上表现较好,通道非局部在大物体上表现较好,一些拿来对比的解决办法,如DANet,将空间和通道注意力并行放置,但是在大物体上表现不好,CBAM,将
空间和通道注意力串行放置,但是在小物体上表现不好。因此简单的堆叠效果不够好。
在这里插入图片描述
fully attentional block
在Fin输入之前,首先使用两个卷积层来降低维度,然后输入进FLA(fully attentional block)
在这里插入图片描述
1:首先我们将Fin输入到上图中construction,经过全局平均池化和线性层,在全局平均池化中我们使用[HX1],[1XW]卷积,产生的特征图经过repeat,形成了global feature,接着将Qw沿着H维度进行cut,将Qh沿着w维度进行cut,最后将cut之后的特征图进行融合,即进行空间交互。
2:同时我们将Fin沿着h维度cut生成group of h,沿着w维度cut生成group of w,最后将两个group进行merge生成K,同理生成V。
3:最后的就是非局部注意力操作,Q和K进行softmax,然后A和V进行矩阵相乘,然后将结果分成两个group,再将两个group进行逐像素相加,乘以一个超参数。
在这里插入图片描述
在这里插入图片描述
不同于传统的通道非局部,在FLA在不同的位置都有空间联系。
复杂度:
在这里插入图片描述
语义分割效果:
在这里插入图片描述
下一篇将看一下代码,以及具体的各种操作变换。


http://www.ppmy.cn/news/139441.html

相关文章

DeepLearing—CV系列(十九)——图像分割之U^2-Net(效果极好)的Pytorch实现

文章目录 一、u2net.py二、dataloader.py三、train.py四、test.py五、crop.py六、效果展示代码目录: 卷积之后特征图计算公式和空洞卷积之后特征图计算公式: (1)普通卷积之后特征图计算公式: w=h=(n+2p-k)/s+1 (2)进行空洞卷积后的计算公式: (3)进行池化后的特征…

U2Net 源码解析

U2Net 源码解析 如上图所示, U2Net是由ReSidual U-blocks块拼接而成的U形网络,类似UNet的Encoder-Decoder架构, 每个ReSidual U-blocks块内部本身又是一个U形网络,且加入了残差块,接下来先不用把关注点放在具体的RSU内…

XHR level2的新功能

设置HTTP请求的时限 xhr.timeout3000; 最长等待3秒就自动停止HTTP请求。还有一个timeout事件,用来指定回调函数 xhr.ontimeoutfunction(event){alert(请求超时); } 设置FormData对象管理表单数据 // 1、创建 FormData 实例 var fd new FormData();…

信号处理中简单实用的方法——数据的延拓

数字滤波器的输出有瞬态效应,即当取有限长的信号时对信号的截断,会使输出信号的前端产生失真;当通过零相位滤波器时,由于信号通过滤波器二次,会使输出信号的两端都产生失真。有些文献报道为改善滤波器输出的失真&#…

深度学习从入门到精通——图像分割技术原理解析

图像分割技术原理解析 图像分割模型全卷积网络(FCN)UNet显著性目标检测/图像分割 U2netSegNet现在的图像分割技术常用 常用损失函数损失函数精度描述像素准确率(Pixel Accuracy)平均像素准确率(Mean Pixel Accuracy&am…

HyperLynx(九)HDMI仿真实例

1.眼图和眼图模板 2.HDMI眼图模板 3.在HyperLynx中设置眼图模板 4.HDMI仿真 5.HDMI设计规则总结 1.眼图和眼图模板 眼图是指一系列的数字信号在示波器或图形软件中显示的图形。简单地说就是把一连串 接收端接收到 的脉冲信号(000,001,010, …

红外成像和可见光---双光集成设备的介绍

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、HX1 视觉模组二、HX1-S0(M) 双光模组 前言 红外成像技术越来越多的应用在我们的研发、制造、维护,甚至生活中。红外光谱…

PDF电子发票内容提取

可以点击这里使用发票提取软件:发票解析 请参考最新的实现方案: 浅谈电子发票识别方案 在线使用:发票提取 摘要 本文介绍如何提取PDF版电子发票的内容。 1. 加载内容 首先使用Python的pdfplumber库读入内容。 FILEr"data/test-2.…