端到端弱监督语义分割的self correspondence蒸馏

news/2024/12/23 14:01:44/

Self Correspondence Distillation for End-to-End Weakly-Supervised Semantic Segmentation

摘要

论文链接
代码链接
目前的方法对综合语义信息的提取不足,导致伪标签质量较低

  1. 提出了一种简单而新颖的自相关蒸馏(SCD)方法,在不引入外部监督的情况下对伪标签进行细化。
  2. SCD使网络能够利用从自身派生的特征相关性作为蒸馏目标,通过补充语义信息来增强网络的特征学习过程。
  3. 为了进一步提高伪标签的分割精度,设计了一个Variationaware Refine Module,通过计算像素级的变化来增强伪标签的局部一致性。
  4. 提出了一个高效的基于变压器的端到端框架(TSCD),通过SCD和可变感知细化模块来实现精确的弱监督分割任务。
    在这里插入图片描述

本文方法

在这里插入图片描述

Self Correspondence Distillation

通过自相关蒸馏对原始图像的CAM进行细化,不需要任何额外的标签和外部监督,同时可以帮助网络获得全面的图像语义信息。自监督特征学习的最新进展表明,密集特征在语义上是相关的,这些密集的特征映射可以是类激活映射

CAM Feature Correspondence

形式上,我们关注cam之间的相关体积。给定两个CAM, m1∈RH1×W1×C, m2∈RH2×W2×C, H1, H2为高度,W1, W2为宽度,C为类别,我们定义CAM特征相关关系为:
在这里插入图片描述
具体来说,给定一个图像I∈R(H×W ×D)和一个仿射变换A(·),我们使用编码器提取的特征映射来生成cam。以CAM m1为例,我们用E: R(H×W ×D)→R(H1×W1×C)表示从提取的特征图生成CAM m1的过程。因此,m1和m2可以表示为:
在这里插入图片描述
那么CAM特征对应关系可以进一步表示为:
在这里插入图片描述
编码器和解码器共享权值,图像I和A(I)的分割预测映射分别记为s1∈R(H1×W1×C)和s2∈R(H2×W2×C)。然后将分割特征对应定义为:
在这里插入图片描述

SCD for Training

我们的自相关蒸馏(SCD)背后的直觉是,分割特征对应可以从CAM特征对应中提取有用的语义信息,以自学习的方式细化CAM。受自监督特征学习的启发,我们考虑将分割特征对应与网络自身的CAM特征对应对齐。损失函数的设计目的是将相应的cam推到一起,以增强语义相关性,当两个分割预测之间存在显著相关性时。我们通过将对应的分割特征S(h1w1h2w2)与对应的CAM特征M(h1w1h2w2)进行简单的元素乘法来实现SCD损失函数:

在这里插入图片描述
在实践中,为了保证推理效率,我们采用随机抽样策略来训练我们的SCD损失函数,样本数量为n。如果分割预测图的大小与对应CAM的大小不同,则对分割预测图应用双线性上采样

Variation-Aware Refine Module

CAM得到的初始伪标签通常局部不一致,边界粗糙。许多多阶段方法使用CRF来进一步细化初始伪标签,这降低了训练效率。对于端到端方法,Araslano等人(Araslanov和Roth 2020)利用像素自适应卷积提取局部图像信息以获得局部一致性,而Ru等人进一步结合空间信息构建细化模块。不同于前面两人,我们设计了可变感知的细化模块,它引入了图像降噪的思想来克服局部不一致性。
具体来说,对于图像i中的位置(i, j)和(k, l),我们首先计算图像像素级的变化:
在这里插入图片描述
其中σij为标准差,α为平滑权值。为了增强伪标签的局部一致性,对于图像中变化较大的像素,我们计算校正核kij,kl,以避免出现一些突然变形的值

在这里插入图片描述
其中N(i, j)是(i, j)的邻居集,使用扩张卷积获得。我们采用迭代更新策略更新像素标签(CAM) Pi,j,c:
在这里插入图片描述
我们的变量感知细化模块通过感知像素级变化来增强初始伪标签的局部一致性,同时保证了较高的训练效率。

Transformer-Based Framework with Self Correspondence Distillation

自对应蒸馏(TSCD)框架由transformer主干、SCD、VARM、等变正则化loss、分类loss、辅助loss和分割loss组成。然后分别介绍了各损失函数和总损失
等变正则化损失:等变约束已被证明可以缩小弱监督和充分监督之间的监督差距
在这里插入图片描述
分类损失:softmax
在这里插入图片描述
辅助损失:affinity loss
直接使用编码器最后两层输出的注意图(A1, A2)来计算辅助损耗。形式上,辅助损失表示为:
在这里插入图片描述
总损失:

在这里插入图片描述

实验结果

在这里插入图片描述

消融实验

在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/news/37721.html

相关文章

面试官:了解mysql的架构体系吗?

文章目录 总览图客户端连接层服务层连接缓存解析器优化器执行器存储引擎层MyISAM 与 InnoDB 引擎的区别如何在MyISAM 与 InnoDB存储引擎中进行选择?系统文件存储层数据文件日志文件(错误日志,binglog和慢查询日志)redo log文件redolog文件处理机制:undo log文件配置文件一…

前端视角下的转转客服通信过程

当你在转转咨询客服时,你的问题是如何发送到客服的?客服又是如何快速精准回答的呢?这篇文章将从前端的视角,带你了解转转客服通信的整体流程。客服通信的整体架构首先看一看用户与客服通信的整体架构,如下图「入口管理…

Kafka 入门(三)

Kafka 入门(三) IPhostname192.168.79.177master01192.168.79.180worker01192.168.79.181worker02 2种集群模式 ZookeeperKraft zookeeper集群配置 config/zookeeper.properties 三台服务器 master01, worker01, worker02 增加如下内容 note: maste…

css处理图片失效显示错误兜底图代码

简言 今天从张老师那里学到了图片加载错误后显示兜底图和提示文字的用法。用vue实现下图片组件。 代码 思路&#xff1a; 图片加载失败&#xff0c;添加错误css类,添加伪类填充错误图片和alt提示信息。 <template><img:class"{ is__error: isOnloadError }&q…

工业相机成像原理

镜头的成像原理主要是因为小孔成像&#xff0c;作为机器视觉系统中的重要组件&#xff0c;镜头和工业相机同样重要&#xff0c;但是工业相机的成像原理是什么呢&#xff1f;我会在这一篇中诉说清楚。 01 CCD和CMOS 从感光芯片的角度来分&#xff0c;有CCD相机和CMOS相机&…

阿里云5、6代云服务器实例免费升级至第7代(不限次数)

简介&#xff1a; 阿里云推出云服务器实例免费升级至第7代优惠活动&#xff0c;第5、&#xff16;代云服务器&#xff0c;可享受实例部分免费升级至第7代实例&#xff0c;让你的云服务器拥有更高的安全、存储、网络等性能。 阿里云服务器升级有优惠吗&#xff1f;当然是有的&am…

【0181】PG内核通过pg_hba.conf完成客户端认证(2)

文章目录 1. 回顾2. 读取文件所有token2.1 每行内容最大长度限制2.2 移除缓冲区buf中的换行符2.3 解析rawline中所有的字段2.3.1 从一行中标记HBA字段2.3.1.1 从*lineptr获取一个token2.3.1.1.1 忽略token前的所有空格和逗号2.3.1.1.2 token中不返回终止逗号2.3.1.1.3 取消toke…

android:手搓一个即时消息聊天框(包含消息记录)

先看一下效果 1.后端 要实现这个&#xff0c;先说一下后端要实现的接口 1.创建会话id 传入“发送id”和“接收id”给服务端&#xff0c;服务端去创建“会话id” 比如 get请求&#xff1a;http://xxxx:8110/picasso/createSession?fromUserId1&toUserId2 返回seesionId…