HGFormer:用于领域广义语义分割的层级式分组Transformer

news/2024/11/28 17:46:35/

文章目录

  • HGFormer: Hierarchical Grouping Transformer for Domain Generalized Semantic Segmentation
    • 摘要
    • 本文方法
    • 实验结果

HGFormer: Hierarchical Grouping Transformer for Domain Generalized Semantic Segmentation

摘要

目前的语义分割模型在独立同分布条件下取得了巨大的成功。然而,在实际应用中,测试数据可能与训练数据来自不同的领域。因此,提高模型对领域差异的鲁棒性非常重要。
本文方法

  1. 这项工作研究了领域泛化设置下的语义分割,其中模型仅在源领域上训练,并在看不见的目标领域上测试
  2. 提出了一种新的分层分组变换器(HGF-ormer),以显式地对像素进行分组,形成部分级掩码,然后形成整个part-级掩码。
  3. 不同规模的mask旨在将类的部分和整体分割开来。HGFormer将两个尺度上的MASK分类结果组合用于类标签预测。
    代码地址

本文方法

在这里插入图片描述
语义分割可以被认为是将图像划分为分类单元(区域),然后对这些单元进行分类。
MASK分类比每像素分类更稳健,因为MASK允许在同类的大图像区域上聚合特征,以预测“全局”标签。
在分布偏移(例如,高斯噪声)的情况下,将像素直接从像素分组为全水平掩模的过程是非常具有挑战性的。为了解决这个问题,我们提出了一种分层分组范式,先将像素分组到部分级掩码,然后将部分级掩码分组到整体级掩码,以获得可靠的掩码。然后,考虑到两个级别的掩码捕获互补信息,我们将部分级别和整体级别的掩码分类相结合,以实现稳健的语义分割。

在这里插入图片描述
首先将图像传递到骨干网络,并获得不同分辨率的特征图。
最大的特征图K0被投影到K以用于part级分组。其他三个特征图被融合以形成用于稍后分类的part级掩模特征提取的新特征图V。
part级分组的细节可以在算法1中看到。分组过程是重复L次迭代。在每次迭代结束时,都有Np part级mask及其token。结合part级分类和part级掩码,我们可以得到语义分割结果O1。
part级别分组的最后一次迭代中的part级别token通过全级别分组聚合为全级别掩码(实际上是交叉关注层)
类似地,在整个级别分组中也有L次迭代。在每次迭代结束时,都没有完整级别的令牌。通过K0和投影的全级别掩码令牌之间的矩阵相乘来计算全级别掩码。类似地,我们可以通过结合整个级别掩码及其分类来获得语义分割结果O2。最终结果O是O1和O2的总和。
在这里插入图片描述
像素特征及其附近中心特征之间的相似性。分组过程是将每个像素分配给Np个中心特征中的一个。然而,由于全局比较的计算成本,我们只计算像素与其附近中心特征之间的相似性来进行局部比较。例如,我们只将绿框中的每个像素分配给其9个附近中心特征中的一个。

实验结果

在这里插入图片描述
在这里插入图片描述


http://www.ppmy.cn/news/185609.html

相关文章

【程序员面试金典】面试题 16.04. 井字游戏

【程序员面试金典】面试题 16.04. 井字游戏 题目描述解题思路 题目描述 描述:设计一个算法,判断玩家是否赢了井字游戏。输入是一个 N x N 的数组棋盘,由字符" ",“X"和"O"组成,其中字符” &…

从0到1创业课-创建专属于自己的经营模式

从0到1创业课 文章目录 从0到1创业课前言第一步,市场调研及定位第二步,产品设计及开发第三步,招募商家第四步,推广及宣传第五步,完善用户体验及服务质量总结前言 从0到1打造企业离不开的核心力量, 从0到1创建专属于自己的商业模式, 从0到1选取最适合自己的融资规模, 从…

学生党适合用什么半入耳蓝牙耳机?半入耳式TWS耳机推荐

半入耳耳机因为佩戴舒适,携带方便而受到了不少用户的喜爱。下面,我来推荐几款半入耳式TWS耳机,学生党也很合适哦,一起来看看吧。 一、南卡Lite Pro2蓝牙耳机 NANK南卡在音频领域研究了十多年,有着先进的研究技术&…

入耳式耳机什么品牌的好?TWS耳机排名

现在的蓝牙耳机体积是越做越小了,就为了更加便携。但是很多蓝牙耳机用户担心,在体积变小的情况下,蓝牙耳机的输出音质也会变差,这样的担心也在合理范围内。但是科技的发展与日俱进,体积变小,其它方面的综合…

Gradio的web界面演示与交互机器学习模型,Blocks的事件侦听《7》

在第一篇文章我们就熟悉了Blocks的用法,使用Blocks比Interface更加灵活,这节重点关注Blocks里面的相关操作。 1、Blocks标准例子 import gradio as grdef greet(name):return "你好 " name "!"with gr.Blocks() as demo:name g…

开放式蓝牙耳机推荐,推荐几款市面上畅销的开放式蓝牙耳机

随着科技的进步,骨传导技术也在不断进步,骨传导是通过骨头进行传播。骨传导耳机没有耳塞式耳机的塞耳压迫感,不会伤害到耳道,同时不会影响到耳膜,而且更好的保护听力。骨传导耳机因为其自身的特性,可以在运…

华为p60pro和mate50pro哪个好 华为p60pro和mate50pro参数对比

它们在外观设计、硬件配置、拍照、续航等方面都有着不同的特点。首先,华为Mate50 Pro采用了全新的曲面屏设计,屏幕分辨率达到了2K,屏幕显示效果更加出色,同时搭载了麒麟9000处理器,性能更加强劲,支持5G网络…

P50 食材搭配

描述 假设你是一个美食家,现在需要编写一个函数,函数接收一个字符串作为参数,该字符串由多个食材组成,每个食材之间用"$","#"等特殊符号隔开,函数需要将这些食材两两组合起来&#xf…