去雾笔记01-SRKTDN: Applying Super Resolution Method to Dehazing Task

server/2024/11/14 22:38:37/

文章目录

  • Abstract
  • 1. Introduction
  • 2. Related Work
  • 3. Method
    • 3.1. Network Architecture

Abstract

们提出了一种结合超分辨方法知识转移方法的模型。我们的模型由一个教师网络、一个去雾网络和一个超分辨率网络组成。

1. Introduction

ECNU KT团队提出了一个知识蒸馏[20]模型,即知识转移脱雾网络.KTDN首先培训教师网络.KTDN在训练除霾网络时,利用教师网络生成下采样的高级特征图,利用教师网络特征图与除霾网络特征图之间的L1损失,让除霾网络模拟教师网络。虽然KTDN在挑战中取得了很高的PSNR和SSIM,并且在MOS中排名第二,但我们发现KTDN无法捕获输入图像中的细节,并且输出相对于groundtruth更加模糊,如图1所示
在这里插入图片描述
图1所示。左边是知识转移去雾网络产生的输出。右边是gt。可以看出,KTDN得到了一个模糊的结果。(KTDN是knowledge transfer dehaze network)
链接:------>知识蒸馏简述看这里
在这里插入图片描述
我们推断用于捕获高频细节的网络可以防止结果模糊。因此,我们提出了超分辨率
知识转移除雾网络(SRKTDN)。我们的主要贡献是将超分辨率网络连接到去霾网络,以改进结果,并证明其有效性。超分辨率网络与去霾网络并行运行,将两个网络的输出串接在一起,形成一个尾块。消融研究表明,通过SSIM评价,超分辨率网络大大提高了结果,避免了结果模糊。在NTIRE2021非均匀脱雾挑战的最终测试中,我们的方法获得了20.6192的PSNR(排名第4)和0.8349的SSIM(排名第7)[6]。

2. Related Work

以往的学习方法可分为三类:基于先验的学习方法、基于物理模型的学习方法和独立于物理模型的学习方法.尽管这些基于先验的方法在常规均匀雾霾场景中效果良好,但在某些情况下,当先验和假设不合适时,结果很容易被破坏
基于先验的方法已经过时了,基于物理模型学习的方法已经不适合非均匀去雾,独立于物理模型的学习方法不适合非均匀去雾,有的网络虽然假设在均匀去雾的基础上对非均匀去雾也有理想效果,但是导致了颜色失真的问题。

3. Method

在这里插入图片描述
PixelShuffle是把图像从低分辨率到高分辨率
逆PixelShuffle是把图像从高分辨率到低分辨率

3.1. Network Architecture

我们提出了一种基于知识转移脱雾网络的双网络。如图3所示,在编码器之后,教师网络和去霾网络具有相同的网络结构,去霾网络的输出与超分辨率网络的输出串联在一起。教师网络用于生成编码器生成的高级特征图。我们使用数据集的groundtruth训练教师网络,让教师学习恢复真实groundtruth图像所需的高级特征映射的分布。然后利用知识转移损失使去霾网络编码器的输出与生成的特征图相似。由于教师网络能够恢复GT,如果编码器的输出相同,由于类似的网络结构,除霾网络也应该能够恢复。
倍的下采样。我们利用知识转移损失将知识从教师网的ResNet18编码器转移到去霾网的Res2Net101编码器。利用L1损耗限制消雾编码器的输出,消雾编码器可以输出与教师相似的特征图,供解码器用于恢复无雾图像。译码器。如图2所示,我们使用与KTDN相同的解码器网络架构。模型中的注意模块包含通道注意块和[28]中提出的像素注意块。输入特征映射首先通过通道注意块(CA),然后通过像素注意块(PA)。通道注意块由一个平均池化层、一个1x1卷积层、一个ReLU层、另一个1x1卷积层和一个Sigmoid层组成,为每个通道提供相同权重的细化。像素注意力块类似于通道注意力块,但没有池化层,并且只有1个输出通道,提供逐像素的细化。CA和PA都计算生成的权值与原始输入的乘积来生成精细化的特征图,以细化重要的方面,如颜色和厚雾霾,因为重要的信息得到更高的权重。注意模块有两个卷积层和一个ReLU层,在注意块之前有一个跳过连接,另一个跳过连接贯穿整个模块,以保留以前模块的特征。
该模型使用PixelShuffle层进行上采样,这是轻量级的,并且不像转置卷积那样导致棋盘伪影。在x4和x8下采样特征映射上,编码器和解码器之间存在跳跃式连接。上采样后,x4和x8下采样特征图被连接并发送到关注模块。在教师网和除霾网的尾部是PSPNet[38]模块。PSPNet模块将不同层次的特征组合在一起,用全局特征来
细化局部区域。利用PSPNet模块学习不同感受野的上下文信息来增强结果。

抽象名词解释链接----->去雾笔记-Pixel Shuffle,逆Pixel Shuffle,棋盘效应,转置卷积

论文英文版本和带笔记的翻译链接如下:
链接:https://pan.baidu.com/s/1RfKBBqabsYAzTTcoJ45z8Q?pwd=8888
提取码:8888
–来自百度网盘超级会员V7的分享

在这里插入图片描述


http://www.ppmy.cn/server/11661.html

相关文章

第四届大数据工程与教育国际会议(BDEE 2024)即将召开!

第四届大数据工程与教育国际会议(BDEE 2024)将于2024年8月9-11日在泰国清迈举行。数据驱动教育变革,智慧点亮未来课堂!BDEE 2024是专注于大数据工程与教育领域的重要学术会议,全球大数据与教育精英齐聚,在数…

盲人辅助设备赋能视障人士,实时导航与避障打造无障碍生活

随着科技日新月异的发展,我们见证了一个又一个创新产品如何深刻改变人们的生活。在关爱特殊群体、推动社会包容性发展的道路上,一款名为蝙蝠避障的盲人辅助设备脱颖而出,以其卓越的实时导航与精准避障功能,成功破除了视障人士出行…

15 php学习:表单验证

表单验证 表单验证在网页和应用程序开发中起着至关重要的作用,其主要目的是确保用户输入的数据符合预期的格式和规则,以提升用户体验、数据准确性和系统安全性。以下是表单验证的主要作用: 数据准确性:通过表单验证,可…

科技驱动未来,提升AI算力,GPU扩展正当时

要说这两年最火的科技是什么?我想“AI人工智能”肯定是最有资格上榜的,尤其ChatGPT推出后迅速在社交媒体上走红,短短5天,注册用户数就超过100万,2023年一月末,ChatGPT的月活用户更是突破1亿,成为…

【springBoot】资源文件的变量替换

在Spring Boot项目中,可以从application.yml或application.properties中获取pom.xml中定义的变量。为了实现在application.yml中使用pom.xml中的属性,通常需要在构建过程中将这些属性注入到资源文件中。以下是实现这一目标的几种方法: 方法1…

上汽大通:依托电子签网络,升级产业供应链协同

2023年12月,法大大发布了中国首部《汽车行业合同数智化白皮书》(点击阅读及下载:中国首部!《汽车行业合同数智化白皮书》重磅发布 | 附下载)。该白皮书中基于法大大自身参与汽车行业合同数智化建设的实践和思考&#x…

VUE识别图片文字OCR(tesseract.js)

效果:1&#xff1a; 效果图2&#xff1a; 一、安装tesseract.js npm i tesseract.js 二、静态页面实现 <template><div><div style"marginTop:100px"><input change"handleChage" type"file" id"image-input"…

密钥密码学(一)

原文&#xff1a;annas-archive.org/md5/b5abcf9a07e32fc6f42b907f001224a1 译者&#xff1a;飞龙 协议&#xff1a;CC BY-NC-SA 4.0 前言 序言 从秘密解码环到政府政策声明&#xff0c;隐藏和发现信息的挑战长期以来一直吸引着智慧。密码学是一个引人入胜的主题&#xff0c;…