DC-UNet:重新思考UNet架构和双通道高效CNN医学图像

news/2025/3/30 16:22:11/

摘要

经典UNet的体系架构在某些方面存在着局限性。因此本文对其结构提出了改进。1)设计高效的CNN架构来取代编码器和解码器;2)在最先进的U-Net模型的基础上,应用残差模块来取代编码器和解码器之间的跳过连接来进行改进。

医学图像分割是通过一些自动和半自动的方法来最小化感兴趣区域。。有许多传统的算法被设计来分割组织或身体器官。这些方法可以分为:基于区域的聚类、基于边缘的聚类、基于阈值的聚类和基于特征的聚类。

本文提出了一种双通道UNet模型-DC-UNet

方法

MultiResUNet

在医学图像中,感兴趣的目标对象常常有所不同,因此为了更好的分割结果,网络需要具备在不同的尺度上分析不同目标的能力。基于这一思想,Szegedy[27]引入了一种革命性的架构——Inception Block。该初始块利用不同内核大小的卷积层并行从图像中提取不同尺度的特征。初始块如图2所示。在最初的版本中,初始块简单地将1 × 1,3 × 3,5 × 5卷积层和3 × 3最大池化层并行组合。然后,将不同尺度的特征进行拼接,发送到下一层。然而,这个版本的一个大问题是维数会导致计算爆炸

如图2中(b)的降维版本解决了这一问题,在计算3x3和5x5的卷积之前,使用1x1的卷积层来降维。

 

虽然可以使用1x1的卷积层来降低维度,但是使用更大的卷积核来进行卷积也是相当耗时的,因此Inception模块可以进一步简化为下图所示的结构使用两个3x3的卷积来代替一个5x5的卷积。

另外还使用了多个3x3的卷积来代替7x7的卷积,如下图所示:

整个MulitResUnet的网络结构如下图所示:

DC-UNet

 动机:MultiResUNet可以提供比U-Net更好的输出,因为它可以提供不同尺度的特征。然而,对于一些极具挑战性的医学图像情况,MultiResUNet表现不佳,例如物体模糊,背景(部分医疗设备)的干扰。MultiRes块的目标是提供不同尺度的特征来帮助将物体从整个图像中分离出来。因此,我们修改了MultiRes块以提供更有效的功能。

 改进:之前使用的MultiResUnet缺乏清晰的分割边界,本文通过设计一个更有效的CNN架构来提取更多的空间特征来解决这个问题。发现不同尺度的特征对分割有很大的帮助。因此,我们假设,如果我们能够提供更多不同规模(更有效)的特性,那么那些最具挑战性的任务将得到解决。

基于这个假设,我们注意到在MultiRes块中有一个简单的剩余连接。正如作者所提到的,这里的剩余连接只提供了一些额外的空间特征,这可能不足以完成一些最具挑战性的任务。不同尺度特征在医学图像分割中已经显示出巨大的潜力。因此,为了克服空间特征不足的问题,我们用3个3 × 3卷积层序列来代替MultiRes块中的残差连接。我们称之为DualChannel块。其结构如下图所示:

在编码器和解码器之间应用了相同的连接(Res-Path)。然后利用了Res-Path和Dual-Channel块构建了一个新的UNet架构DC-UNet,其结构如下图所示

结论

 本文设计了双通道CNN块,以更少的参数提供更有效的特征,以克服这些限制。为了将这种双通道CNN架构与Res-Path结合起来,我们开发了一种新颖的类u - net架构——DC-UNet。这个网络结构具有更强的捕捉细节的能力


http://www.ppmy.cn/news/8865.html

相关文章

Spring Cache

1.Spring Cache简介 Spring Cache是一个框架,实现了基于注解的缓存功能,只需要简单的添加一个注解,就可以实现缓存功能 Spring Cache提供了一层抽象,底层可以切换不同的Cache来实现。具体就是通过CacheManager接口来统一不同的缓…

ansible(第二天)

第二章:模块介绍 1.Ansible的三个命令模块 command shell raw 应尽量避免使用这三个模块来执行命令,因为其他模块大部分都是幂等性的,可以自动进行更改跟踪。 command、shell、raw不具备幂等性。注: 幂等性:简单来…

Redis 缓存数据库

目录Redis 高可用方案高可用概念Redis 高可用的实现方案1、主从模式2、哨兵模式3、集群模式Redis 高可用方案 高可用概念 高可用(High Availability,既HA),指的是通过尽量缩短日常维护操作和减少突发系统奔溃锁导致的停机时间来提…

2022年终总结--和自己说说话

新岁序开,奔赴山海 日落:尘埃落定 人类是善于遗忘的,没有痕迹,就只会被当做没发生;正如现在的我,想回顾自己全年的经历,却发现没有太多的证据起诉生活蹂躏过我;尽可能的回忆和寻找碎…

【全网最细PAT题解】【PAT乙】1009 说反话(cin、getline、cin.getline三种输入格式)

题目链接 1009 说反话 题目描述 给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出。输入格式: 测试输入包含一个测试用例,在一行内给出总长度不超过 80 的字符串。字符串由若干单词和若干空格组成,其中单词…

Python杂题

目录 一、前言 二、例题1——修剪灌木 三、例题2—— 付账问题 四、例题3——最少砝码 五、例题四——矩形拼接 六、例题五——蜂巢 一、前言 竞赛题有很多不需要什么算法的题目,只要学过编程语言就能做,其考核思维、逻辑、编码能力。而这种题有“…

显式利用用户画像的多兴趣建模

显式利用用户画像的多兴趣建模 目前在多兴趣建模中,用户侧的特征包括用户基础画像特征(年龄、性别、地域等)、用户在当前场景的静态兴趣画像特征(短期兴趣画像、长期兴趣画像)、交互的历史正向行为序列特征&#xff0…

MySQL数据库高级面试题(2)

✅作者简介:热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏:Java面试题…