【卷积神经网络;深度学习;滑坡检测;遥感|论文解读1】滑坡检测特征增强框架——AMU-Net
【卷积神经网络;深度学习;滑坡检测;遥感|论文解读1】滑坡检测特征增强框架——AMU-Net
文章目录
欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!
想要参加学术会议的宝子们可以看看这个网站,中稿率很高,都是国际会议,包含各类学科,尤其是对于大三大四研一研二的宝子们!投个会议评个国奖,妥妥起飞!祝各位还在学海无涯的宝子们早日上岸!!
1. 学术交流
参加学术会议是展示您研究成果和获取反馈的绝佳机会。在会议上,您可以与来自各地的研究者进行深入交流,讨论最新的研究动态与趋势,分享经验与观点。
2. 拓展人脉
学术会议汇聚了来自不同高校和研究机构的优秀学者和学生。这是一个拓展您学术网络的良好时机。建立联系不仅可以帮助您获得未来的合作机会,还可能为您职业发展打开新的大门。
3. 学习前沿知识
会议上通常会邀请多位领域内的专家进行主题演讲和报告,分享他们的研究成果和未来的研究方向。这是获取前沿知识和灵感的绝佳机会,能够激励您在研究道路上的前行。
论文地址:https://doi.org/10.1016/j.jag.2023.103521
2023·International Journal of Applied Earth Observation and Geoinformation·成都理工大学
滑坡检测特征增强框架
摘要
精准的滑坡检测对灾害缓解和救援至关重要。本研究提出了一种结合注意力机制与多尺度机制的特征增强框架,基于U-Net架构(AMU-Net)实现滑坡检测。该框架分为四个步骤:
- 特征增强:在卷积模块中引入注意力机制,提高滑坡区域的特征响应能力,优化高层特征表示。
- 多尺度信息融合:在跳跃连接中引入多尺度模块,将细粒度和粗粒度特征进行更有效的上下文信息融合。
- 特征编码与语义解码:采用U-Net架构对滑坡特征进行编码,并通过解码实现语义表征重建。
- 像素感受野优化:引入滑动窗口机制,在预测过程中增强像素的感受野,减少滑坡边界识别误差。
此外,研究探讨了随机切分和区域切分方法对模型训练效果的影响。在金沙江上游地区,利用无人机(UAV)影像与数字表面模型(DSM)数据开展滑坡检测实验。框架的设计充分考虑了无人机与卫星遥感数据之间的差异。对比实验表明,所提AMU-Net的平均交并比(mIoU)达到0.797,比其他模型高出2%以上。此外,特征图的可视化结果表明,该方法能够有效抑制背景中的无关特征响应,并捕获来自不同感受野的关键特征。所有实验的比较研究验证了该框架在滑坡检测中的优势。
引言
滑坡是山地地区常见且严重的地质灾害,可由地震、降雨、河流侵蚀、人类活动等单一或多种因素共同触发。滑坡灾害不仅对自然环境和人类基础设施造成巨大破坏,还严重威胁社会安全,甚至引发次生灾害(如堰塞湖溃决、泥石流)。因此,快速、精准地检测滑坡信息对于提高灾害应急响应与救援效率具有重要意义。
传统的野外调查方法尽管可靠,但存在效率低、成本高和安全性差等局限(Chen et al., 2018)。相比之下,遥感技术(如光学影像和合成孔径雷达SAR)凭借宏观观测和非接触特性,已广泛应用于灾害制图,特别是在滑坡检测、应急救援和次生灾害评估中。然而,传统的人工目视解译需要大量经验且费时费力,特别是针对大范围地区(Yu et al., 2020)。
随着图像分析技术的发展,一些自动化方法(如基于像素或对象的方法)被提出。然而,这些基于像素的传统方法仅依赖光谱特征,忽略了空间特征的作用,且传统机器学习模型多选取浅层特征,导致其在不同滑坡区域适应性较差。
近年来,深度学习(DL)方法在滑坡遥感研究中获得了广泛关注。**这些方法可自动从原始数据中提取特征,展现出在滑坡检测中的显著优势,尤其是基于编码器-解码器的分割模型。**然而,简单的深度学习架构在特征提取与语义表示方面存在瓶颈。
研究贡献
为解决模型性能与数据获取问题,本研究针对无人机数据提出了更适配的滑坡检测特征增强框架,主要贡献包括:
- 模型训练切分方法对比:分析随机切分和区域切分对模型训练效果的影响;
- 特征增强机制嵌入:在卷积模块中嵌入注意力机制,在跳跃连接中嵌入多尺度模块,以提升滑坡特征响应能力;
- 优化预测感受野:引入滑动窗口机制,在预测过程中优化像素感受野,减少边界误差,提高滑坡检测精度。
该框架应用于金沙江上游无人机影像数据,实验通过消融分析验证了框架的有效性,并通过特征图可视化进一步展示了方法的优势。
2. 方法
2.1. AMU-Net
AMU-Net(见图1)在标准U-Net架构基础上,结合注意力机制和多尺度机制,分别对卷积层和跳跃连接进行了改进。
得益于其结构优势,U-Net(Ronneberger等,2015)广泛用于图像分割任务。其下采样(编码器)通过卷积和池化操作提取高级特征表示并扩大感受野;上采样(解码器)将特征图恢复为高分辨率,用于像素级分类,并检测前景目标的位置和类别。跳跃连接将细粒度特征与粗粒度特征融合,提升预测效果。
与传统U-Net不同,AMU-Net在滑坡检测中有两大创新:注意力机制和多尺度机制。
假设第 l l l层的卷积特征映射表示为:
其中, s s s 为卷积核大小, d d d 为膨胀率, M j M_j Mj 为输入特征映射, b j b_j bj 为偏置项, k i j k_{ij} kij 为卷积核, f f f 为非线性激活函数, i i i 和 j j j 分别为输入和输出通道数。
增强卷积特征映射的注意力机制
注意力机制旨在聚焦任务相关的局部区域。我们将其嵌入卷积模块,以抑制背景中的无关特征响应并减少模糊性。具体地,通过 1 × 1 1×1 1×1 卷积核将特征映射至低维空间(单通道),采用逐元素乘法和Sigmoid函数生成每个像素的注意力系数。注意力权重矩阵可通过标准反向传播自适应更新。基于上述操作,构建了注意力卷积块(Attention Convolutional Block)以替代标准卷积层,其公式为:
其中, ϕ ∈ [ 0 , 1 ] ϕ∈[0,1] ϕ∈[0,1] 为注意力系数, σ s i g m o i d σ_{sigmoid} σsigmoid 和 σ R e L U σ_ReLU σReLU 分别为Sigmoid和ReLU激活函数, W q W_q Wq 、 W k ∈ R C i n × C s u b W_k∈R^{C_{in}×C_{sub}} Wk∈RCin×Csub 、 ψ T ∈ R C s u b × 1 ψ^T∈R ^{C_{sub}×1} ψT∈RCsub×1 为 1×1 卷积的可训练权重, b q b_q bq 、 b k ∈ R C s u b b_k∈R ^{C_{sub}} bk∈RCsub 、 b ψ ∈ R b_ψ∈R bψ∈R 为偏置项, W v ∈ R C i n × C o u t W_v∈R^{C_{in} ×C_{out}} Wv∈RCin×Cout、 b v ∈ R C o u t b_v∈R^{C_{out}} bv∈RCout 为 3 × 3 3×3 3×3 卷积的权重与偏置项, ⊙ ⊙ ⊙ 表示逐元素乘法。
丰富上下文信息的多尺度机制
多尺度的目的是提取不同感受野下的特征。滑坡目标的不同尺度会严重影响分割任务,特别是对于小型滑坡检测。我们在编码阶段提取多尺度特征来增加特征,从而使更多的上下文与来自解码器的粗特征相联系。具体地,我们通过控制核大小、膨胀率和池化操作来提取不同尺度的特征映射,然后在通道维度上与解码器特征映射进行堆叠和串联。通过上述过程,我们建立了多尺度连接,以取代传统的跳跃连接。编码阶段的输出特征映射可以写成:
在解码阶段,通过转置卷积对输出特征映射进行上采样,并与上述编码输出相结合。具体过程如下:
其中, ϕ C a t ϕ_{Cat} ϕCat表示在通道维度上叠加特征映射的连接。
2.2. 样本切割策略
**由于计算资源的限制,高分辨率、大尺寸输入对深度学习模型代价较高。特别是无人机遥感数据中,滑坡目标尺度差异显著,导致任务复杂性和数据量巨大。因此,需要将大尺寸影像切分为小块,以获得足够的样本并降低计算开销。**现有研究主要采用随机切割(Qi等,2020)和区域切割(Prakash等,2020)两种方法(见图2 a-b)。
- 随机切割:将整个区域裁剪为样本,并随机分配至训练、验证和测试集。
- 区域切割:将区域划分为若干部分后裁剪样本,分别生成数据集。
2.3. 窗口偏移策略
部分文献(Chen等,2023;Yi和Zhang,2020)将步长设定小于切块尺寸。较小的步长可几何级数增加样本量,但会因切块重叠导致信息泄露。我们在预测阶段应用该策略(见图2c),设置步长为 P / m P/m P/m,其中 P P P 为切块尺寸, m m m 为控制步长的常量。假设模型单次输出为二值(0或1),最终预测值为 f i n a l p r e d i c t ∈ [ 0 , m 2 ] finalpredict∈[0,m2] finalpredict∈[0,m2],即每个像素被预测 m 2 m2 m2 次,再通过阈值完成滑坡分类。类似于卷积操作,该过程可整合更多上下文信息并扩大感受野。
欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
祝所有的硕博生都能遇到好的导师!好的审稿人!好的同门!顺利毕业!
大多数高校硕博生毕业要求需要参加学术会议,发表EI或者SCI检索的学术论文会议论文:
可访问艾思科蓝官网,浏览即将召开的学术会议列表。会议入口:https://ais.cn/u/mmmiUz