【目标检测】FPN特征金字塔完整流程详解

ops/2024/10/21 17:25:20/

学习视频:1.1.2 FPN结构详解

对比

可以看到FPN是自上而下、自下而上并且可以进行多尺度特征融合的的层级结构。

在这里插入图片描述

具体结构

在这里插入图片描述

  • 1x1 conv: 对通道数进行调整,不同大小的特征图通道数不同,越高层次的特征图通道数越大,论文中使用256个1x1的卷积核,从而把特征图的通道数都调整为256。

  • 2x up: 使用插值法把高层次特征图大小放大两倍从而变为和低一层的特征图大小一样大。

整体流程

在这里插入图片描述

1. 生成C2-C5特征层

使用不同大小的卷积对特征图进行操作,从而生成了不同大小的4个特征层。

  • C2: 160x160x256 (HxWxC)
  • C3: 80x80x512
  • C4: 40x40x1024
  • C5: 20x20x2048

在这里插入图片描述

2. 使用1x1conv进行通道数统一和2x up上采样后相加完成多尺度特征融合

因为4个特征图大小和通道数都不同,所以需要调整为相同的通道数和大小后才能两两相加。

  • 通道数调整:使用256个1x1 conv进行通道数的调整,把4个特征图的通道数都调整为256。

  • 大小调整:自上而下,把小尺度的图两倍上采样,就可以成为和下一层一样的大小。e.g. 20x20大小的特征图2倍上采样就可以变成40x40的大小。

在这里插入图片描述

3. 3x3conv进行进一步特征融合

在相加后加一个3x3的卷积来进行相加后的进一步的特征融合。

  • P5: C5 —> 3x3 conv
  • P4: P5 + C4 —> 3x3 conv
  • P3: P4 + C3 —> 3x3 conv
  • P2: P3 + C2 —> 3x3 conv

在这里插入图片描述

4. 得到P2-P5特征层

最终得到了4张通道数相同、大小分别两倍递减的特征图。

  • P2: 160x160x256 (HxWxC)
  • P3: 80x80x256
  • P4: 40x40x256
  • P5: 20x20x256

5. P5下采样形成P6

P6根据P5下采样得到。

  • P6: 10x10x256。

注:P6这一层只在RPN中生成proposal部分进行使用,即使用P2-P6这5层来生成候选区域,在faster rcnn的预测部分不使用,还是只用P2-P5这4层进行预测。
在P2-P6生成proposals,然后把生成的proposals映射到P2-P5上从而预测结果。

在这里插入图片描述


http://www.ppmy.cn/ops/18951.html

相关文章

OpenCV如何实现拉普拉斯算子的离散模拟

返回:OpenCV系列文章目录(持续更新中......) 上一篇:OpenCV的Sobel 衍生品 下一篇 :OpenCV 如何实现边缘检测器 目标 在本教程中,您将学习如何: 使用 OpenCV 函数 Laplacian() 实…

spring boot 新手入门【1】基础学习

学习开始时间: 2024/03/30 晚上 10:44 基础教程 教程仓库 在线编程 其它教程 1.搭建spring boot 工程,定义HelloController.hello()方法,返回’Hello SpringBoot!’ 要搭建一个简单的Spring Boot工程并定义一个HelloController类,可以按照以…

关于SSL加密,您应该知道什么?

SSL加密,全称为安全套接字层加密,是一种网络安全协议,主要用于在网络通信中提供隐私和数据完整性。它通过在客户端和服务器之间建立一个加密的通道,确保数据在传输过程中不被窃取或篡改。随着互联网的普及和电子商务的快速发展&am…

大型语言模型:奇迹背后的未知哲学,人类智慧的边界探索

大型语言模型可以做出令人瞠目结舌的事情。但没有人确切知道原因。 这是一个问题。弄清楚它是我们这个时代最大的科学难题之一,也是控制更强大的未来模型的关键一步。 多长时间才能学会加法? 两年前,旧金山 OpenAI 公司的研究人员尤里布尔…

小程序 rich-text 解析富文本 图片过大时如何自适应?

在微信小程序中&#xff0c;用rich-text 解析后端返回的数据&#xff0c;当图片尺寸太大时&#xff0c;会溢出屏幕&#xff0c;导致横向出现滚动 查看富文本代码 图片是用 <img 标签&#xff0c;所以写个正则匹配一下图片标签&#xff0c;手动加上样式即可 // content 为后…

【OceanBase诊断调优】—— 4013 内存爆问题的排查

本文介绍 4013 内存爆问题的排查。 内存爆的类型 内存爆主要分为五类&#xff0c;可以通过关键词 OOPS 确定内存爆的类型。 内存爆的类型日志信息&#xff08;关键字为 [OOPS]&#xff09;SINGLE_ALLOC_SIZE_OVERFLOWsingle alloc size large than 4G is not allowed(alloc_…

MQ面试题

为什么要使用消息队列&#xff1f; 优点&#xff1a;解耦、异步、流量削峰 缺点&#xff1a;可用性降低、复杂性提高、一致性问题 为什么选择了RabbitMQ而不是其它的MQ&#xff1f; kafka是以吞吐量高而闻名&#xff0c;不过其数据稳定性一般&#xff0c;而且无法保证消息有…

建造者模式(装修公司装修套餐)

目录 定义 装修公司装修套餐 物料接⼝ 吊顶(ceiling) ⼀级顶 ⼆级顶 涂料(coat) 多乐⼠ ⽴邦 地板(floor) 德尔 圣象 地砖(tile) 东鹏 ⻢可波罗 代码实现 定义装修包接⼝ 装修包实现 建造者⽅法 测试验证 定义 建造者模式所完成的内容就是通过将多个简单对…