(三)目标检测中的几种框【anchor,bbox,先验框,网格单元,ROI,proposal,DenseBox】

news/2024/12/27 7:30:52/

文章目录

    • bbox(bounding box)
    • anchor
      • 怎么确定候选框中是否包含目标?
      • 怎么筛选Anchor?
    • grid cell(网格单元)

bbox(bounding box)

  Bbox是BoundingBox(边界框)的缩写,指的是目标检测中用于表示物体位置和大小的有向矩形框。通常情况下爱,对于一张图像中的每个目标物体,在训练集中都会预先标注一个对应的Bbox,即表表示该物体在图像中的位置和大小。
  在模型预测时,通过对图像中多个位置或尺度的Bbox进行检测,可以识别出图像中包含的目标物体。
  在目标检测算法中,Bbox与Anchor框紧密相关,因为Anchor框通常作为预定义的候选框用于捕获可能包含目标的区域。而在Anchor框生成的候选框中,通过进一步筛选和调整,可以得到最终的目标BBox。
  因此,Bbox通常也被称为检测框,因为它是表示目标位置和大小的一种重要方式。

anchor

  Anchor是由Bbox筛选得到的。
  Anchor和BBox在目标检测中的作用不同。
  Anchor通常是一组预定的候选框,用来在输入图像上确定可能包含目标物体的位置。具体地说,通常在图像上生成一系列大小和长宽比不同的Anchor框,然后与目标物体进行匹配和调整,最终得到包含目标的候选框。
 更具体的说,模型通过比较Anchor和真实目标框之间的IOU(交并比)来确定哪些Anchor框包含目标,以及如何调整Anchor框来更高的拟合目标。因此Anchor框可以被视为候选框,因为它们是用来找到可能包含目标的区域的。

怎么确定候选框中是否包含目标?

  一般首先通常根据训练集中目标物体的大小和形状等信息进行预先设置。可以通过聚类技术(K-means聚类)来确定Anchor框的数量和大小。(聚类过程:可以先将训练集中所有目标物体的边界框进行聚类,得到若干个聚类中心,并将这些聚类中心作为Anchor框;)然后,在训练过程中,模型会根据Anchor框预测目标物体的位置和置信度,从而实现检测功能。
  一般来说,在检测过程中,如果一个Anchor框的置信度得到比较高(通常超过一个设定的阈值),则认为该框内包含目标物体。

怎么筛选Anchor?

  由于同一个目标物体可能会被多个Anchor框检测到,因此需要进行非极大值抑制(NMS)处理,去除重复检测结果,从而得到最终的检测结果。

grid cell(网格单元)


http://www.ppmy.cn/news/464798.html

相关文章

夏普打印机SHARP MX-2018UC 发生错误,错误代码:H3-00 解决办法

打印机型号:夏普打印机SHARP MX-2018UC 开机屏幕提示错误:发生错误,错误代码:H3-00 解决办法:连续按键 p*c*,出现英文,按14,按复印键,点击yes,重启机器。 问…

嵌入式设计及Linux驱动开发指南——基于ARM9处理器

嵌入式设计及Linux驱动开发指南——基于ARM9处理器 读书笔记 第一章嵌入式系统基础 1、 嵌入式系统定义: “嵌入式系统是用来控制或者监视机器、装置、工厂等大规模系统的设备。” ——电气工程师协会   “嵌入到对象体系中的专用计算机系统” ——…

盘点CES2015上的TV大咖:4K显示百花齐发

4K电视对于现在的消费者来说已经不再是个陌生的名词,从OLED到SUHD到被灵活分割的各种像素,2015年的CES充满了最前沿的电视技术。本届 CES 展上,各大厂商相继推出了多款电视,下面就让我们盘点一下出现在CES上的电视新品&#xff1a…

算法预测“排尿”、打游戏治中风...科技如何应对老龄化危机?

硅谷Live / 实地探访 / 热点探秘 / 深度探讨 近年来,不论是人口老龄化问题突出的欧美日韩,还是马上迎来老龄化挑战的经济大国中国,全世界都不能再忽视人口老龄化带来的社会问题。 以美国为例:美国健康局人口普查局 2018 的数据显示…

常见编程/框架介绍

文章大纲 一、C/C二、C#三、cocos2d-x四、go语言五、Hadoop六、HBase七、PHP八、python九、Spark十、Storm十一、Unity3D十二、Java十三、Android十四、Object-C与swift十五、.NET十六、R语言 一、C/C 1. 简介 C语言是目前世界上流行、使用最广泛的高级程序设计语言。C语言对操…

linux基础指令及文件说明(附实例题目 非常详细)

linux基础指令及文件说明 目录计算机基础知识linux基础文件介绍及指令远程连接 修改密码破解密码 文件相关时间命令FHS、目录shell 文本编辑vim用户和组文件压缩和解压文件权限磁盘分区综合实验: 目录 计算机基础知识 计算机由哪些硬件组成: 输入设备&…

liunx基础知识篇 偏指令

计算机由哪些硬件组成: 输入设备:键盘,鼠标,触摸屏,扫描仪,麦克风 输出设备:显示屏,打印机,音响 存储器:内存 运算器 控制器 计算机的种类:pc&…

Cocos Creator3D:制作可任意拉伸的 UI 图像

推荐:将 NSDT场景编辑器 加入你的3D工具链 3D工具集: NSDT简石数字孪生 制作可任意拉伸的 UI 图像 UI 系统核心的设计原则是能够自动适应各种不同的设备屏幕尺寸,因此我们在制作 UI 时需要正确设置每个控件元素的尺寸(size&#…