边界框(bounding box) 目标物体的位置和大小 交并比(Intersection over Union,IoU) 锚框(Anchor box)

server/2024/11/15 8:29:40/

边界框(bounding box)

在检测任务中,我们需要同时预测物体的类别和位置,因此需要引入一些跟位置相关的概念。通常使用边界框(bounding box,bbox)来表示物体的位置,边界框是正好能包含物体的矩形框。

在目标检测任务中,边界框(bounding box,bbox)是一个非常重要的概念,用于表示图像中目标物体的位置和大小。边界框通常是一个矩形,其四个参数定义了它在图像中的位置:

  1. (x, y):边界框左上角的坐标(通常是相对于图像左上角的像素位置)。
  2. width:边界框的宽度(以像素为单位)。
  3. height:边界框的高度(以像素为单位)。

有时,为了更便于计算,也会使用以下形式来表示边界框:

(x_min, y_min, x_max, y_max):这里 (x_min, y_min) 是边界框左上角的坐标,而 (x_max, y_max) 是右下角的坐标。

在目标检测任务中,模型不仅需要预测图像中是否存在某个类别的物体,还需要预测这些物体的边界框坐标。这通常是通过回归问题来完成的,即模型输出的是边界框的坐标值,这些坐标值会与真实边界框(ground truth bounding box)的坐标值进行比较,以计算损失并更新模型的参数。

此外,为了评估目标检测模型的性能,还需要使用各种指标,如交并比(Intersection over Union,IoU)来度量预测边界框与真实边界框之间的重叠程度。

IoU 是预测边界框与真实边界框交集区域与并集区域的比例,通常用于判断预测是否正确(例如,当 IoU 大于某个阈值时,认为预测是正确的)。

图1 所示,图中3个人分别对应3个边界框。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

图1 边界框

通常表示边界框的位置有两种方式:

  1. ( x 1 , y 1 , x 2 , y 2 ) (x_1, y_1, x_2, y_2) (x1,y1,x2,y2),其中 ( x 1 , y 1 ) (x_1, y_1) (x1,y1)是矩形框左上角的坐标, ( x 2 , y 2 ) (x_2, y_2) (x2,y2)是矩形框右下角的坐标。图1 中3个红色矩形框用 x y x y xyxy xyxy格式表示如下:
  • 左: ( 40.93 , 141.1 , 226.99 , 515.73 )

http://www.ppmy.cn/server/36283.html

相关文章

【AHK】固定wps的窗口大小/解决wps2019版重新打开窗口会缩小至100*100的bug

解决办法就是每一次点击lbutton添加触发事件,同样也可以换成其他快捷键 #IfWinActive ahk_exe wpp.exe ~lbutton:: justfyWin(ahk_exe wpp.exe) #IfWinActive#IfWinActive ahk_exe wps.exe ~lbutton:: justfyWin(ahk_exe wps.exe) return #IfWinActive#IfWinActive …

SpringBoot+Redission实现排行榜功能

SpringBootRedission实现排行榜功能 demo地址:ranking-demo: 排行榜DEMO (gitee.com) 一、业务需求 实现一个排行榜,要求按照分数和达成这个分数的时间排序,即相同分数下,时间早的在上面 二、Redis中的zSet(有序集合) 1.简介 …

【基础算法总结】滑动窗口二

滑动窗口二 1.水果成篮2.找到字符串中所有字母异位词3.串联所有单词的子串4.最小覆盖子串 点赞👍👍收藏🌟🌟关注💖💖 你的支持是对我最大的鼓励,我们一起努力吧!😃😃 1.水…

将drawable图片转化为byte[]

在Android中,将drawable资源中的图片转化为byte[]数组通常涉及几个步骤。以下是一个基本的步骤指南和示例代码: 获取Drawable资源:首先,你需要从资源中获取Drawable对象。这通常是通过Context的getResources().getDrawable()方法…

如何安全可控地进行内外网跨网络传输文件?

跨网络传输文件通常指的是在不同的网络环境之间移动数据,这在现代企业运营中非常常见。随着网络技术的高速发展,为了有效地保护内部的核心数据资产,企业一般会采用内外网隔离的策略。在进行内外网跨网络传输文件时,需要考虑多种因…

Python实用记录(十六):PyQt/PySide6联动VSCode便捷操作指南

文章目录 一、安装vscode和配置pyside6环境二、安装vscode扩展三、扩展配置编辑四、编辑运行 一、安装vscode和配置pyside6环境 这一步默认已经通过了 二、安装vscode扩展 三、扩展配置编辑 四个地方需要修改;rcc路径、uic路径、designer.exe路径 uic.exe 用于将…

【代码随想录】day51

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 一、309最佳买卖股票时机含冷冻期二、714买卖股票的最佳时机含手续费 一、309最佳买卖股票时机含冷冻期 class Solution { public:int maxProfit(vector<int>…

【模板】二维前缀和

原题链接&#xff1a;登录—专业IT笔试面试备考平台_牛客网 目录 1. 题目描述 2. 思路分析 3. 代码实现 1. 题目描述 2. 思路分析 二维前缀和板题。 二维前缀和&#xff1a;pre[i][j]a[i][j]pre[i-1][j]pre[i][j-1]-pre[i-1][j-1]; 子矩阵 左上角为(x1,y1) 右下角(x2,y2…