每天五分钟计算机视觉:基于YOLO算法精确分类定位图片中的对象

滑动窗口的卷积的问题

滑动窗口的卷积实现效率很高,但是它依然不能够输出最精准的边界框,比如下面所示:

我们可以看到蓝色框不论在什么位置都不能很好的确定车的位置,有一个算法YOLO 算法它能够帮助我们解决这个问题。

YOLO 算法

比如我们的输入图像是100*100,我们会在图像上放一个网格。这个网络要用比较精细的,比如19*19,但是为了讲解方便,我们使用3*3的网格

比如本张图像就被分成了九个小格子了。然后我们使用图像分类和定位算法应用到每一个小格子上,也就是我们将每一个小格子看成是一个样本,对每一个小格子都应用图像分类定位算法,具体来说就是1、2、3、7、8、9样本的标签是这样的

而5格子是有一点争议的,因为看起来6的车有一点在5位置,为了让图片中的目标只属于一个格子,yolo算法规定目标的中心点在哪个格子,那么这个物体就属于哪个格子,很明显6中的那个白车目标的中心点在6中,所以我们认为白车在6中,而5中什么都没有,所以5的标签也是


http://www.ppmy.cn/server/25002.html

相关文章

煤矿综合自动化智能监控系统

系统概述 建设煤矿井上下工业环网、工业数据集成平台、排水、供电、运输、通风、压风、瓦斯抽放、采掘、智能洗煤厂等智能自动化控制系统,利用多种软硬件接口(OPC协议、驱动通讯、数据库、文本文件、DDE/NETDDE、子网等),构建全矿井统一、稳定、高效的数…

spring cache(一)介绍

一、介绍 1、背景 项目中使用最多的缓存技术就是Redis,用Redis就可以实现了,为什么需要使用spring cache? 先看下我们使用缓存步骤: (1)查寻缓存中是否存在数据,如果存在则直接返回结果 (2&#xff09…

动态规划:0/1背包问题

01背包问题是一个经典的动态规划问题,它询问在给定的物品和背包容量下,如何选择物品使得背包中的物品总价值最大,同时保证不超过背包的容量限制。物品不能分割,每个物品只能选择放入或不放入背包。 问题定义 输入: 物…

HarmonyOS-Next开源三方库 MPChart:打造出色的图表体验

点击下载源码https://download.csdn.net/download/liuhaikang/89228765 简介 随着移动应用的不断发展,数据可视化成为提高用户体验和数据交流的重要手段之一。在 OpenAtom OpenHarmony(简称“OpenHarmony”)应用开发中,一个强大而…

大语言模型在专业领域的应用——医疗场景下的大语言模型

大语言模型在专业领域的应用——医疗场景下的大语言模型 构建面向医疗的大语言模型数据资源总结医疗是与人类生活密切相关的重要领域之一。由于具有较强的通用任务解决能力,大语言模型被广泛用于辅助医生处理各种相关医疗任务,例如医疗诊断、临床报告生成、医学语言翻译、心理…

编译工具各版本与操作系统版本号兼容性冷知识 : JetBrains IntelliJ IDEA 各个主要版本及其对应的操作系统版本号的兼容情况

编译工具各版本与操作系统版本号兼容性冷知识 🧠: JetBrains IntelliJ IDEA 各个主要版本及其对应的操作系统版本号的兼容情况 文章目录 编译工具各版本与操作系统版本号兼容性冷知识 🧠: JetBrains IntelliJ IDEA 各个主要版本及其对应的操作系统版本号…

站群SEO优化策略及其遭遇DDoS攻击时的应对方法

一、站群SEO优化策略 站群优化主要是指通过合理布局和内容优化提升一系列网站在搜索引擎中的整体排名表现。以下是一些关键步骤与相关代码示例(以WordPress为例): 差异化内容建设: 每个站点的内容必须具有独立性和价值性&#x…

asyncio异步编程(三)

1.异步迭代器 迭代器:内部实现__iter__()和__next__()方法的对象。 可迭代对象:内部实现__iter__()方法,并且可以返回迭代器的对象。 异步迭代器:实现__aiter__()和__anext__()方法的对象。 异步可迭代对象:内部实…

未来已来:深入探索LLAMA3驱动的人工智能革命

大家好!相信大家对于AI(人工智能)的发展已经有了一定的了解,但你是否意识到,到了2024年,AI已经变得如此强大和普及,带来了我们从未想象过的便利和创新呢?让我们一起来看看AI在这个时…

http基础了解

超文本传输协议(HTTP)是一个用于传输超媒体文档(例如 HTML)的应用层协议。它是为 Web 浏览器与 Web 服务器之间的通信而设计的,但也可以用于其他目的。HTTP 遵循经典的客户端—服务端模型,客户端打开一个连…

pytorch-解决过拟合之动量与学习率衰减

目录 1. momentum动量2. pytorch增加momentum3. 学习率衰减4. 学习率衰减的方式4.1 loss连续几次无改善衰减 4.2 步进式衰减 1. momentum动量 下图给出了梯度公式和增加了动量的梯度公式,β z k z^k zk其中的 z k z^k zk就是上次的梯度,而β决定了 w k …

【React】反向代理和修改打包后的目录

反向代理 前提是做了反向代理: 安装 http-proxy-middleware npm i http-proxy-middleware在src/下新建 setupProxy.js const proxy require("http-proxy-middleware");module.exports function(app) {app.use(proxy("/api", {target: &qu…

Sublime Vim模式配置:q关闭当前标签页

在Sublime安装目录下的->Packages文件夹下新建User文件夹创建文件Vintage.sublime-commands 路径为Sublime安装目录->Packages->User->Vintage.sublime-commands文件内容如下[{"caption": ":w - Save","command": "save"}…

java中的代理模式

静态代理 public interface SmsService {void sent(String message); } class SmsServiceImpl implements SmsService{Overridepublic void sent(String message) {System.out.println("这是发送的信息:"message);} } class SmsServiceProxy implements SmsService{…

边OTG边充电芯片LDR6500

随着科技的飞速发展,智能移动设备已成为我们生活中不可或缺的一部分。而在这些设备的连接与数据传输中,Type-C接口以其高效、便捷的特性逐渐占据了主导地位。OTG(On-The-Go)技术则进一步扩展了Type-C接口的功能,使得设…

Linux 解压报错

在linux上面解压压缩包,有可能遇到一下问题,现提供正确语句供参考 一、tar命令解压.zip文件 在使用tar命令解压.zip格式文件时,有时会遇到一下异常 gzip: stdin has more than one entry--rest ignored tar: Child returned status 2 ta…

人脸识别系统

一、引言 随着科技的飞速发展,人脸识别技术已经成为现代社会中一个重要的科技应用领域。人脸识别系统,顾名思义,是通过分析人的面部特征进行身份识别的一种技术。近年来,这一技术在公共安全、金融服务、智能门禁、手机解锁等多个领域得到了广泛应用,极大地提升了社会的安…

【NTN 卫星通信】NTN应该使用FDD还是TDD双工模式

1 概述 现在主流的商用地面通信系统一般都支持FDD和TDD两种模式,实用于不同的频段。那么卫星通信也需要有这两种模式吗? 2 NTN 双工模式分析 在考虑TDD模式时,需要设置保护时间,以防止终端同时发射和接收。该保护时间直接取决于终…

Kafka 3.x.x 入门到精通(06)——Kafka进阶

Kafka 3.x.x 入门到精通(06)👉👉👉👉 Kafka进阶 3. Kafka进阶3.1 Controller选举3.2 Broker上线下线3.3 数据偏移量定位3.4 Topic删除3.5 日志清理和压缩3.7 页缓存3.8 零拷贝3.9 顺写日志3.10 Linux集群部…

webpack中mode、NODE_ENV、DefinePlugin、cross-env的使用

本文讲的全部知识点,都是和webpack相关的。如果你之前有疑问,那本文一定能帮你搞清楚。 问题来源一般是类似下面代码(webpack.json中): "scripts": {"dev": "cross-env NODE_ENVdevelopmen…