三、计算机视觉_08YOLO目标检测

devtools/2024/11/30 17:02:02/

0、前言

YOLO作为目前CV领域的扛把子,分类、检测等任务样样精通,本文将基于两个小案例,用YOLO做检测任务,看看效果如何

1、对图片内容做检测

假设我有一张名为picture.jpeg的图片,其内容如下

我将图片和代码放到了同级目录

代码如下:

from ultralytics import YOLO
import cv2
import os# 解决OMP问题
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"# 加载模型
model = YOLO("yolo11n.pt")# 读取图片(这里要写图片的路径和名称)
image = cv2.imread("picture.jpeg")# 预测
results = model(image)# 绘制预测结果
img = results[0].plot()from matplotlib import pyplot as plt
import matplotlib
matplotlib.use('TkAgg')
# 显示图像(BGR转RGB)
# OpenCV默认使用BGR颜色顺序,matplotlib默认使用RGB颜色顺序,所以需要先进行转换,然后才能正常显示
plt.imshow(X=img[:, :, ::-1])
plt.show()

运行结果:(检测出了图片中的目标物,并对边框线、标签以及置信度做了标注)

2、对视频内容做检测

2.1 本地视频

假设我有一段视频文件(bwgqmy.mp4),我需要对视频中的内容进行检测

我将视频文件和代码放到了同级目录

代码如下:

PS:其实视频检测和上面的图片检测一样,是将视频拆分成一帧一帧的图片来做检测,连起来就是视频效果

from ultralytics import YOLO
import cv2# 加载YOLO模型
model = YOLO("yolo11n.pt")# 打开视频(填写自己电脑上想要检测的视频路径和名称即可)
cap = cv2.VideoCapture("bwgqmy.mp4")while cap.isOpened():# read方法用于尝试读取一帧图像,并返回两个值:# (1)status(布尔值,表示是否成功读取帧)# (2)frame(读取到的帧图像)status, frame = cap.read()# 如果读取失败,则跳出循环if not status:print("error")break# 如果视频太大了,则缩小尺寸# height, width = frame.shape[:2]# new_width = width // 2# new_height = height // 2# frame = cv2.resize(frame, (new_width, new_height))# 使用YOLO模型检测物体results = model(frame)# 绘制预测结果img = results[0].plot()# 显示图像(循环显示预测结果的图像,就相当于视频效果)cv2.imshow("demo", img)# 如果按下的是ESC键(ASCII码为27),则跳出循环if cv2.waitKey(delay=1000 // 24) == 27:break# 释放资源
cap.release()
cv2.destroyAllWindows()

运行结果:(检测出了视频中的目标物,并对边框线、标签以及置信度做了标注)

2.2 摄像头

假设我需要对我电脑摄像头拍摄到的内容进行检测

代码如下:

PS:其实和视频检测一样,是将摄像头拍到的内容拆分成一帧一帧的图片来做检测

from ultralytics import YOLO
import cv2# 加载YOLO模型
model = YOLO("yolo11n.pt")# 调起电脑的第0个摄像头
cap = cv2.VideoCapture(0)while cap.isOpened():# read方法用于尝试读取一帧图像,并返回两个值:# (1)status(布尔值,表示是否成功读取帧)# (2)frame(读取到的帧图像)status, frame = cap.read()# 如果读取失败,则跳出循环if not status:print("error")break# 如果显示区域太大了,则缩小尺寸# height, width = frame.shape[:2]# new_width = width // 2# new_height = height // 2# frame = cv2.resize(frame, (new_width, new_height))# 使用YOLO模型检测物体results = model(frame)# 绘制预测结果img = results[0].plot()# 显示图像(循环显示预测结果的图像,就相当于视频效果)cv2.imshow("demo", img)# 如果按下的是ESC键(ASCII码为27),则跳出循环if cv2.waitKey(delay=1000 // 24) == 27:break# 释放资源
cap.release()
cv2.destroyAllWindows()

运行结果:(检测出了摄像头中的目标物,并对边框线、标签以及置信度做了标注)


http://www.ppmy.cn/devtools/138253.html

相关文章

mysql将一个表的数据插入到另一个表中

在MySQL中,可以使用INSERT INTO ... SELECT ...语句将一个表中的数据插入到另一个表。假设我们有两个表:source_table(源表)和target_table(目标表),它们具有相同的结构。以下是一个示例代码&am…

360发布多模态创作引擎纳米搜索,近屿智能带你了解多模态大模型

11月27日晚,360集团正式发布了全新的多模态内容创作引擎——纳米搜索。这款引擎以“搜学写创”为核心能力,不仅打破了传统网页搜索的局限,还超越了现有的答案引擎,被行业解读为搜索引擎3.0,即“创作引擎”。 360集团创…

云计算之elastaicsearch logstach kibana面试题

1.ELK是什么? ELK 其实并不是一款软件,而是一整套解决方案,是三个软件产品的首字母缩写 Elasticsearch:负责日志检索和储存 Logstash:负责日志的收集和分析、处理 Kibana:负责日志的可视化 这三款软件都是开源软件,通常是配合使用,而且又先后归于 Elastic.co 公司名下,…

vue中如何获取public路径

在Vue项目中获取public路径的方法有多种,主要通过以下1、使用相对路径、2、使用环境变量、3、使用webpack配置三种方式来实现。这些方法可以帮助开发者在项目中更灵活地使用静态资源。下面将详细解释每种方法以及如何使用它们。 一、使用相对路径 在Vue项目中&#…

论文笔记 SliceGPT: Compress Large Language Models By Deleting Rows And Columns

欲买桂花同载酒,终不似,少年游。 数学知识 秩: 矩阵中最大线性无关的行/列向量数。行秩与列秩相等。 线性无关:对于N个向量而言,如果任取一个向量 v \textbf{v} v,不能被剩下的N-1个向量通过线性组合的方式…

Python 网络爬虫高级教程:分布式爬取与大规模数据处理

经过基础爬虫和进阶爬虫的学习,我们已经掌握了爬虫的基本原理、动态内容处理及反爬机制的应对。然而,当我们面对海量数据或需要高效爬取多个站点时,分布式爬虫和数据存储、处理能力就显得尤为重要。本篇博客将带你迈向网络爬虫的高级阶段&…

Hive 索引 和 Hive Metastore 的三种配置方式

Hive 索引 和 Hive Metastore 的三种配置方式 Hive 索引(Index) Hive 索引是一种提高查询性能的技术,通过创建索引来加速对特定列的查询。类似于传统关系数据库的索引,Hive 索引能够在查询中快速定位数据,而不必扫描…

3D扫描对文博行业有哪些影响?

三维扫描技术对文博行业产生了深远的影响,主要体现在以下几个方面: 一、高精度建模与数字化保护 三维扫描技术通过高精度扫描设备,能够捕捉到文物的每一个细节,包括形状、纹理、颜色等,从而生成逼真的3D模型。这些模…