【玩转全栈】---基于YOLO8的图片、视频目标检测

embedded/2025/1/24 0:07:38/

本篇主要讲YOLO8的具体操作,想要了解YOLO的具体原理,可以去官网查询

目录

下载ultralytics库

开始检测


介绍

        YOLOv8(You Only Look Once Version 8)是 YOLO 系列的最新版本,由 Ultralytics 开发并发布,是一种实时目标检测算法。相比之前的版本,YOLOv8 提供了更高的精度和更快的推理速度,同时支持目标检测、图像分割和姿态估计等任务。它采用了模块化设计,结合更先进的网络结构和训练技术,例如动态标签分配和改进的损失函数,从而提升了模型性能和泛化能力。此外,YOLOv8 兼容 PyTorch 框架,支持灵活的模型大小调整和迁移学习,适合在不同硬件设备(如 GPU、CPU)上运行。其用户友好的 API 和详细的文档使得开发者能够轻松集成和部署 YOLOv8,在安防监控、自动驾驶、智能零售等领域具有广泛应用。

YOLOv8 与 YOLOv5 比较

特性YOLOv8YOLOv5
发布时间2023 年2020 年
核心功能目标检测、图像分割、姿态估计目标检测
模型结构使用全新的架构,优化模块化设计,支持更高效的推理CSPNet 架构,较传统但已优化
性能更高的 mAP 精度和推理速度性能优秀,但不如 YOLOv8
任务支持多任务(检测、分割、姿态估计)仅支持目标检测
训练优化动态标签分配、改进的损失函数使用固定标签分配方式,损失函数为 BCE+IoU
部署灵活性支持 ONNX、TensorRT、CoreML、OpenVINO 等主流推理框架支持 ONNX 和 TensorRT,灵活性稍低
代码简洁性更直观的 API 和模块化设计,易于扩展和使用代码清晰,但接口较 YOLOv8 略显复杂
兼容性向下兼容 YOLOv5 数据集格式原生支持 YOLO 数据格式
适用场景更广泛(如精细分割、人体姿态估计)目标检测为主

下载ultralytics库

控制台 pip 下载

pip install ultralytics

清华镜像源下载,国内镜像网站,速度更快

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple ultralytics

下载YOLO的预训练模型文件:

https://download.csdn.net/download/2403_83182682/90295807?spm=1001.2014.3001.5503

开始检测

YOLO检测分两步:1、加载预训练模型;2、检测目标。

首先导入ultralytics 库

from ultralytics import YOLO

加载预训练模型

model = YOLO('yolov8l.pt')

检测目标

model('1.png',show=True)
# show=True 是否显示图片

持续显示

import cv2
# 持续显示
cv2.waitKey(0)

照片随便找张即可,这是官方使用的检测照片

运行结果如下:

检测出来框内是某事物的概率

如果想要保存检测后图片,只需添加参数:

model('1.png',show=True,save=True)

运行后,会自动创建文件夹并将预测图片储存。

        同样地,检测网络图片和视频也是这样,检测网络图片仅需将url复制进model中即可,模型会先下载网络图片,再进行检测。

视频识别按照一秒60帧的速度来检测目标,可以传本地,也可以用网络url

视频识别结果如下:

基于YOLO8的目标识别

可以看到,这样的训练对于人物和部分物体是能识别到的,但一些其他的物体,比如健身器材,就检测不到,这是因为像这样的目标识别是基于官方预训练模型进行的,所检测出来的内容也只能是预训练模型中训练的,这样当然是不能满足特定场景的特定需求,想要实现特定场景下的特定识别,还得自己训练模型。

下一篇将介绍如何训练自己的模型并运用。

感谢您的三连!!!


http://www.ppmy.cn/embedded/156430.html

相关文章

面试-二维数组

应用 快递业务有N个站点&#xff0c;1<N<10000&#xff1b;站点0、站点1可达&#xff0c;记作0-1&#xff1b;如果0-1、1-2&#xff0c;则站点0、站点2可达&#xff0c;记作0-2&#xff1b;s[i][j]1表示i-j可达&#xff0c;反之s[i][j]0表示i-j不可达&#xff1b;s[i][j…

高水平EI会议-第四届机器学习、云计算与智能挖掘国际会议

一、会议信息 大会名称&#xff1a;第四届机器学习、云计算与智能挖掘国际会议&#xff08;MLCCIM 2025&#xff09; 会议地点&#xff1a;中国漠河 会议时间&#xff1a;2025年7月21-25日 截稿日期&#xff1a;2025年5月10日 支持单位&#xff1a;佛山市人工智能学会、佛…

CSS align-content 属性

定义和用法 align-content 属性修改 flex-wrap 属性的行为。它与 align-items 相似&#xff0c;但是它不对齐弹性项目&#xff0c;而是对齐弹性线。 注意&#xff1a;必须有多行项目&#xff0c;此属性才能生效&#xff01; 提示&#xff1a;使用 justify-content 属性可将主…

51单片机(三) UART协议与串口通信实验

几个问题 串行通信与并行通信的优缺点。 串行通信传输线少&#xff0c;占用引脚资源少&#xff0c;长距离传输时成本低&#xff0c;但通信控制更加复杂&#xff0c;速度比并行要慢。 并行通信占用引脚资源多&#xff0c;长距离成本高&#xff0c;但速度快。 什么是比特率&…

QTableWidget的简单使用

1.最简单的表格示例&#xff1a; ui->tableWidget->setRowCount(2);// 设置行数ui->tableWidget->setColumnCount(3);// 设置列数&#xff0c;一定要放在设置行表头之前QStringList rowHeaderList;// 行表头rowHeaderList << QStringLiteral("姓名"…

InVideo AI技术浅析(三):计算机视觉

一、图像识别与分类 1. 工作原理 图像识别与分类是计算机视觉的基础任务,旨在将输入的图像自动分配到预定义的类别中。InVideo AI 使用卷积神经网络(CNN)来实现这一功能。CNN 通过多层卷积和池化操作,自动提取图像的特征,并使用全连接层进行分类。 2. 关键技术模型 卷…

uniapp button按钮去掉默认样式

有时候要使用uniapp官方提供的客服和分享功能&#xff0c;需要用到button按钮&#xff0c;里面属性open-type正好可以实现这些功能&#xff0c;不得不使用这种方式。 但是这种方式&#xff0c;uniapp官方默认为button按钮加了些样式&#xff0c;自己写的样式也无法进行完全覆盖…

从 TCP/IP 演进看按序流与性能

前面谈到互联网从早期对等通信模型转入后来内容分发模型后的一系列问题&#xff0c;诸如拥塞&#xff0c;安全等&#xff0c;本文谈谈关于性能的更普遍方面。 TCP/IP 祖师爷 1974 年的开山论文 A Protocol for Packet Network Intercommunication 以及随后 RFC675&#xff0c;…