【AIGC】计算机视觉-YOLO系列家族

embedded/2025/3/14 17:16:16/

YOLO系列家族

YOLO_2">(1)YOLO发展史

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon)和阿里-法哈迪(Ali Farhadi)开发。YOLO 于 2015 年推出,因其高速度和高精确度而迅速受到欢迎。

  • 2016 年发布的YOLOv2 通过纳入批量归一化、锚框和维度集群改进了原始模型。

  • 2018 年推出的YOLOv3 使用更高效的骨干网络、多锚和空间金字塔池化(SPP)进一步增强了模型的性能。

  • 2020 年YOLOv4发布,引入了 Mosaic 数据增强、新的无锚检测头和新的损失函数等创新技术。

  • 2020 年YOLOv5进一步提高了模型的性能,并增加了超参数优化、集成实验跟踪和自动导出为常用导出格式等新功能。

  • 2021 年YOLOX由旷视科技开源,解耦头

  • 2022 年YOLOv6由美团开源,目前已用于该公司的许多自主配送机器人。

  • 2022 年YOLOv7开源,增加了额外的任务,如 COCO 关键点数据集的姿势估计。

  • 2023 年YOLOv8是YOLO 的最新版本,由Ultralytics 提供。YOLOv8 YOLOv8 支持全方位的视觉 AI 任务,包括检测、分割、姿态估计、跟踪和分类。这种多功能性使用户能够在各种应用和领域中利用YOLOv8 的功能。

  • 2024 年YOLOv9引入了可编程梯度信息(PGI)和广义高效层聚合网络(GELAN)等创新方法。

  • 2024年YOLOv10引入了一种双重分配策略,消除了NMS的需求,从而实现了更快、更高效的目标检测。

在这里插入图片描述

  • 2024年YOLO11 新功能: 最新的 模型可在Ultralytics YOLO 检测、分割、姿势估计、跟踪和分类等多项任务中提供最先进的 (SOTA) 性能,充分利用各种人工智能应用和领域的能力。

在这里插入图片描述

  • 2025.02.18 YOLOv12发布,首次摆脱了传统卷积神经网络的约束,将注意力机制直接融入目标检测框架,创新性的使用区域注意力、R-ELAN 和 FlashAttention,在提高检测精度(mAP)的同时保持实时推理性能。

在这里插入图片描述

YOLO家族进化史(v1-v8)

YOLOX_33">(2) YOLOX

目标检测网络YoloX介绍及实现

YOLOX简述

论文地址: https://arxiv.org/abs/2107.08430

代码仓库: https://github.com/Megvii-BaseDetection/YOLOX

YOLOv6_45">(3) YOLOv6

论文地址:

  • YOLOv6 v3.0: A Full-Scale Reloading 🔥
  • YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

代码仓库: https://github.com/meituan/YOLOv6

YOLOv7_56">(4) YOLOv7

论文地址: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

代码仓库: https://github.com/WongKinYiu/yolov7

YOLOv8_64">(5) YOLOv8

论文地址: /

代码仓库: https://github.com/ultralytics/ultralytics

YOLOv9_72">(6) YOLOv9

江大白 | 目标检测YOLOv9算法,重磅开源!

论文地址: https://arxiv.org/abs/2402.13616

代码仓库: https://github.com/WongKinYiu/yolov9

YOLOv10_82">(7)YOLOv10

目标检测 | yolov10 原理和介绍

论文地址: https://arxiv.org/pdf/2405.14458
代码仓库: https://github.com/THU-MIG/yolov10

YOLOv11_89">(8)YOLOv11

YOLOv11来了,使用YOLOv11训练自己的数据集和推理

代码仓库: https://github.com/ultralytics/ultralytics

YOLOv12_95">(9)YOLOv12

YOLOv12问世!

YOLOv12论文详解:以注意力机制为核心的实时目标检测算法(附论文和源码)

论文地址:https://arxiv.org/abs/2502.12524

代码仓库:https://github.com/sunsmarterjie/yolov12


http://www.ppmy.cn/embedded/172533.html

相关文章

虚拟机下ubuntu进不了图形界面

6.844618] piix4_smbus 0000:07.3: SMBus Host ContrFoller not enabled! 7.859836] sd 2:0:0:0:0: [sda] Assuming drive cache: wirite through /dev/sda1: clean, 200424/1966080 files, 4053235/7864064 blocks ubuntu启动时,卡在上面输出位置 当前遇到的原因…

QT系列教程(13) 事件系统

事件系统 Qt事件系统是非常重要事件传递机制,所有消息传递流程都离不开这个机制,这里主要从重写类的事件响应函数,事件过滤器以及重写event函数三种方式做介绍。 重写事件函数 这种方式最为直接,我们先创建项目,选择QApplicati…

使用RabbitMQ实现流量削峰填谷

原理 流量削峰填谷是指在面对突发的高流量时,通过消息队列将瞬时大量请求暂时存储起来,并逐步处理这些请求,从而避免系统过载。RabbitMQ 作为消息中间件可以很好地支持这一需求,特别是结合其延时消息插件(rabbitmq_de…

C++程序设计语言笔记——基本功能:源文件与程序

0 用头文件表达接口、强调逻辑结构。 我们以 C 语言为例,展示如何通过头文件组织模块化设计: 示例场景:日志模块接口设计 文件结构 include/log.h // 公共接口log_config.h // 配置参数log_internal.h // 内部实现细节&#xf…

什么是大模型微调?

在大模型(如GPT、BERT、LLaMA等)广泛应用的今天,“微调”(Fine-Tuning)已成为释放模型潜力的关键技术。它通过针对特定任务调整预训练模型,使其从“通才”变为“专才”。本文将从概念、原理到实践&#xff…

C语言 进阶指针学习笔记

文章目录 字符指针指针数组数组指针数组名数组传参 函数指针函数指针数组指向函数指针数组的指针 回调函数Qsort 的使用通过冒泡排序模拟实现 qsort 大部分的内容都写在代码注释中 指针有类型,指针的类型决定了指针的整数的步长,指针解引用操作的时候的权…

Spring Boot中实现多租户架构

Spring Boot中实现多租户架构 在当今的企业级应用开发中,多租户架构已经成为一项关键技术,尤其是对于需要服务多个客户群体的 SaaS(软件即服务)系统。多租户架构的核心思想是通过共享资源来降低运营成本,同时确保各个…

如何安全处置旧设备?

每年,数百万台旧设备因老化、故障或被新产品取代而被丢弃,这些设备上存储的数据可能带来安全风险。 如果设备没有被正确删除数据,这些数据往往仍可被恢复。因此,安全处置旧设备至关重要。 旧设备可能包含的敏感数据 旧设备中可能…