【AIGC】计算机视觉-YOLO系列家族

news/2025/3/17 0:40:20/

YOLO系列家族

YOLO_2">(1)YOLO发展史

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon)和阿里-法哈迪(Ali Farhadi)开发。YOLO 于 2015 年推出,因其高速度和高精确度而迅速受到欢迎。

  • 2016 年发布的YOLOv2 通过纳入批量归一化、锚框和维度集群改进了原始模型。

  • 2018 年推出的YOLOv3 使用更高效的骨干网络、多锚和空间金字塔池化(SPP)进一步增强了模型的性能。

  • 2020 年YOLOv4发布,引入了 Mosaic 数据增强、新的无锚检测头和新的损失函数等创新技术。

  • 2020 年YOLOv5进一步提高了模型的性能,并增加了超参数优化、集成实验跟踪和自动导出为常用导出格式等新功能。

  • 2021 年YOLOX由旷视科技开源,解耦头

  • 2022 年YOLOv6由美团开源,目前已用于该公司的许多自主配送机器人。

  • 2022 年YOLOv7开源,增加了额外的任务,如 COCO 关键点数据集的姿势估计。

  • 2023 年YOLOv8是YOLO 的最新版本,由Ultralytics 提供。YOLOv8 YOLOv8 支持全方位的视觉 AI 任务,包括检测、分割、姿态估计、跟踪和分类。这种多功能性使用户能够在各种应用和领域中利用YOLOv8 的功能。

  • 2024 年YOLOv9引入了可编程梯度信息(PGI)和广义高效层聚合网络(GELAN)等创新方法。

  • 2024年YOLOv10引入了一种双重分配策略,消除了NMS的需求,从而实现了更快、更高效的目标检测。

在这里插入图片描述

  • 2024年YOLO11 新功能: 最新的 模型可在Ultralytics YOLO 检测、分割、姿势估计、跟踪和分类等多项任务中提供最先进的 (SOTA) 性能,充分利用各种人工智能应用和领域的能力。

在这里插入图片描述

  • 2025.02.18 YOLOv12发布,首次摆脱了传统卷积神经网络的约束,将注意力机制直接融入目标检测框架,创新性的使用区域注意力、R-ELAN 和 FlashAttention,在提高检测精度(mAP)的同时保持实时推理性能。

在这里插入图片描述

YOLO家族进化史(v1-v8)

YOLOX_33">(2) YOLOX

目标检测网络YoloX介绍及实现

YOLOX简述

论文地址: https://arxiv.org/abs/2107.08430

代码仓库: https://github.com/Megvii-BaseDetection/YOLOX

YOLOv6_45">(3) YOLOv6

论文地址:

  • YOLOv6 v3.0: A Full-Scale Reloading 🔥
  • YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

代码仓库: https://github.com/meituan/YOLOv6

YOLOv7_56">(4) YOLOv7

论文地址: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

代码仓库: https://github.com/WongKinYiu/yolov7

YOLOv8_64">(5) YOLOv8

论文地址: /

代码仓库: https://github.com/ultralytics/ultralytics

YOLOv9_72">(6) YOLOv9

江大白 | 目标检测YOLOv9算法,重磅开源!

论文地址: https://arxiv.org/abs/2402.13616

代码仓库: https://github.com/WongKinYiu/yolov9

YOLOv10_82">(7)YOLOv10

目标检测 | yolov10 原理和介绍

论文地址: https://arxiv.org/pdf/2405.14458
代码仓库: https://github.com/THU-MIG/yolov10

YOLOv11_89">(8)YOLOv11

YOLOv11来了,使用YOLOv11训练自己的数据集和推理

代码仓库: https://github.com/ultralytics/ultralytics

YOLOv12_95">(9)YOLOv12

YOLOv12问世!

YOLOv12论文详解:以注意力机制为核心的实时目标检测算法(附论文和源码)

论文地址:https://arxiv.org/abs/2502.12524

代码仓库:https://github.com/sunsmarterjie/yolov12


http://www.ppmy.cn/news/1579695.html

相关文章

31页PPT解析数据湖架构、数据湖和数据仓库的区别、湖仓一体化湖仓一体建设解决方案

《大数据湖仓一体解决方案》PPT文档主要介绍了企业数据平台从数据库、数据仓库到数据湖,再到湖仓一体的演进过程,并详细分析了湖仓一体架构的特性及其优势。该方案通过融合数据湖与数据仓库的优势,实现了统一的数据存储、计算和接口管理&…

spring boot实现程序运行过程中数据源动态切换

项目中有一个需求,spring boot项目连接postgres数据库的地址,是存储在etcd当中的,在程序启动后,当etcd中的地址变化时,需要程序去连接新的postgres地址。 1. 修改Datasource定义,改为使用DynamicPGDataSou…

[人工智能]实现神经网络实例

import numpy as np:导入 NumPy 库,用于数值计算。导入 PyTorch 相关库: import torch:导入 PyTorch 库,深度学习框架核心库。from torchvision.datasets import mnist:从torchvision.datasets中导入 MNIST…

虚幻基础:动画层接口

文章目录 动画层:动画图表中的函数接口:名字,没有实现。动画层接口:由动画蓝图实现1.动画层可直接调用实现功能2.动画层接口必须安装3.动画层默认使用本身实现4.动画层也可使用其他动画蓝图实现,但必须在角色蓝图中关联…

蓝桥杯刷题——第十五届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组

一、0握手问题 - 蓝桥云课 算法代码&#xff1a; #include <iostream> using namespace std; int main() {int sum0;for(int i49;i>7;i--)sumi;cout<<sum<<endl;return 0; } 直接暴力&#xff0c;题意很清晰&#xff0c;累加即可。 二、0小球反弹 - 蓝…

我的创作纪念日:730天的技术写作之旅

我的创作纪念日&#xff1a;730天的技术写作之旅 机缘 从一篇案例分析开始 2023年3月13日&#xff0c;我写下了第一篇技术博客《软考高级-系统分析师-案例分析-系统维护与设计模式》。那时的初心很简单&#xff1a; 沉淀实战经验——在备考软考系统分析师时&#xff0c;发现…

Docker-compose一键部署Zabbix监控平台

1. 环境准备 1.1 系统版本 [rootmonitor ~]# cat /etc/redhat-release CentOS Linux release 7.9.2009 (Core) [rootmonitor ~]# uname -a Linux monitor 3.10.0-1160.108.1.el7.x86_64 #1 SMP Thu Jan 25 16:17:31 UTC 2024 x86_64 x86_64 x86_64 GNU/Linux 1.2 Docker版本…

深搜专题11:分数字

描述 将整数N分成K个整数的和且每个数大于等于A小于等于B&#xff0c;求有多少种分法 注意&#xff1a;5 0 0 0 和 0 5 0 0被视为一种方法 输入描述 输入只有一行&#xff0c;分别输入N,K,A,B (所有数字均为不大于30的非负整数) 输出描述 输出只有一行&#xff0c;即多少种分法…