YOLOv7+姿态估计Pose+tensort部署加速

news/2024/12/28 13:34:49/

YOLOv7-Pose

YOLOv7是一种高效的目标检测算法,用于实时物体检测。姿态估计Pose是一种用于识别和跟踪人体关键点的技术。TensorRT是一个针对深度学习推理任务进行加速的高性能推理引擎。

将YOLOv7和姿态估计Pose与TensorRT结合可以实现快速而准确的目标检测和姿态估计任务。首先,使用YOLOv7进行目标检测,它具有高效的网络结构和多尺度特征融合机制,能够在保持准确性的同时提高推理速度。然后,利用得到的目标框信息,将其输入到Pose模型中,进行姿态估计。Pose模型通过分析人体关键点来确定人体的姿态,例如头部、手臂、腿部等。

为了进一步提升推理速度,可以使用TensorRT进行加速。TensorRT利用深度学习模型中的并行计算、内存优化和精度调整等技术,对模型进行优化和推理加速。通过将YOLOv7和Pose模型转换为TensorRT可执行文件,可以充分利用GPU的计算能力,实现更快的推理速度。

总之,通过将YOLOv7和姿态估计Pose与TensorRT结合,可以实现高效的目标检测和姿态估计任务。这种部署加速方案不仅提高了推理速度,还保持了较高的准确性,适用于实时应用场景,如视频监控、人体行为分析等
在这里插入图片描述

实现YOLOv7:可训练的免费套件为实时目标检测设置了最新技术标准

YOLOv7-Pose的姿态估计是基于YOLO-Pose的。关键点标签采用MS COCO 2017数据集。

训练

使用预训练模型yolov7-w6-person.pt进行训练。训练命令如下:

python -m torch.distributed.launch --nproc_per_node 8 --master_port 9527 train.py --data data/coco_kpts.yaml --cfg cfg/yolov7-w6-pose.yaml --weights weights/yolov7-w6-person.pt --batch-size 128 --img 960 --kpt-label --sync-bn --device 0,1,2,3,4,5,6,7 --name yolov7-w6-pose --hyp data/hyp.pose.yaml

部署

  1. 导出ONNX模型

运行以下命令生成onnx模型和引擎模型:

python models/export_onnx.py \--weights weights/yolov7-w6-pose.pt \--img-size 832 \--device 0 \--batch-size 1 \--simplify
  1. 导出TensorRT模型

使用脚本:

python models/export_TRT.py \--onnx weights/yolov7-w6-pose.onnx \--batch-size 1 \--device 1 \--fp16

或者使用trtexec:

trtexec \--onnx=weights/yolov7-w6-pose.onnx \--workspace=4096 \--saveEngine=weights/yolov7-w6-pose-FP16.engine \--fp16

推理

  1. PyTorch模型推理
python detect_multi_backend.py \--weights weights/yolov7-w6-pose.pt \--source data/images \--device 0 \--img-size 832 \--kpt-label
  1. ONNX模型推理
python detect_multi_backend.py \--weights weights/yolov7-w6-pose.onnx \--source data/images \--device 0 \--img-size 832 \--kpt-label
  1. TensorRT模型推理
python detect_multi_backend.py \--weights weights/yolov7-w6-pose.engine \--source data/images \--device 0 \--img-size 832 \--kpt-label

测试

使用yolov7-w6-pose.pt进行测试:

官方YOLOv7-pose和YOLO-Pose代码只在test.py中计算检测mAP。若要计算关键点mAP,需使用COCO API。在此仓库中实现的oks_iou矩阵计算加速了关键点mAP的计算。测试关键点mAP时,oks区域设置为0.6乘以ground truth box的区域。

  1. 测试PyTorch模型
python test_multi_backend.py \--weights weights/yolov7-w6-pose.pt \--data data/coco_kpts.yaml \--img-size 832 \--conf-thres 0.001 \--iou-thres 0.6 \--task val \--device 0 \--kpt-label
  1. 测试ONNX模型
python test_multi_backend.py \--weights weights/yolov7-w6-pose.onnx \--data data/custom_kpts.yaml \--img-size 832 \--conf-thres 0.001 \--iou-thres 0.6 \--task val \--device 0 \--kpt-label
  1. 测试TensorRT模型
python test_multi_backend.py \--weights weights/yolov7-w6-pose-FP16.engine \--data data/coco_kpts.yaml \--img-size 832 \--conf-thres 0.001 \--iou-thres 0.6 \--task val \--device 0 \--kpt-label

INT8校准

python models/export_TRT.py \--onnx weights/yolov7-w6-pose.onnx \

http://www.ppmy.cn/news/1255456.html

相关文章

《微信小程序开发从入门到实战》学习四十

4.2 云开发JSON数据库 4.2.11 更新数据 使用数据库API更新数据有两种方法:一.将记录局部更新的update方法;二.以替换的方式更新记录的set方法 update方法可以局部更新一个记录或一个集合的多个记录,更新时只有指定字段更新,其他…

【Linux】第二十六站:软硬链接

文章目录 一、软链接二、硬链接三、ln命令四、该如何理解硬链接?五、如何理解软链接六、为什么要用软硬链接1.软链接的应用场景2.硬链接的应用场景 一、软链接 如下所示,我们创建一个文件以后,然后执行下面的指令 ln -s file.txt soft-link…

CnosDB有主复制演进历程

分布式存储系统的复杂性涉及数据容灾备份、一致性、高并发请求和大容量存储等问题。本文结合CnosDB在分布式环境下的演化历程,分享如何将分布式理论应用于实际生产,以及不同实现方式的优缺点和应用场景。 分布式系统架构模式 分布式存储系统下按照数据复…

JOSEF电流继电器 DL-33 整定范围0.5-2A 柜内安装板前接线

系列型号: DL-31电流继电器; DL-32电流继电器; DL-33电流继电器; DL-34电流继电器; 一、用途 DL-30系列电流继电器用于电机保护、变压器保护和输电线的过负荷和短路保护线路中,作为起动元件。 二、结构和原理 继电器系电磁式,瞬时动作…

llama.cpp部署通义千问Qwen-14B

llama.cpp是当前最火热的大模型开源推理框架之一,支持了非常多的LLM的量化推理,生态比较完善,是个人学习和使用的首选。最近阿里开源了通义千问大语言模型,在众多榜单上刷榜了,是当前最炙手可热的开源中文大语言模型。…

SQL Server对象类型(7)——4.7.触发器(Trigger)

4.7. 触发器(Trigger) 4.7.1. 触发器概念 与Oracle中类似,SQL Server中,触发器是虚的、被定义的数据库代码对象,其本身并不存储数据,其通过数据库事件来自动触发预先定义的特定代码片段,以解决用户特定业务需求和完成特定任务。 4.7.2. 触发器注解 1)触发器的本质:…

Shell循环:expect(一)

一、名词解释: 我们通过Shell可以实现简单的控制流功能,如:循环、判断等。但是对于需要交互的场合则必须通过人工来干预,有时候我们可能会需要实现和交互程序如ssh服务器等进行交互的功能。而Expect就使用来实现这种功能的工具。E…

力扣二叉树--第三十七天

前言 废话不多说,能学到东西!功不唐捐! 内容 一、二叉搜索树的最小绝对差 530. 二叉搜索树的最小绝对差 给你一个二叉搜索树的根节点 root ,返回 树中任意两不同节点值之间的最小差值 。 差值是一个正数,其数值等…