QAI AppBuilder 快速上手(7):目标检测应用实例

ops/2025/3/18 21:28:11/

YOLOv8_det是YOLO 系列目标检测模型,专为高效、准确地检测图像中的物体而设计。该模型通过引入新的功能和改进点,如因式分解卷积(factorized convolutions)和批量归一化(batch normalization),在性能和灵活性上有显著提升。YOLOv8_det 还具有较高的计算效率,能够在各种硬件平台上运行,从 CPU 到 GPU 都能提供出色的性能。其设计使其在实时检测任务中表现优异,适用于智能驾驶、安防监控、医疗影像、工业检测等多个领域。总的来说,YOLOv8_det 是一个强大且高效的图像处理工具,适用于需要高精度和高性能的应用场景。

本文章主要介绍使用YOLOv8_det模型进行目标检测,如何配置QAI AppBuilder工具及环境。包括了准备需要处理的图像数据,加载YOLOv8_det模型,运行示例代码进行目标检测,查看处理后的图像效果等步骤。通过这些步骤,可以更加熟悉地使用YOLOv8_det模型并进行目标检测工作

前置条件

  • 高通 Windows on Snapdragon
  • 各平台账号,包括:Github、高通 Software Center

操作方法及步骤

1. 快捷使用yolov8_det目标检测应用

  • 执行前准备

确保在设备中已经搭建好对应的PythonQNN环境,具体方法请参考:QAI-AppBuilder快速上手及环境配置

  • 打开Powershell终端,在Python虚拟环境中执行以下命令:

python yolov8_det\yolov8_det.py

输入图像:

输出结果:

  • 结果分析:

这张图片的结果显示了yolov8_det型对图像中物体的检测情况。具体来说,模型在图像中检测到了三个物体,并用绿色框标识出来。每个框内的标签和置信度从左到右如下:

Vase:置信度为 0.56,表示模型认为这个物体是花瓶的概率为 56%

Cup:置信度为 0.67,表示模型认为这个物体是杯子的概率为 67%

Cup:置信度为 0.60,表示模型认为这个物体是杯子的概率为 60%

这些置信度值表示模型对每个检测结果的信心程度。较高的置信度值表明模型对该检测结果更有信心。

2. 手动配置运行yolov8_det应用

  • 环境准备

确保在设备中已经搭建好对应的PythonQNN环境,具体方法请参考:QAI-AppBuilder快速上手及环境配置

  • 将安装好的QNN SDK 中的 QNN 库复制到qai_libs目录中

qai_libs\libQnnHtpV73Skel.so
qai_libs\QnnHtp.dll
qai_libs\QnnHtpV73Stub.dll
qai_libs\QnnSystem.dll
qai_libs\libqnnhtpv73.cat

  • 从以下链接下载示例代码

yolov8_det.py

下载示例代码后,将其复制到工作目录根目录

  • 将输入数据复制到工作目录根目录下

input.jpg

  • 准备好所有目录文件后,整体目录结构如下:

运行脚本下载的模型会存放在models

  • 运行示例代码

python .\yolov8_det.py

  • 运行结果(输出图像将保存到output.jpg

作者:

赵世朝(Shizhao Zhao),高通工程师


http://www.ppmy.cn/ops/166874.html

相关文章

python爬虫笔记(一)

文章目录 html基础标签和下划线无序列表和有序列表表格加边框 html的属性a标签(网站)target属性换行线和水平分割线 图片设置宽高width,height html区块——块元素与行内元素块元素与行内元素块元素举例行内元素举例 表单from标签type属性pla…

ImGui 学习笔记(五) —— 字体文件加载问题

ImGui 加载字体文件的函数似乎存在编码问题,这一点可能跟源文件的编码也有关系,我目前源文件编码是 UTF-16。 当参数中包含中文字符时,ImGui 内部将字符转换为宽字符字符集时候,采用的 MultiByteToWideChar API 参数不太对&#…

Java 的 CopyOnWriteArrayList 和 Collections.synchronizedList 有什么区别?分别有什么优缺点?

CopyOnWriteArrayList 问题:什么是 CopyOnWriteArrayList? 解答: CopyOnWriteArrayList 是 Java 并发包 (java.util.concurrent) 提供的一种 线程安全 的 List 实现,它的核心特性是 写时复制(Copy-On-Write)。即,每当执行修改操作(如 add()、set()、remove())时,都…

CSS中z-index使用详情

定位层级 1.定位元素的显示层级比普通元素高,无论什么定位,显示层级都是一样的; 2.如果位置发生重叠,默认情况是:后面的元素,会显示在前面元素之上; 3.可以通过CSS属性z-index调整元素的显示层级; 4.z-index的属性值是数字,没有单位,值越大显示层级越高; 5.只有定位的元素…

上下文微调(Contextual Fine-Tuning, CFT)提高大型语言模型(LLMs)在特定领域的学习和推理能力

大型语言模型(LLMs)在开放领域任务中表现出色,但在快速演变的专业领域(如医学、金融)中面临挑战: 知识更新难题:传统指令微调(Instruction Fine-Tuning, IFT)依赖显式指令,难以适应动态知识。灾难性遗忘:持续预训练(Continued Pretraining, CPT)可能导致模型遗忘已…

WPF未来展望:紧跟技术发展趋势,探索新的可能性

WPF未来展望:紧跟技术发展趋势,探索新的可能性 一、前言二、WPF 与.NET 技术的融合发展2.1 拥抱.NET Core2.2 利用.NET 5 及后续版本的新特性 三、WPF 在新兴技术领域的应用拓展3.1 与云计算的结合3.2 融入物联网生态 四、WPF 在用户体验和设计方面的创新…

密码学研究热点

一、后量子密码学 抗量子算法研究 开发能够抵抗量子计算机攻击的加密算法,如基于格的密码学(LWE、NTRU)、基于同源的密码学(Isogeny)和基于编码理论的密码学。 标准化进程 NIST等机构正推动后量子密码算法的标准化…

审批工作流系统xFlow

WorkFlow-审批流程系统 该项目为完全开源免费项目 可用于学习或搭建初始化审批流程系统 希望有用的小伙伴记得点个免费的star gitee仓库地址 仿钉钉飞书工作审批流系统 介绍 前端技术栈: vue3 ts vite arcodesign eslint 后端技术栈:springbootspring mvc mybatis mavenmysq…