libfacedetection 人脸检测库 检测速度慢的问题

news/2025/2/23 2:39:39/

目录

一、libfacedetection 性能介绍

英特尔CPU 使用AVX2指令集 使用AVX512指令集

嵌入式设备

 二、加速检测速度

libfacedetetion的前向推理速度很快的原因

使用axv2加速指令


一、libfacedetection 性能介绍

在上一篇文章中,我发现使用摄像头检测,构建方式为Release,检测耗时150ms左右。但是该项目github主页上的性能介绍是这样的:

英特尔CPU 使用AVX2指令集 使用AVX512指令集

嵌入式设备

 

 二、加速检测速度

libfacedetetion的前向推理速度很快的原因

作者主要使用了三个策略:

1 . 地址分配得当,从而使得conv,pooling等含有大量运算的模块可以做到连续访存。

2. arm上的neon加速指令intel cpu上的avx2加速指令的使用,这两个指令集分别可以使得连续四地址或者连续八地址的内存进行并行计算。1,2策略的结合使得运算速度大大提高。

3. 对计算量最大的conv模块进行了量化操作,开发了对应的int类型运算。

使用axv2加速指令

需要修改两个地方:

1、修改你项目工程的CMakeList.txt,增加以下内容

主要是AVX2指令可以加速检测,openMP有10ms左右的加速作用

 2、修改facedetectorcnn.h文件

取消AVX2的注释

现在摄像头输入1920*1080尺寸的检测耗时是70ms左右

于老师测试用的是 intel  i7-7820,输入尺寸未640*480单线程检测耗时50ms

yolov5n OpenCV DNN 推理 同尺寸摄像头输入 耗是140ms,相比较而言,libfacedetection确实快

有空得研究多线程,个位数的耗时也太诱人了!


 

参考:

libfacedetection 框架阅读及扩展经验_libfacedetection 解析_Rick51的博客-CSDN博客

libfacedetection 让人脸检测如此简单_AndroidKt的博客-CSDN博客


http://www.ppmy.cn/news/61341.html

相关文章

华为EC6108V9E/EC6108V9I_rk3228_安卓4.4.4_通刷_卡刷固件包

华为EC6108V9E/EC6108V9I_rk3228_安卓4.4.4_通刷_卡刷固件包-内有教程 特点: 1、适用于对应型号的电视盒子刷机; 2、开放原厂固件屏蔽的市场安装和u盘安装apk; 3、修改dns,三网通用; 4、大量精简内置的…

Kettle安装与使用

一、Kettle简介 Kettle最早是一个开源的ETL(Extract-Transform-Load的缩写)工具,全称为KDE Extraction, Transportation, Transformation and Loading Environment。后来Kettle重命名为Pentaho Data Integration 。它由Java开发,…

基于改进的离散PSO算法的FJSP的研究(Python代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

学计算机的要不要考研?校招工作不喜欢怎么办?怎样才可以年薪百万?

昨天有粉丝私信我 学的计算机 说他大四马上就要毕业了 然后学校分配的这个工作不是很喜欢 问要不要换个方向 然后身边还有一些同学去考研了 说他要不要考研 等等比较典型的一些问题 所以我总结了一下有三个问题 第一个问题 就学计算机的现在工作不好找 要不要考研 第二个问题就…

BetaFlight统一硬件配置文件研读

BetaFlight统一硬件配置文件研读 1. 源由2. 分析2.1 硬件SOC2.2 统一配置文件2.3 cli命令2.4 板级配置主要命令2.4.1 board_name2.4.2 manufacturer_id2.4.3 resource2.4.4 timer2.4.5 dma2.4.6 serial2.4.7 set2.4.8 feature 3. 实例研读3.1 C遗留配置3.2 BoardName - AOCODAR…

普通2本,去过字节外包,到现在年薪25W+的测试开发,我的2年转行心酸经历...

个人简介 我是一个普通二本大学机械专业毕业,17年毕业,19年转行,目前做IT行业的软件测试已经有3年多,职位是高级测试工程师,坐标上海… 我想现在我也有一点资格谈论关于转行这个话题;希望你在决定转行之前…

浅谈Spring中的BeanFactory与FactoryBean

前言 理解FactoryBean是非常非常有必要的,因为在Spring中FactoryBean最为典型的一个应用就是用来创建AOP的代理对象,不仅如此,而且对理解Mybatis核心源码也非常有帮助!如果甘愿crud,做个快乐的码农,那我就哦…

jdk中juc多线程编程工具

jdk线程池实现原理分析 目录 CompletionService CompletableFuture 基本原理 CompletableFuture的接口 静态方法 handle() vs whenComplete() xxxEither() 异常处理exceptionally() 获取任务结果 结束任务 Semaphore CyclicBarrier CountDownLatch jdk线程池实…