机器学习:opencv--人脸检测以及微笑检测

ops/2024/10/20 2:45:50/

目录

前言

一、人脸检测的原理

1.特征提取

2.分类器

二、代码实现

1.图片预处理

2.加载分类器

3.进行人脸识别

4.标注人脸及显示

三、微笑检测


前言

        人脸检测是计算机视觉中的一个重要任务,旨在自动识别图像或视频中的人脸。它可以用于多种应用,如安全监控、身份验证、人机交互等。

 

一、人脸检测的原理

1.特征提取

  • Haar特征

    • 基于Haar小波变换,通过简单的矩形特征(如眼睛、鼻子、嘴巴的对比)来识别图像中的人脸。
    • Haar特征计算速度快,适合实时应用。

 

2.分类器

        这里使用的是python自带的库的分类器模型,是一种级联分类器

  • 分类器需要对图像的多个特征进行识别。
  1. 例如,在识别一个动物是狗(正类)还是其他动物(负类)时,直接根据多个条件进行判断,流程是非常烦琐的。
  2. 如果先判断该动物有几条腿。有四条腿的动物被判断为可能为狗,并对此范围内的对象继续进行分析和判断。
  3. 没有四条腿的动物直接被否决,即不可能是狗。
  4. 只通过比较腿的数目就能排除样本集中大量的负类(如鸡、鸭、鹅等不是狗的动物的实例)。
  5. 级联分类器就是基于这种思路将多个简单的分类器按照一定的顺序级联而成的。

 

二、代码实现

1.图片预处理

import cv2image = cv2.imread('quanjiafu2.jpg')
image = cv2.resize(image, None, fx=0.4, fy=0.4)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

 

2.加载分类器

"""-----------------加载分类器----------------"""
faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

 

3.进行人脸识别

"""------------------- 分类器检测实现人脸识别--------------"""
# objects = cv2.CascadeClassifier,detectMultiscale( imagel, scaleFactor[,minNeighbors[,flags[,minsize[, maxsize]]]]])
# 其中,各个参数及返回值的含义如下:
# image:待检测图像,通常为灰度图像。
# scaleFactor:表示在前后两次相继扫描中搜索窗口的缩放比例。识别,扫描,按照不同比例来进行扫描
# minNeighbors:表示构成检测目标的相邻矩形的最小个数。在默认情况下,该参数的值为 3,
#           表示有 3 个以上的检测标记存在时才认为存在人脸。如果希望提高检测的准确率可以将该参数的值设置得更大。
#           但这样做可能会让一些人脸无法被检测到。
# flags: 该参数通常被省略。在使用低版本 OpencV(opencV 1.X 版本)时,该参数可能会被设置为
# CV_HAAR_DO_CANNY_PRUNING,表示使用 Canny 边缘检测器拒绝一些区域。
# minSize:目标的最小尺寸,小于这个尺寸的目标将被忽略。
# maxSize: 目标的最大尺寸,大于这个尺寸的目标将被忽略。通常情况下,将该可选参数省略即可
#           若 maxsize 和 minsize 大小一致,则表示仅在一个尺度上食找目标。
# objects: 返回值. 目标对象的矩形框向量组。该值是一组矩形信息.
#           包含每个检测到的人脸对应的矩形框的信息(x轴方向位置、y轴方向位置、宽度、高度)faces = faceCascade.detectMultiScale(gray, scaleFactor=1.05, minNeighbors=5, minSize=(8, 8))
print("发现{0}张人脸!".format(len(faces)))
print("其位置分别是:", faces)

 

4.标注人脸及显示

"""---------------标注人脸及显示------------------"""
for (x, y, w, h) in faces:cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
cv2.imshow('result', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

输出:

 

三、微笑检测

  • 微笑检测是在人脸检测的基础上进行的
    1. 加载微笑检测分类器
    2. 打开摄像头
    3. 检测一帧图片
    4. 进行人脸检测
    5. 提取出每张人脸所在的矩形区域
    6. 对该矩形区域进行微笑检测
    7. 微笑时,在矩形框的左上角表上smile
    8. 按下esc结束
import cv2faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
smile = cv2.CascadeClassifier('haarcascade_smile.xml')cap = cv2.VideoCapture(0)
while True:ret, frame = cap.read()frame = cv2.flip(frame, 1)  # 图片翻转 水平翻转if not ret:breakgray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)faces = faceCascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=10, minSize=(5, 5))"""--------处理每张人脸-------"""for (x, y, w, h) in faces:cv2.rectangle(frame, (x, y), (x + w, y + h), (0, 255, 0), 2)# 提取人脸所在区域 多通道形式# roiColorFace = frame[y:y+h,x:x+w]# 单通道形式roi_gray_face = gray[y:y + h, x:x + w]# 微笑检测smiles = smile.detectMultiScale(roi_gray_face, scaleFactor=1.5, minNeighbors=10, minSize=(50, 50))for (sx, sy, sw, sh) in smiles:cv2.putText(frame, "smile", (x, y), cv2.FONT_HERSHEY_COMPLEX_SMALL, 1, (0, 255, 255), 2)cv2.imshow('result', frame)a = cv2.waitKey(100)if a == 27:breakprint(frame.shape)
# 释放摄像头赟源
cap.release()
# 关闭所有openCV创建的窗口
cv2.destroyAllWindows()

http://www.ppmy.cn/ops/126872.html

相关文章

案例分享-优秀蓝色系UI界面赏析

蓝色UI设计界面要提升舒适度,关键在于色彩搭配与对比度。选择柔和的蓝色调作为主色,搭配浅灰或白色作为辅助色,能营造清新、宁静的氛围。同时,确保文字与背景之间有足够的对比度,避免视觉疲劳,提升阅读体验…

力扣之接雨水(42)

刷题不在多,而在精。 这道题号称字节的保洁阿姨都能做出的。 方法一:动态规划 下面这幅图简直封神,看了下图我才做出来的。 两个方向遍历,然后取相同覆盖值-原始值(heigth数组) 这种方法更好理解。但是也有…

基础算法(6)——模拟

1. 替换所有的问号 题目描述: 算法思路: 从前往后遍历整个字符串,找到问号之后,尝试用 a ~ z 的每一个字符替换即可 注意点:需考虑数组开头和结尾是问号的边界情况 代码实现: class Solution {public …

网易翻译工具解析!这几大翻译器值得一试!

翻译工具的出现,使得跨语言沟通变得更加便捷。本文将为您推荐几款优秀的翻译工具,包括福昕在线翻译、福昕翻译客户端、海鲸AI翻译和网易有道翻译,帮助您在学习、工作和生活中轻松应对语言挑战。 福昕在线翻译 直达链接(复制到浏…

打造高性能在线电子表格:WebGL 渲染引擎 Kola2d 自研之路

导读:本文主要阐述了 Docs 在线表格为打造极致渲染性能所做的关键优化和过程思考,作为首个在在线电子表格领域自研基于WebGL渲染引擎的「吃螃蟹」者,整个过程面临诸多不确定性与挑战,Kola2d 的整体设计在此期间也经历了几轮推倒重…

为笔杆注入“AI能量”,开启公文写作的新奇之旅

随着人工智能技术的进步与革新,应用场景不断拓展,AI已逐渐在公文写作领域崭露头角,它不仅可以提升写作效率,还能够优化内容质量,为公文写作赋予新的活力与可能性,成为公文写作的有效工具。 与传统的人工撰…

【如何获取股票数据10】Python、Java等多种主流语言实例演示获取股票行情api接口之沪深A股历史分时KDJ数据获取实例演示及接口API说明文档

最近一两年内,股票量化分析逐渐成为热门话题。而从事这一领域工作的第一步,就是获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息,这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的主要任…

Spring Boot 核心理解-自动装配

自动装配 spring boot的自动装配(auto configuration)是通过spring framework的依赖注入(dependency injection, DI)和配置类的组合来实现的。 spring boot 的自动装配机制可以简化应用的配置过程,是开发者不再需要手…