制作圣诞帽其实特简单(附 Python 代码)

news/2024/10/25 17:27:29/

圣诞将至,虽然咱不过这洋节,但是热闹还是要凑一下的,相信已经有很多圣诞帽相关的周边在流传了,今天咱们就自己动手,给头像增加一个圣诞帽。

文章目录

  • 基础知识准备
    • 数字图像
    • 图像通道
    • ROI和mask
    • 矩阵(Numpy)知识
    • 源码
  • 环境准备
  • 代码处理
    • 帽子处理
    • 人脸检测
    • ROI 提取
  • 合成图片

基础知识准备

在计算机中,图像是以矩阵的形式保存的,先行后列。所以,一张宽×高×颜色通道=480×256×3的图片会保存在一个256×480×3的三维张量中。图像处理时也是按照这种思想进行计算的(其中就包括 OpenCV 下的图像处理),即 高×宽×颜色通道。

数字图像

对于一幅的数字图像,我们看到的是 肉眼可见的一幅真正的图片,但是计算机看来,这副图像只是一堆亮度各异的点。一副尺寸为 M × N 的图像可以用一个 M × N 的矩阵来表示,矩阵元素的值表示这个位置上的像素的亮度,一般来说像素值越大表示该点越亮。

一般来说,灰度图用 2 维矩阵表示,彩色(多通道)图像用 3 维矩阵(M× N × 3)表示。

图像通道

描述一个像素点,如果是灰度,那么只需要一个数值来描述它,就是单通道。如果一个像素点,有RGB三种颜色来描述它,就是三通道。而四通道图像,就是R、G、B加上一个A通道,表示透明度。一般叫做alpha通道,表示透明度。

ROI和mask

Setting Region of Interest (ROI),翻译成白话为,设置感兴趣的区域。mask是做图像掩膜处理,相当于把我们不关心的部位覆盖住,留下ROI部分。上面说的alpha就可以作为mask。

矩阵(Numpy)知识

矩阵索引、切片等,这里我自己掌握的也不好,就不多说了,小伙伴儿们可以自行学习。

源码

本文由技术群粉丝投稿分享,项目源码、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友

方式①、添加微信号:dkl88191,备注:来自CSDN +研究方向
方式②、微信搜索公众号:Python学习与数据挖掘,后台回复:圣诞帽

环境准备

有了基础知识后,我们来简单看下代码。

首先安装需要要用到的 OpenCVdlib 库,使用pip分别安装之

pip install python-opencv     
pip install dlib   

然后手工在网上下载数据模型文件 shape_predictor_5_face_landmarks.dat,地址如下:http://dlib.net/files/,下载后放到项目目录下。

有兴趣的同学可以玩玩那个 shape_predictor_68_face_landmarks.dat,识别出的人脸关键点有68个之多呢。

代码处理

帽子处理

我们首先要做的就是处理帽子,我们使用的图片如下

先提取帽子图片的rgbalpha

# 帽子图片
hat_img3 = cv2.imread("hat.png", -1)
r, g, b, a = cv2.split(hat_img3)
rgb_hat = cv2.merge((r, g, b))
cv2.imwrite("rgb_hat.jpg", rgb_hat)
cv2.imwrite("alpha.jpg", a)
print(a)
print(hat_img3.shape)
print(rgb_hat.shape)

我们得到的效果如下

rgb

alpha

对于的打印出的a数值如下:

[[0 0 0 ... 0 0 0]    [0 0 0 ... 0 0 0]    [0 0 0 ... 0 0 0]    ...    [0 0 0 ... 0 0 0]    [0 0 0 ... 0 0 0]    [0 0 0 ... 0 0 0]]   

人脸检测

下面进行人脸检测,使用dlib处理。

# 人脸检测dets = self.detector(img, 1)x, y, w, h = dets[0].left(), dets[0].top(), dets[0].right() - dets[0].left(), dets[0].bottom() - dets[0].top()# 关键点检测shape = self.predictor(img, dets[0])point1 = shape.parts()[0]point2 = shape.parts(2)# 求两点中心eyes_center = ((point1.x + point2.x) // 2, (point1.y + point2.y) // 2)

接下来是按照比例缩小帽子的图片

# 帽子和人脸转换比例hat_w = int(round(dets[0].right()/1.5))hat_h = int(round(dets[0].bottom() / 2))if hat_h > y:hat_h = y - 1hat_newsize = cv2.resize(rgb_hat, (hat_w, hat_h))mask = cv2.resize(a, (hat_w, hat_h))mask_inv = cv2.bitwise_not(mask)dh = 0dw = 0bg_roi = img[y+dh-hat_h:y+dh,(eyes_center[0]-hat_w//3):(eyes_center[0]+hat_w//3*2)]

ROI 提取

进行 ROI 提取

# 用alpha通道作为mask
mask = cv2.resize(a, (resized_hat_w, resized_hat_h))
mask_inv = cv2.bitwise_not(mask)

mask 变量,取出了帽子的区域

mask_inv 变量,用来取出人脸图片中安装帽子的区域

接下来在人脸图片中取出安装帽子的区域(ROI)

# 原图ROI
# bg_roi = img[y+dh-resized_hat_h:y+dh, x+dw:x+dw+resized_hat_w]
bg_roi = img[y + dh - resized_hat_h:y + dh,(eyes_center[0] - resized_hat_w // 3):(eyes_center[0] + resized_hat_w // 3 * 2)]

再接下来在人脸图片中取出帽子形状区域

# 原图ROI中提取放帽子的区域
bg_roi = bg_roi.astype(float)
mask_inv = cv2.merge((mask_inv, mask_inv, mask_inv))
alpha = mask_inv.astype(float) / 255
# 相乘之前保证两者大小一致(可能会由于四舍五入原因不一致)
alpha = cv2.resize(alpha, (bg_roi.shape[1], bg_roi.shape[0]))
# print("alpha size: ",alpha.shape)
# print("bg_roi size: ",bg_roi.shape)
bg = cv2.multiply(alpha, bg_roi)
bg = bg.astype('uint8')

这里是把图片默认的uint8类型转换成了float类型进行运算,最后又转换回来。

合成的图片

黑黑的部分就是我们要放置帽子的地方

在帽子图片中提取帽子部分

# 提取帽子区域   hat = cv2.bitwise_and(resized_hat, resized_hat, mask=mask)   

使用刚刚调整大小的帽子图片来提取

可以看到,除了帽子部分,其他区域已经掩模处理了。

以上就是提取ROI的过程,比较难懂,需要好好琢磨,尤其是矩阵的切片、mask处理部分。

合成图片

最后一步就是把人脸图片与帽子合成到一起了,也就是把人脸空余帽子部分的图片区域和帽子只展示帽子区域的图片区域(有点拗口)合并在一起

# 相加之前保证两者大小一致(可能会由于四舍五入原因不一致)
hat = cv2.resize(hat, (bg_roi.shape[1], bg_roi.shape[0]))
# 两个ROI区域相加
add_hat = cv2.add(bg, hat)

效果如下:

刚刚好,完美叠加图片。

最后把这个片段放回人脸原图中,展示图片

img[y+dh-hat_h:y+dh, (eyes_center[0]-hat_w//3):(eyes_center[0]+hat_w//3*2)] = add_hat   

美美的图片就出来啦!

我们再尝试几张不同的图片

整体效果还不错哦,需要注意的是,在测试的时候,我们尽量选择人脸占比比较大的图片来合成,效果要好很多哦~

这就是今天的全部内容,喜欢就点个吧~


http://www.ppmy.cn/news/5755.html

相关文章

34.前端笔记-CSS3-动画

1、动画 动画animation是CSS3中具有颠覆性的特征之一,可以通过设置多个节点来精确控制一个或一组动画,常用来实现复杂的动画效果 相比较过渡,动画可以实现更多变化,更多控制,连续自动播放等效果 2、动画的基本使用 …

DNS协议分析

上一篇文章从工作原理角度分析了DNS的作用与意义,这次来看看DNS到底是以什么形式进行通信的。 DNS报文格式如下所示: DNS报文由12字节长的首部和4个长度可变的字段组成。 1.标识,由主机端设置,为的是唯一标识当前DNS报文。 2.1…

GridLayout案例

GridLayout-网格布局案例 1.网格布局-GridLayout 1.简介 无限细的线绘制的分割区域成行成列,和棋盘的样子差不多2.注意点 自己设置行数和列数自己控件在几行几列自己定义跨越的行数和列数自己设置子布局的排列的样式3.常见属性 4.网格布局属性 android:columnCount&…

Unprojecting_text_with_ellipses过程分析

文章目录一、单应性1. 图片实例2. 数学表达式二、算法思路1. 算法流程2. 透视失真具体解决方案3. 图片旋转具体解决方案4. 图片文字倾斜具体解决方案三、实际处理过程四、算法问题五、OCR识别原文链接 https://mzucker.github.io/2016/10/11/unprojecting-text-with-ellipses.h…

手办商城系统|Springboot+vue+ElementUI手办商城系统

作者主页:编程指南针 作者简介:Java领域优质创作者、CSDN博客专家 、掘金特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容:Java项目、毕业设计、简历模板、学习资料、面试题库、技术互助 收藏点赞不迷路 关注作者有好处 文末获取源…

【软件测试】概念篇

目录 一、需求 1.1用户需求 1.2软件需求 1.3需求的重要性 二、测试用例 三、BUG 3.1什么是BUG 3.2如何描述一个BUG 4.3BUG优先级 四、软件开发模型 4.1软件生命周期 4.2开发模型 定义:软件测试就是一系列活动,这些活动是为了评估一个程序或者…

git push踩坑记录【看注意事项】

记录一次git push的踩坑过程(详细在注意事项里,列出了具体的解决办法)。 push远程仓库命令 使用命令 git init git add . git commit -m "提交说明写在这里" git remote add origin gitgithub.com:xxx/surgical-robot.git git p…

为什么硬盘在macbook上无法编辑?mac不能往移动硬盘拷东西

为什么硬盘在macbook上无法编辑?如果您只想在Mac上查看NTFS文件,只需将NTFS 外置存储设备连接到mac电脑并查看文件。但要编辑或传输文件,则需要NTFS工具。 NTFS文件格式与Mac不兼容,但许多用户仍然喜欢使用NTFS文件,而…