Opencv之掩码实现图片抠图

devtools/2025/3/15 17:57:24/

掩码实现图片抠图

目录

  • 掩码实现图片抠图
    • 1 掩码
      • 1.1 概念
      • 1.2 创建掩码
      • 1.3抠图思路
    • 2 代码测试

1 掩码


1.1 概念

掩码(Mask)是一种用于指定图像处理操作区域的工具掩码通常是一个与图像尺寸相同的二值图像,其中像素值为0表示不处理,像素值为255(或1)表示处理。掩码可以用于多种操作,如图像滤波、图像合成、图像分割等。掩码的尺寸必须与图像的尺寸相同。掩码的像素值通常为0或255(或1),但也可以是其他值,具体取决于应用场景。通过使用掩码,可以更精确地控制图像处理操作的范围,从而实现更复杂的效果。

1.2 创建掩码

  • mask = np.zeros((height, width), dtype=np.uint8),创建一个全黑的掩码
    • (height, width), 高宽
    • dtype=np.uint8 ,数据类型
  • cv2.rectangle(mask, (x1, y1), (x2, y2), 255, -1),在掩码上绘制矩形
    • (x1, y1), (x2, y2)起点和对角线坐标 ,
    • 255颜色, -1表全填充
python">import cv2
import numpy as np
# 创建一个全黑的掩码
mask = np.zeros((300, 300), dtype=np.uint8)
# 在掩码上绘制一个白色矩形
cv2.rectangle(mask, (50, 50), (100, 100), 255, -1)
cv2.imshow('mask',mask)
cv2.waitKey(0)

运行如下
在这里插入图片描述

1.3抠图思路

  • 图像读取与预处理
    读取图像并转换为灰度图,进行高斯滤波以减少噪声。

  • 边缘检测
    使用Canny算法检测图像中的边缘。

  • 轮廓检测与排序
    查找图像中的轮廓,并根据面积进行排序

  • 二值化处理
    对灰度图进行二值化处理,确定阈值。

  • 轮廓筛选
    根据轮廓的宽度、高度和宽高比筛选出符合条件的轮廓。

  • 掩码操作
    在掩码上绘制筛选后的轮廓,并对原图像和掩码进行与操作,以提取区域。

2 代码测试

原图

在这里插入图片描述

代码展示:

python">import numpy as np
import cv2# 定义一个函数用于显示图像,并等待用户按下任意键关闭窗口
def cv_chow(name, img):cv2.imshow(name, img)cv2.waitKey(0)# 定义一个函数用于对四个点进行排序,返回一个有序的矩形顶点列表
def order_points(pts):rect = np.zeros((4, 2), dtype="float32")s = pts.sum(axis=1)  # 计算每个点的x和y坐标之和rect[0] = pts[np.argmin(s)]  # 最小的和为左上角rect[2] = pts[np.argmax(s)]  # 最大的和为右下角diff = np.diff(pts, axis=1)  # 计算每个点的x和y坐标之差rect[1] = pts[np.argmin(diff)]  # 最小的差为右上角rect[3] = pts[np.argmax(diff)]  # 最大的差为左下角return rect# 定义一个函数用于对轮廓进行排序,支持从左到右、从右到左、从上到下、从下到上四种排序方式
def sort_contours(cons, method='left-to-right'):reverse = Falsei = 0if method == 'right-to-left' or method == 'bottom-to-top':reverse = Trueif method == 'top-to-bottom' or method == 'bottom-to-top':i = 1boundingBoxes = [cv2.boundingRect(c) for c in cons]  # 获取每个轮廓的边界框(cons, boundingBoxes) = zip(*sorted(zip(cons, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))return cons, boundingBoxes# 读取图像
img = cv2.imread('img_3.png')# 复制图像用于绘制轮廓
cont_img = img.copy()# 将图像转换为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 对灰度图进行高斯滤波,以减少噪声
blurred = cv2.GaussianBlur(gray, (5, 5), 0)
cv_chow('blurred', blurred)# 使用Canny边缘检测算法检测图像中的边缘
edg = cv2.Canny(blurred, 75, 200)
cv_chow('edg', edg)# 查找图像中的轮廓
cnts = cv2.findContours(edg.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[-2]# 在图像上绘制所有轮廓
cv2.drawContours(cont_img, cnts, -1, (0, 0, 255), 3)
cv_chow('cont_img', cont_img)# 根据轮廓面积对轮廓进行排序,从大到小
cnts = sorted(cnts, key=cv2.contourArea, reverse=True)# 对灰度图进行二值化处理,使用Otsu's方法自动确定阈值
thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
cv_chow('thresh', thresh)# 在二值化图像中查找轮廓
thresh_cnt = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1]# 初始化一个列表用于存储符合条件的轮廓
qus_cnts = []# 初始化一个列表用于存储所有的掩码
mask_all = []# 创建一个与二值化图像大小相同的黑色掩码
mask = np.zeros(thresh.shape, dtype='uint8')# 遍历所有轮廓,筛选出符合条件的轮廓
for c in thresh_cnt:(x, y, w, h) = cv2.boundingRect(c)  # 获取轮廓的边界框ar = w / float(h)  # 计算边界框的宽高比if w >= 8 and h >= 10 and 0.5 <= ar <= 2:  # 根据宽度、高度和宽高比筛选轮廓qus_cnts.append(c)# 遍历筛选后的轮廓,绘制掩码并进行与操作
for i in qus_cnts:cv2.drawContours(mask, [i], -1, 255, -1)  # 在掩码上绘制轮廓cv_chow('mask', mask)img_mask_and = cv2.bitwise_and(img, img, mask=mask)  # 对原图像和掩码进行与操作cv_chow('img_mask_and', img_mask_and)

运行结果:

在这里插入图片描述


http://www.ppmy.cn/devtools/167345.html

相关文章

构建多序列比对的删除矩阵Deletion Matrix

从多序列比对(Multiple Sequence Alignment, MSA)数据中构建删除矩阵(Deletion Matrix)是蛋白质结构预测中的一个重要步骤。删除矩阵记录了每个位置相对于参考序列的缺失(deletion)信息,这些信息对于理解蛋白质的进化关系和结构变化非常关键。以下是从 A3M格式文件 的MS…

JVM之类文件结构

简介 类文件&#xff1a;又称字节码文件&#xff0c;java源代码编译之后产生的文件&#xff0c;是基于字节码的二进制文件&#xff0c;jvm通过运行类文件来执行java程序。 字节码&#xff1a;类文件中的基本数据单位&#xff0c;一个字节码占一个字节。 类文件的基本结构 类…

3.JVM-内部结构

1.栈结构 1.1 动态链接 栈中的对象指向堆中的实际引用 符号引用: 比如一个类的名称 直接引用: 具体堆中数据信息 1.2 方法返回 栈中上一层的结果和下一层的指令 1.3 操作数栈 1.4 局部变量 该线程中需要的变量 2. 虚拟机栈是如何工作 程序计数器:存当前执行到那一步 操作…

Git和GitHub基础教学

文章目录 1. 前言2. 历史3. 下载安装Git3.1 下载Git3.2 安装Git3.3 验证安装是否成功 4. 配置Git5. Git基础使用5.1 通过Git Bash使用5.1.1 创建一个新的仓库。5.1.1.1 克隆别人的仓库5.1.1.2 自己创建一个本地仓库 5.1.2 管理存档 5.2 通过Visual Studio Code使用 6. Git完成远…

射频相关概念

射频&#xff08;Radio Frequency, RF) 是电磁波谱中频率范围在 3 kHz 到 300GHz的电磁波&#xff0c;广泛应用于通信、雷达、广播、医疗等领域。其基本原理涉及电磁波的产生、传播、调制与解调&#xff0c;以及射频系统的设计。以下是射频技术的核心要点&#xff1a; 1. 电磁…

让网站变得更智能!架构标记如何提升SEO并吸引更多流量?

什么是 SEO 中的架构标记&#xff1f; 架构标记&#xff08;也称为结构化数据&#xff09;是您添加到网站中的一种代码&#xff0c;可帮助搜索引擎更好地理解您的内容。 它使您的内容有资格让 Google 等搜索引擎在搜索结果中显示更多详细信息。例如星级评定、价格以及商品是否…

【菜鸟飞】在vsCode中安装python的ollama包出错的问题

问题&#xff1a; 在vsCode中安装python的ollama包&#xff0c;执行命令 pip install ollama 遇到错误&#xff1a; ERROR: pips dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the foll…

嵌入式八股ARM篇

前言 ARM篇主要介绍一下寄存器和中断机制,至于汇编这一块…还请大家感兴趣自行学习 1.寄存器 R0 - R3 R4 - R11 寄存器 R0 - R3一般用作函数传参 R4 - R11用来保存程序运算的中间结果或函数的局部变量 在函数调用过程中 注意在发生异常的时候 cortex-M0架构会自动将R0-R3压入…