Python----计算机视觉处理(Opencv:自适应二值化,取均值,加权求和(高斯定理))

devtools/2025/3/15 18:44:36/

一、自适应二值化

        与二值化算法相比,自适应二值化更加适合用在明暗分布不均的图片,因为图片的明暗不均,导致图片 上的每一小部分都要使用不同的阈值进行二值化处理,这时候传统的二值化算法就无法满足我们的需求 了,于是就出现了自适应二值化。

二、取均值

        假如我们使用的小区域是3*3的,那么就会从图片的左上角开始(也就是像素值为162的地方)计算其邻 域内的平均值,如果处于边缘地区就会对边界进行填充,填充值就是边界的像素点。

         对于左上角像素值为162的这个点,161(也就是上图中括号内的计算结果,结果会进行取整)就是 根据平均值计算出来的阈值,接着减去一个固定值C,得到的结果就是左上角这个点的二值化阈值了, 接着根据选取的是阈值法还是反阈值法进行二值化操作。紧接着,向右滑动计算每个点的邻域内的平均 值,直到计算出右下角的点的阈值为止。我们所用到的不断滑动的小区域被称之为核,比如3*3的小区 域叫做3*3的核,并且核的大小都是奇数个,也就是3*3、5*5、7*7等。

三、加权求和

        对小区域内的像素进行加权求和得到新的阈值,其权重值来自于高斯分布。

        高斯概率函数是相对于二维坐标产生的,其中(x,y)为点坐标,要得到一个高斯滤波器模板,应先对高 斯函数进行离散化,将得到的值作为模板的系数。例如:要产生一个3*3的高斯权重核,以核的中心位 置为坐标原点进行取样,其周围的坐标如下图所示(x轴水平向右,y轴竖直向上)

(−𝟏,𝟏)

(𝟎,𝟏)

(𝟏,𝟏)

(−𝟏,𝟎)

(𝟎,𝟎)

(𝟏,𝟎)

(−𝟏,−𝟏)

(𝟎,−𝟏)

(𝟏,−𝟏)

 将坐标带入上面的公式中,即可得到一个高斯权重核。

        而在opencv里,当kernel(小区域)的尺寸为1、3、5、7并且用户没有设置sigma的时候(sigma <= 0),核 值就会取固定的系数,这是一种默认的值是高斯函数的近似。

kernel尺寸核值
1[1]
3[0.25,0.5,0.25]
5[0.0625,0.25,0.375,0.25,0.0625]
7[0.03125,0.109375,0.21875,0.28125,0.21875,0.109375,0.03125]

        通过这个高斯核,即可对图片中的每个像素去计算其阈值,并将该阈值减去固定值得到最终阈值,然后 根据二值化规则进行二值化。 

 某像素点的阈值计算过程如下图所示:

        首先还是对边界进行填充,然后计算原图中的左上角(也就是162像素值的位置)的二值化阈值,其计 算过程如上图所示,再然后根据选择的二值化方法对左上角的像素点进行二值化,之后核向右继续计算 第二个像素点的阈值,第三个像素点的阈值…直到右下角(也就是155像素值的位置)为止。

        当核的大小不同时,仅仅是核的参数会发生变化,计算过程与此是一样的。 

四、自适应

python">cv2.adaptiveThreshold:是用来对单通道图进行自适应二值化的。
第一个参数:单通道图
第二个参数:二值化过程中所用到的最大值
第三个参数:计算阈值的方法: 1. 平均值法  cv2.ADAPTIVE_THRESH_MEAN_C  2. 使用高斯核的加权平均法 cv2.ADAPTIVE_THRESH_GAUSSIAN_C
第四个参数:二值化的方法:1. 阈值法 THRESH_BINARY, 2. 反阈值法 THRESH_BINARY_INV
第五个参数: blocksize : 核的大小,通常为奇数  3*3, 5*5
第六个参数: 要减去的常数C的大小: 通常是正数,但也有可能是0或负数

导入模块

python">import cv2

读取图片 

python">img=cv2.imread('lena.png')

灰度化 

python">img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

自适应 

python">img_adaptive=cv2.adaptiveThreshold(img_gray,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,7,5)

结果 

python">cv2.imshow('img_adaptive',img_adaptive)
cv2.waitKey(0)

完整代码 

import cv2  img = cv2.imread('lena.png')  # 将彩色图像转换为灰度图像  
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)  # 使用自适应阈值算法对灰度图像进行二值化处理  
# cv2.adaptiveThreshold() 的参数:  
# 1. 输入图像 (img_gray)  
# 2. 最大值 (255): 二值化后像素的最大值  
# 3. 自适应阈值方法 (cv2.ADAPTIVE_THRESH_GAUSSIAN_C): 使用高斯加权邻域平均值  
# 4. 阈值类型 (cv2.THRESH_BINARY): 二值化类型  
# 5. 领域大小 (7): 奇数,阈值计算时邻域的大小  
# 6. 常数 (5): 从计算的阈值中减去的常数  
img_adaptive = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 7, 5)  # 显示处理后的自适应二值化图像  
cv2.imshow('img_adaptive', img_adaptive)  # 等待用户按键后关闭窗口  
cv2.waitKey(0)  

五、库函数

adaptiveThreshold()

python">cv.adaptiveThreshold(	src, maxValue, adaptiveMethod, thresholdType, blockSize, C[, dst]	) ->	dst
方法描述
src源 8 位单通道图像。
maxValue分配给满足条件的像素的非零值
adaptiveMethod要使用的自适应阈值算法
thresholdType阈值类型必须为 THRESH_BINARY 或 THRESH_BINARY_INV
blocksize用于计算像素阈值的像素邻域的大小:3、5、7 等。
C从平均值或加权平均值中减去的常数。通常,它是正的,但也可能是零或负的
adaptiveMethod——Enumerator
FLOODFILL_FIXED_RANGE 

Python: cv.FLOODFILL_FIXED_RANGE

如果设置了相关参数,则会考虑当前像素与种子像素之间的差异。否则,会考虑相邻像素之间的差异(也就是说,范围是浮动的)。
FLOODFILL_MASK_ONLY 

Python: cv.FLOODFILL_MASK_ONLY

如果设置了该参数,则该函数不会改变图像(新值将被忽略),并且仅会按照上述描述在标志的第 8 到第 16 位中指定的值填充掩码。此选项仅在具有掩码参数的函数变体中才有意义。

http://www.ppmy.cn/devtools/167352.html

相关文章

3.14周报

本周主要是在找双目视觉三维人体姿态估计方向的文章&#xff0c;这篇dual-diffusion&#xff0c;双目三维人体姿态估计的双扩散文章&#xff0c;引起了兴趣&#xff0c;作者从由于摄像机数量的减少&#xff0c;增加了3d重建的不确定性入手&#xff0c;然后使用了扩散模型&#…

torch_geometric 安装

环境监测&#xff1a; import torch print(torch.__version__) # 查看pytorch安装的版本号 print(torch.cuda.is_available()) # 查看cuda是否可用。True为可用&#xff0c;即是gpu版本pytorch print(torch.cuda.get_device_name(0)) # 返回GPU型号 …

全栈网络安全|渗透测试-1

网站四大件 系统 系统是指服务器上运行的操作系统&#xff0c;它是承载网站运行的基础。常见的操作系统包括Linux&#xff08;如Ubuntu、CentOS&#xff09;、Windows Server等。操作系统负责管理硬件资源&#xff0c;并为运行在其上的软件提供一个稳定的环境。中间件 中间件是…

【电流源和电压源串联和并联】2022-10-19

缘由关于电流源和电压源串联和并联问题-开放平台-CSDN问答 电流源电流恒定电压不定则1安*1欧1伏特 电压源电压恒定电流不定则2伏特-1伏特1伏特/3欧姆0.333~安培 总电流10.331.33则其他都可以计算了。

The Rust Programming Language 学习 (五)

枚举 枚举&#xff08;enumerations&#xff09;&#xff0c;也被称作 enums。枚举允许你通过列举可能的 成员&#xff08;variants&#xff09; 来定义一个类型。首先&#xff0c;我们会定义并使用一个枚举来展示它是如何连同数据一起编码信息的。接下来&#xff0c;我们会探…

Opencv之掩码实现图片抠图

掩码实现图片抠图 目录 掩码实现图片抠图1 掩码1.1 概念1.2 创建掩码1.3抠图思路 2 代码测试 1 掩码 1.1 概念 掩码&#xff08;Mask&#xff09;是一种用于指定图像处理操作区域的工具。掩码通常是一个与图像尺寸相同的二值图像&#xff0c;其中像素值为0表示不处理&#xff…

构建多序列比对的删除矩阵Deletion Matrix

从多序列比对(Multiple Sequence Alignment, MSA)数据中构建删除矩阵(Deletion Matrix)是蛋白质结构预测中的一个重要步骤。删除矩阵记录了每个位置相对于参考序列的缺失(deletion)信息,这些信息对于理解蛋白质的进化关系和结构变化非常关键。以下是从 A3M格式文件 的MS…

JVM之类文件结构

简介 类文件&#xff1a;又称字节码文件&#xff0c;java源代码编译之后产生的文件&#xff0c;是基于字节码的二进制文件&#xff0c;jvm通过运行类文件来执行java程序。 字节码&#xff1a;类文件中的基本数据单位&#xff0c;一个字节码占一个字节。 类文件的基本结构 类…