计算机视觉 ---图像模糊

ops/2024/11/14 10:35:49/

1、图像模糊的作用:

  • 减少噪声

    • 在图像获取过程中,例如通过相机拍摄或者传感器采集,可能会受到各种因素的干扰,从而引入噪声。这些噪声在图像上表现为一些孤立的、不符合图像主体内容的像素变化,如椒盐噪声(随机出现的黑白像素点)和高斯噪声(使图像整体变得模糊的噪声)。
    • 通过模糊处理,可以将这些噪声点与周围像素融合,从而使噪声在视觉上得到减弱,让图像看起来更加干净、平滑。例如,在天文观测图像中,由于信号微弱且探测器可能受到宇宙射线等干扰,图像会带有噪声,使用模糊方法能够有效改善图像质量,便于天文学家观察天体的特征。
  • 突出主体

    • 当图像包含多个元素,且主体与背景或者其他元素在视觉上相互干扰时,模糊可以用来弱化次要元素,从而使主体更加突出。
    • 例如在人物摄影作品中,如果背景比较杂乱,通过对背景进行模糊处理,能够引导观众的注意力聚焦在人物主体上,就像在拍摄肖像照时,利用浅景深效果(通过相机设置或者后期处理来模糊背景)突出人物面部表情和特征。
  • 模拟特定效果

    • 模拟景深效果:在摄影中,景深是指在拍摄的场景中,能够清晰成像的距离范围。通过对图像的部分区域进行模糊,可以模拟出相机拍摄时的景深效果,即焦点处清晰,而焦点外逐渐模糊。这可以增强图像的真实感和层次感,让二维的图像更有三维空间的感觉。
    • 模拟运动模糊:当物体在快速运动时,相机拍摄的图像会产生运动模糊效果。在图像制作或者后期处理中,可以通过模糊来模拟这种效果,用于表现物体的动态和速度感。比如在制作赛车游戏的宣传海报时,对赛车的图像进行适当的运动模糊处理,可以让海报更具动感和速度感。
  • 保护隐私

    • 在一些情况下,需要对图像中的人物面部或者敏感信息进行模糊处理。例如在新闻报道中,当涉及到不愿意曝光面部的人物或者需要隐藏某些隐私信息(如车牌号码、身份证号码等)时,通过模糊这些部分,使它们无法被清晰辨认,从而保护个人隐私。

2、常见模糊方法:

  • 均值模糊(Average Blur)

    • 原理:对于图像中的每个像素,计算其周围邻域(通常是一个矩形区域,如 3×3、5×5 等)内所有像素值的平均值,然后将这个平均值作为该像素的新值。例如,对于一个 3×3 邻域,就是将这 9 个像素的红、绿、蓝通道(如果是彩色图像)的值分别相加,再除以 9,得到新的像素值。
    • 特点:计算简单,能够快速地对图像进行平滑处理,有效地减少噪声。但是,这种方法会导致图像细节丢失较多,因为它是简单地求平均,会使图像变得比较模糊和平滑,对于边缘等细节的保留能力较差。
  • 高斯模糊(Gaussian Blur)

    • 原理:基于高斯函数来确定每个像素周围邻域内像素值对当前像素的影响权重。离当前像素越近的像素,其权重越大;离得越远,权重越小。然后根据这些权重计算出当前像素的新值。通常也会使用一个矩形邻域,如 3×3、5×5 等。高斯函数的数学表达式决定了这种权重的分布规律。
    • 特点:是一种比较常用的模糊方法,它在模糊图像的同时,能够较好地保留图像的边缘和主要细节信息。相比均值模糊,它对图像细节的破坏相对较小,能够产生更加自然的模糊效果,因为它的权重分配更符合人眼对周围物体的视觉感知规律。
  • 中值模糊(Median Blur)

    • 原理:选取图像中每个像素点周围邻域内像素值的中位数,并用这个中位数来替换当前像素点的值。邻域大小同样可以是 3×3、5×5 等。例如,对于一个 3×3 邻域内的 9 个像素值,将它们从小到大排序,取中间的值作为中心像素的新值。
    • 特点:对于去除椒盐噪声等具有较好的效果,因为它不是通过求平均来模糊,而是取中位数,所以在一定程度上能够保留图像的边缘和细节,避免了像均值模糊那样过度平滑图像。
  • 双边模糊(Bilateral Blur)

    • 原理:考虑了像素点的空间距离和像素值的差异两个因素。一方面根据像素点之间的空间距离确定权重,如同高斯模糊;另一方面根据像素值的差异确定权重,即对于与当前像素值差异较大的像素,给予较小的权重,反之给予较大的权重。最后综合这两个权重来计算当前像素点的新值。
    • 特点:能够在模糊图像的同时,很好地保留图像的边缘细节,实现了一种既能模糊背景又能使主体边缘清晰的效果。常用于需要突出主体且保持主体边缘清晰的场景,如人像摄影后期处理等。

3、举个例子:

        这里使用高斯模糊对一张图像在不同尺度上进行模糊处理,感兴趣的话大家也可以尝试使用其他模糊方法对图像进行处理。

这里使用到了OpenCV库中的cv2.GaussianBlur()函数进行高斯模糊处理,函数参数有以下几个:

  • src:这是要进行高斯模糊处理的原始图像。图像可以是单通道(如灰度图)或多通道(如彩色图,通常为 BGR 格式)。例如,你可以使用cv2.imread函数读取一幅图像作为src参数的值。
  • ksize:它是一个表示高斯核大小的元组。核大小决定了模糊的程度和范围。元组的格式为(width, height),通常使用正方形核,即widthheight相等,如(3,3)(5,5)(7,7)等。核越大,模糊效果越明显。
  • sigmaX:它是高斯核在 X 方向(水平方向)上的标准差。这个参数控制了高斯分布的形状,从而影响模糊的效果。如果将其设置为 0,则函数会根据ksize自动计算一个合适的值。通常,手动设置一个合适的值可以更精细地调整模糊效果。例如,对于一些需要轻微模糊的图像,可以设置一个较小的sigmaX值。
  • sigmaY(可选):它是高斯核在 Y 方向(垂直方向)上的标准差。如果不指定这个参数(即只传入三个参数srcksizesigmaX),函数会默认sigmaY = sigmaX,也就是在 X 和 Y 方向上使用相同的标准差进行模糊处理。

(对于其他的模糊处理方法,OpenCV中也有对应的函数可以使用,感兴趣的话可以尝试一下)

具体代码及注释如下:

import cv2
import matplotlib.pyplot as plt# 读取图像
image = cv2.imread('./luffy.jpeg')
# 将图像从BGR格式转换为RGB格式,以便在matplotlib中正确显示
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)# 定义不同尺度的高斯模糊邻域大小
kernel_sizes = [23, 45, 65]# 存储不同尺度模糊后的图像结果
blurred_images = []# 对图像进行不同尺度的高斯模糊
for kernel_size in kernel_sizes:blurred_image = cv2.GaussianBlur(image_rgb, (kernel_size, kernel_size), 0)blurred_images.append(blurred_image)# 显示原始图像和不同尺度模糊后的图像
plt.figure(figsize=(10, 10))  # 调整图形大小以适应2x2的布局# 显示原始图像
plt.subplot(2, 2, 1)  # 2行,2列,第1个位置
plt.imshow(image_rgb)
plt.title('Original Image')
plt.axis('off')# 显示不同尺度模糊后的图像
for i, blurred_image in enumerate(blurred_images):plt.subplot(2, 2, i + 2)  # 2行,2列,第2到第4个位置plt.imshow(blurred_image)plt.title(f'Gaussian Blur with Kernel Size {kernel_sizes[i]}')plt.axis('off')plt.tight_layout()  # 确保图像布局紧凑
plt.show()

最终效果图(对两个图像分别进行高斯模糊):

有任何问题欢迎在评论区提出讨论!

Over!!


http://www.ppmy.cn/ops/133546.html

相关文章

Brave127编译指南 Windows篇:配置Visual Studio 2022(二)

1. 前言 在Brave浏览器的编译过程中,配置适当的开发环境是至关重要的一步。Visual Studio 2022作为一款强大的集成开发环境(IDE),为Brave浏览器的编译提供了必要的工具和支持。它不仅提供了代码编辑和调试功能,还包含了…

MySQL技巧之跨服务器数据查询:进阶篇-从A数据库复制到B数据库的表中

MySQL技巧之跨服务器数据查询:进阶篇-从A数据库复制到B数据库的表中 基础篇已经描述:借用微软的SQL Server ODBC 即可实现MySQL跨服务器间的数据查询。 而且还介绍了如何获得一个在MS SQL Server 可以连接指定实例的MySQL数据库的连接名: MY_ODBC_MYSQ…

利用 React 构建现代化 Web 应用的核心实践

📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 React 是一个用于构建用户界面的前端框架,它由 Facebook 开发并在 2013 年开源。React 的崛起标志着前端开发进入了组…

批量规范化与ResNet——pytorch与paddle实现批量规范化与ResNet

批量规范化与ResNet——pytorch与paddle实现批量规范化与ResNet 本文将深入探讨批量规范化与ResNet的理论基础,并通过PyTorch和PaddlePaddle两个深度学习框架来展示如何实现批量规范化与ResNet模型。我们将首先介绍批量规范化与ResNet的基本概念,这些理…

xrandr源码分析

1、XOpenDisplay 打开xrandr句柄,参数是显示后端xorg或者xwayland,也就是localhost:0.0 dpy XOpenDisplay (display_name); //XOpenDisplay(":0");if (dpy NULL) {fprintf (stderr, "Cant open display %s\n", XDisplayName(displ…

opencv保姆级讲解——光学学符识别(OCR)(4)

光学字符识别 (Optical Character Recognition, OCR)是指对文本材料的图像文件进行分析识别处理,以获取文字和版本信息的过程。也就是说将图象中的文字进行识别,并返回文本形式的内容 以下是比较流行的开源的ORC识别库 Tessera…

Vue3 : Tailwindcss之margin样式类

margin 样式: 关键字数字间隔:m:四个方向1-12是连续的mx:水平方向12-52是间隔2my:垂直方向52到64间隔4mt:上边64以后间隔8mr:右边 mb:下边 ml:左边  基础样式: ClassP…

2024下半年自学黑客(网络安全)

CSDN大礼包:👉 基于入门网络安全/黑客打造的:👉黑客&网络安全入门&进阶学习资源包 前言 什么是网络安全 网络安全可以基于攻击和防御视角来分类,我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术&…