机器学习9-卷积和卷积核2

news/2025/2/7 6:42:24/

机器学习9-卷积和卷积核2

  • 卷积与边缘提取
    • 边缘的种类
    • 边缘检测
      • 图像求导
        • 解析
        • 示例
      • 图像求导公式:
        • 解析
        • 总结
      • 图像梯度
        • 噪声的影响
    • 边缘检测目标
      • 非极大值抑制
      • 总结

卷积与边缘提取

边缘:图像中亮度明显而急剧变化的点

为什么要研究边缘?

  • 编码图像中的语义与形状信息。
  • 相对于像素表示边缘显然更加紧凑。

在这里插入图片描述

边缘的种类

在这里插入图片描述

图中展示了视觉边缘的几种类型,分别是:

  1. 表面法向不连续:这种边缘通常出现在物体表面方向发生突然变化的地方,例如瓶子的侧面与顶部的交界处。
  2. 深度不连续:这种边缘表示物体在深度方向上的突然变化,例如一个物体在另一个物体前面或后面。
  3. 表面颜色不连续:这种边缘出现在物体表面颜色发生突然变化的地方,例如瓶子上不同颜色的标签或图案。
  4. 光照不连续:这种边缘是由于光照条件的突然变化导致的,例如光线在物体表面的反射或阴影的边缘。

这些视觉边缘类型在计算机视觉和图像处理中非常重要,用于识别和分析图像中的物体及其结构。

边缘检测

在这里插入图片描述

图像求导

二维函数(f(x,y))的偏导数的定义式:

[ ∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \frac{\partial f(x,y)}{\partial x} = \lim_{\varepsilon \to 0} \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} xf(x,y)=limε0εf(x+ε,y)f(x,y)]

解析
  1. 偏导数的定义
    • 对于一个多元函数(这里是二维函数( f ( x , y ) f(x,y) f(x,y))),偏导数表示函数在某一点沿着某一坐标轴方向的变化率。
    • 对于( x x x)方向的偏导数( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} xf(x,y)),它衡量了函数( f ( x , y ) f(x,y) f(x,y))在( x x x)轴方向上的变化情况,而( y y y)被视为常数。
  2. 极限的意义
    • 偏导数的定义中使用了极限。这里的( ε \varepsilon ε)是一个趋近于0的变量。
    • 当( ε \varepsilon ε)趋近于0时,( f ( x + ε , y ) − f ( x , y ) ε \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} εf(x+ε,y)f(x,y))表示函数在( x x x)方向上的平均变化率。极限( lim ⁡ ε → 0 \lim_{\varepsilon \to 0} limε0)则表示当这个平均变化率在( ε \varepsilon ε)无限趋近于0时的精确变化率,即偏导数。
  3. 几何意义
    • 在二维平面上,( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} xf(x,y))可以理解为函数( f ( x , y ) f(x,y) f(x,y))在( x x x)方向上的斜率。
    • 例如,如果( f ( x , y ) f(x,y) f(x,y))表示一个曲面,那么( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} xf(x,y))在某一点的值就是该点处曲面在( x x x)方向上的切线斜率。
示例

假设( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2),求( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} xf(x,y)):

  1. 根据定义,( ∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \frac{\partial f(x,y)}{\partial x} = \lim_{\varepsilon \to 0} \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} xf(x,y)=limε0εf(x+ε,y)f(x,y))。
  2. 代入( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2):
    • ( f ( x + ε , y ) = ( x + ε ) 2 + y 2 = x 2 + 2 x ε + ε 2 + y 2 f(x + \varepsilon,y) = (x + \varepsilon)^2 + y^2 = x^2 + 2x\varepsilon + \varepsilon^2 + y^2 f(x+ε,y)=(x+ε)2+y2=x2+2xε+ε2+y2)。
    • ( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2)。
  3. 计算差值:
    • ( f ( x + ε , y ) − f ( x , y ) = ( x 2 + 2 x ε + ε 2 + y 2 ) − ( x 2 + y 2 ) = 2 x ε + ε 2 f(x + \varepsilon,y) - f(x,y) = (x^2 + 2x\varepsilon + \varepsilon^2 + y^2) - (x^2 + y^2) = 2x\varepsilon + \varepsilon^2 f(x+ε,y)f(x,y)=(x2+2xε+ε2+y2)(x2+y2)=2xε+ε2)。
  4. 除以( ε \varepsilon ε):
    • ( f ( x + ε , y ) − f ( x , y ) ε = 2 x ε + ε 2 ε = 2 x + ε \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} = \frac{2x\varepsilon + \varepsilon^2}{\varepsilon} = 2x + \varepsilon εf(x+ε,y)f(x,y)=ε2xε+ε2=2x+ε)。
  5. 取极限:
    • ( lim ⁡ ε → 0 ( 2 x + ε ) = 2 x \lim_{\varepsilon \to 0} (2x + \varepsilon) = 2x limε0(2x+ε)=2x)。

所以,对于( f ( x , y ) = x 2 + y 2 f(x,y) = x^2 + y^2 f(x,y)=x2+y2),( ∂ f ( x , y ) ∂ x = 2 x \frac{\partial f(x,y)}{\partial x} = 2x xf(x,y)=2x)。

图像求导公式:

[ ∂ f ( x , y ) ∂ x ≈ f ( x + 1 , y ) − f ( x , y ) 1 \frac{\partial f(x,y)}{\partial x} \approx \frac{f(x + 1,y) - f(x,y)}{1} xf(x,y)1f(x+1,y)f(x,y)]

解析
  1. 公式含义
    • 这个公式是一个近似计算图像在 ( x x x) 方向上的偏导数的方法。
    • 这里的 ( f ( x , y ) f(x,y) f(x,y)) 表示图像在坐标 ( ( x , y ) (x,y) (x,y)) 处的像素值。
    • 公式中的 ( ∂ f ( x , y ) ∂ x \frac{\partial f(x,y)}{\partial x} xf(x,y)) 表示图像在 ( x x x) 方向上的偏导数,即在 ( x x x) 方向上像素值的变化率。
    • 公式右侧的 ( f ( x + 1 , y ) − f ( x , y ) 1 \frac{f(x + 1,y) - f(x,y)}{1} 1f(x+1,y)f(x,y)) 是一个差分运算,用来近似计算偏导数。具体来说,它计算了在 ( x x x) 方向上相邻两个像素(( x x x) 和 ( x + 1 x+1 x+1))的像素值之差。
  2. 近似原理
    • 在连续函数中,导数是通过极限定义的,即 ( ∂ f ( x , y ) ∂ x = lim ⁡ ε → 0 f ( x + ε , y ) − f ( x , y ) ε \frac{\partial f(x,y)}{\partial x} = \lim_{\varepsilon \to 0} \frac{f(x + \varepsilon,y) - f(x,y)}{\varepsilon} xf(x,y)=limε0εf(x+ε,y)f(x,y))。
    • 在离散的图像数据中,我们无法取极限,因此采用一个较小的增量(这里是 ( 1 1 1))来近似计算导数。这种方法称为差分近似。
  3. 应用场景
    • 这种图像求导公式在图像处理中非常常见,例如在边缘检测、图像锐化等操作中。
    • 通过计算图像的偏导数,可以找到图像中像素值变化剧烈的地方,这些地方通常对应于图像的边缘。
总结

这个公式提供了一种简单有效的方法来近似计算图像在 (x) 方向上的偏导数,通过相邻像素值的差来估计像素值的变化率,常用于图像处理中的各种操作。

使用卷积核进行求导:
在这里插入图片描述
在这里插入图片描述

图像梯度

图像的梯度就是图像两个方向导数组成的向量。梯度指向灰度变换最快的方向。

在这里插入图片描述
在这里插入图片描述

噪声的影响

在这里插入图片描述
如图所示。直接对函数fx求导。得到的求导结果会很混乱。解决方法就是先平滑。

在这里插入图片描述
经过三次卷积之后得到最终的求导结果。因为卷积有交换和结合律。可以交换卷积顺序来减少运算量。

在这里插入图片描述

在这里插入图片描述
高斯一阶偏导核进行边缘提取首先做了平滑,后做了去噪。
在这里插入图片描述

在这里插入图片描述
调整高斯一阶偏导核的方差大小,可以关注图像中不同的目标特征。方差越小特征越细腻,反之则反。

在这里插入图片描述

高斯核

  • 消除高频成分(低通滤波器)
  • 卷积核中的权值不可为负数
  • 权值总和为(恒定区域不受卷积影响)

高斯一阶偏导核

  • 高斯的导数
  • 卷积核中的权值可以为负
  • 权值总和是0 (恒定区域无响应)
  • 高对比度点的响应值大

边缘检测目标

在这里插入图片描述

在这里插入图片描述

经过高斯一阶偏导核卷积后的到如下图片
在这里插入图片描述

非极大值抑制

在这里插入图片描述
此像素与梯度方向上前后像素进行对比,此像素比前后像素任何一个像素的梯度强度小就删掉此像素点,这种方式就是非极大值抑制方式。这样就保留了梯度最强的一个点。
在这里插入图片描述
在处理的过程中,肯定会存在噪声,会设一个门限过滤一些噪点。如图所示,门限设的过高或过低都会影响最终的目标。采用采用双阈值的方式来解决这个问题。
先用高阈值,将梯度比较大的边缘留下来,然后用低阈值找出边缘,保留与高阈值边缘有连接关系的低阈值边缘。最终得到想要的目标图像。

总结

1._用高斯一阶偏导核卷积图像
2. 计算每个点的梯度幅值和方向
3.非极大值抑制:

  • 将宽的“边缘”细化至单个像素宽度

4.连接与國值(滞后):

  • 定义两个阈值:低和高
  • 使用高阈值开始边缘曲线,使用低阀值继续边缘曲线

http://www.ppmy.cn/news/1570005.html

相关文章

计算机组成原理——存储系统(四)

当晨曦的第一缕光线划破夜空,那是宇宙给奋斗者的信号——光明属于那些在黑暗中依旧寻找希望的人。在这条通往梦想的道路上,每一步都充满挑战,但正是这些挑战定义了你的坚韧与不屈。不要满足于现状,因为你的潜力远超想象&#xff1…

十二、Docker Compose 部署 SpringCloudAlibaba 微服务

一、部署基础服务 0、项目部署结构 项目目录结构如下: /home/zhzl_hebei/ ├── docker-compose.yml └── geochance-auth/└── Dockerfile└── geochance-auth.jar └── geochance-system/└── Dockerfile└── geochance-system.jar └── geochance-gateway/…

C++Primer 赋值运算符

欢迎阅读我的 【CPrimer】专栏 专栏简介:本专栏主要面向C初学者,解释C的一些基本概念和基础语言特性,涉及C标准库的用法,面向对象特性,泛型特性高级用法。通过使用标准库中定义的抽象设施,使你更加适应高级…

自动驾驶---两轮自行车的自主导航

1 背景 无人驾驶汽车最早出现在DARPA的比赛中,从那个时刻开始,逐渐引起全球学者的注意,于是从上个世纪开始各大高校院所开始了无人汽车的研发。直到这两年,无人驾驶汽车才开始走进寻常百姓家,虽然目前市面上的乘用车还…

C语言数据结构编程练习-排序算法

1、冒泡排序 思路:比较相邻的两个数,左边大于右边交换一趟排下来最大的在右边时间复杂度:O(n2) //冒泡排序 从小到大的顺序排列 //思路:比较相邻的两个数,左边大于右边交换一趟排下来最大的在右边 void bubbleSort(i…

LabVIEW图片识别逆向建模系统

本文介绍了一个基于LabVIEW的图片识别逆向建模系统的开发过程。系统利用LabVIEW的强大视觉处理功能,通过二维图片快速生成对应的三维模型,不仅降低了逆向建模的技术门槛,还大幅提升了建模效率。 ​ 项目背景 在传统的逆向建模过程中&#xf…

BOOST开关调整器拓扑

电路原理 在V和开关管Q1之间串接电感L1。当Q1导通时,电流从电感L1的下端流入 Q1。当 Q1关断时,电流从电感L1的下端通过整流二极管D1输送给输出电容C。及负载。 假设输出电压和电流已建立,电路已稳定运行,当Q1导通时(Tm),二极管反偏截止,L1的电流线性上升达到峰值l。 V T„/L1…

C++中常用的十大排序方法之4——希尔排序

成长路上不孤单😊😊😊😊😊😊 【😊///计算机爱好者😊///持续分享所学😊///如有需要欢迎收藏转发///😊】 今日分享关于C中常用的排序方法之4——希尔排序的相…