计算机视觉与深度学习-卷积神经网络-纹理表示卷积神经网络-纹理表示-[北邮鲁鹏]

news/2024/11/29 2:54:10/

目录标题

  • 参考文章
  • 纹理定义
  • 纹理的分类
    • 规则纹理
    • 随机纹理
  • 纹理的表示方法
    • 基于卷积核组
      • 思路
      • 什么卷积核组
        • 卷积核类型(边缘、条形、点状)
        • 卷积核尺度(3~6个尺度)
        • 卷积核的方向
        • 卷积核组的设计
      • 表示步骤
        • 步骤一:设计卷积核组。
        • 步骤二:利用卷积核组对图像进行卷积操作获得对应的特征响应图组。
        • 步骤三:利用特征响应图的某种统计信息来表示图像中的纹理。
      • 总结
  • 纹理表示注意事项
  • 纹理表示与卷积神经网络的联系

参考文章

计算机视觉与深度学习-05-纹理表示&卷积神经网络-北邮鲁鹏老师课程笔记

纹理定义

纹理是指物体表面的视觉和触觉特征,它描述了物体表面的细节、图案和结构。
计算机图形学中的纹理既包括通常意义上物体表面的纹理即使物体表面呈现凹凸不平的沟纹,同时也包括在物体的光滑表面上的彩色图案,通常我们更多地称之为花纹。

在这里插入图片描述
纹理是由于物体表面的物理属性的多样性而造成的,物理属性不同表示某个特定表面特征的灰度或者颜色信息不同,不同的物理表面会产生不同的纹理图像,因而纹理作为图像的一个极为重要的属性,在计算机视觉和图像处理中占有举足轻重的地位。

纹理是图像中特征值强度的某种局部重复模式的宏观表现。然而,对于自然纹理图像而言这种重复模式往往是近似的和复杂的,难以用语言描述,而人类对纹理的感受多是与心理效果相结合的,因此,迄今都没有一个对纹理的正式的、广泛认可的和一致的定义。

Hawkins曾经对纹理给出了一个比较详细的描述,他认为纹理有三个主要的标志:

  1. 某种局部的序列性在比该序列更大的区域内不断重复
  2. 序列是由基本元素非随机排列组成的
  3. 各部分大致是均匀的统体,在纹理区域内的任何地方都有大致相同的结构尺

纹理的分类

规则纹理

在这里插入图片描述
通常都是人造

随机纹理

在这里插入图片描述
自然界通常都是随机纹理

纹理的表示方法

基于卷积核组

思路

  1. 利用卷积核组提取图像中的纹理基
  2. 利用基元的统计信息来表示图像中的纹理

什么卷积核组

卷积核组又称为纹理滤波器组。

卷积核类型(边缘、条形、点状)
  • 边缘:高斯一阶偏导核。例:黑|白,白|黑。
  • 条形:高斯二阶偏导核。例:白|黑|白,黑|白|黑。
  • 点状:。例:周围白中间黑,周围黑中间白。

在这里插入图片描述

卷积核尺度(3~6个尺度)
  • 大尺度,提取粗粒度边。
  • 小尺度,提取细粒度边。
卷积核的方向

在这里插入图片描述
前6个卷积核检测是否存在边缘及边缘的方向。
第1个卷积核检测图像中是否有x方向的边缘。(高斯卷积核对y求导)
第4个卷积核检测图像中是否有y方向的边缘。(高斯卷积核对x求导)
第7个卷积核检测图像中是否有斑状基元。

第1个卷积核检测图像中是否有x方向的边缘。(高斯卷积核对y求导)
在这里插入图片描述
第7个卷积核检测图像中是否有斑状基元
在这里插入图片描述

卷积核组的设计

在这里插入图片描述
48个卷积核组
在这里插入图片描述

表示步骤

步骤一:设计卷积核组。

在这里插入图片描述

步骤二:利用卷积核组对图像进行卷积操作获得对应的特征响应图组。

在这里插入图片描述

步骤三:利用特征响应图的某种统计信息来表示图像中的纹理。

方式一 (含基元位置信息)
在这里插入图片描述
假设图片是 100 * 100,使用上述含7个卷积核的卷积核组,则该图片每一个像素点表示为 r i = [ r i 1 , r i 2 , … , r i 7 ] r_i = [r_{i1},r_{i2},\dots,r_{i 7}] ri=[ri1,ri2,,ri7] r i m a x = m a x { r i 1 , r i 2 , … , r i 7 } r_{imax} = max\{{r_{i1},r_{i2},\dots,r_{i 7}}\} rimax=max{ri1,ri2,,ri7}。则 r i m a x r_{imax} rimax对应的特征响应图即为该像素点的特征。

其中 r i r_i ri的维度是 10000 * 1, [ r i 1 , r i 2 , … , r i 7 ] [r_{i1},r_{i2},\dots,r_{i7}] [ri1,ri2,,ri7]的维度是 10000 * 7,经过变换后 [ r i 1 , r i 2 , … , r i 7 ] [r_{i1},r_{i2},\dots,r_{i7}] [ri1,ri2,,ri7]的维度为 70000 * 1。

该表示方式的缺点:70000维太复杂。

方式二 (忽略基元位置信息)

纹理分类任务中,基元的位置对纹理分类没有影响。

只关注出现了哪种基元对应的纹理以及基元出现的频率,即用特征响应图的平均值表示图像。
在这里插入图片描述

假设图片是100 * 100,使用上述含7个卷积核的卷积核组,则该图片每一个像素点基元平均值表示为 r ˉ = [ r 1 ˉ , r ˉ 2 , … , r ˉ 7 ] \bar r = [ \bar {r_{1}}, \bar r_{2},\dots, \bar r_{ 7}] rˉ=[r1ˉ,rˉ2,,rˉ7] r ˉ i m a x = m a x { r ˉ 1 , r ˉ 2 , … , r ˉ 7 } \bar r_{imax} = max\{{\bar r_{1}, \bar r_{2},\dots, \bar r_{7}}\} rˉimax=max{rˉ1,rˉ2,,rˉ7},则 r i m a x r_{imax} rimax对应的特征响应图即为该像素点的特征。

其中 r ˉ i \bar r_i rˉi为第 i 个特征响应图的平均值,其维度是 1 * 1, r ˉ j \bar r_j rˉj的维度是 1 * 7,经过变换后 r ˉ j \bar r_j rˉj的维度为 7 * 1。

举例表示
在这里插入图片描述
纹理表示A:r4 比较大,表示y方向的纹理比较多。
纹理表示B:r5 比较大,表示y=x方向的纹理比较多。
纹理表示C:r7 比较大,表示斑点纹理比较多。

总结

  1. 设计卷积核组;
  2. 利用卷积核组对图像进行卷积操作获得对应的特征响应图组;
  3. 利用特征响应图的某种统计信息来表示图像中的纹理。

纹理表示注意事项

在这里插入图片描述
r ˉ = [ r ˉ 1 , r ˉ 2 , r ˉ 3 , r ˉ 4 , . . . , r ˉ 46 , r ˉ 47 , r ˉ 48 ] \bar r = [\bar r_1,\bar r_2,\bar r_3,\bar r_4,... ,\bar r_{46},\bar r_{47}, \bar r_{48}] rˉ=[rˉ1,rˉ2,rˉ3,rˉ4,...,rˉ46,rˉ47,rˉ48]中最大值大概率只有一个,因为一张图像包含一个卷积核组所表示的纹理的概率大,包含多个卷积核组所表示纹理的概率很小,所以这个48维向量是稀疏向量。

纹理表示与卷积神经网络的联系

从纹理表示中的卷积核组理解卷积神经网络的卷积层,神经网络中卷积核可能比上例中纹理表示的卷积核更复杂。神经网络的卷积层可以看做上例中纹理表示卷积核组的扩展。


http://www.ppmy.cn/news/1121354.html

相关文章

【算法思想-排序】根据另一个数组次序排序 - 力扣 1122 题

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kuan 的首页,持续学…

专业排版软件InDesign 2023下载 InDesign mac中文功能

InDesign 2023 mac是一款专业排版软件,适用于Windows和macOS平台。它可以帮助用户创建、设计和排版各种印刷品和数字出版物,如杂志、书籍、报纸、广告、海报、手册、电子书等。 InDesign 2023 mac软件特点 多种页面布局:支持多种页面布局&…

mysql 8 groupby 禁用,无效解决办法

MySQL 8 groupby 禁用,无效解决办法 MySQL8 默认不支持GroupBy,可通过如下命令查询,如果发现 ONLY_FULL_GROUP_BY 则说明未开启 GroupBY。 开启前查询结果: mysql> select sql_mode; -------------------------------------…

uni-app 苹果手机底部安全区域的适配问题

方案一(最快速) 解决办法&#xff1a;利用 IOS 新增的 env() 和 constant() 特性来解决&#xff0c;不需要自己动态计算高度&#xff0c;只需将如下 CSS 代码添加到样式中即可。无法解决如果底部区域是输入框&#xff0c;苹果手机的输入法会把输入框遮挡的问题 <!-- 底部栏…

MySQL学习笔记3

MySQL的源码编译安装&#xff1a; 1、参考MySQL的源码安装官方文档&#xff1a; 2、源码安装定制选项&#xff1a; 3、源码安装三部曲&#xff1a;配置、编译、安装。 4、软件安装包&#xff1a; mysql-boost-5.7.43.tar.gz 5、安装需求&#xff1a; 安装需求具体配置安装目…

High-Resolution Side Channels for Untrusted Operating Systems【ATC‘17】

目录 摘要引言贡献• 一个不受信任的操作系统的两个新的高分辨率侧通道来攻击受保护的应用程序&#xff1b;• 对 libjpeg 的显着改进攻击和针对 VC3 的新攻击&#xff1b;• 侧通道攻击对不受信任的操作系统的重要性增加。 系统模型背景Intel SGX页面错误通道时间限制空间限制…

操作系统权限提升(二十八)之数据库提权-SQL Server 数据库安装

SQL Server 数据库安装 SQL Server介绍 SQL Server 是Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点&#xff0c;可跨越从运行Microsoft Windows 98 的膝上型电脑到运行Microsoft Windows 2012 的大型多处理器的服务器等多种…

el-input有时候添加不了有时候删不了

有些情况下在 el-input 是无法输入的&#xff0c;绑定的值动也动不了&#xff0c;删也删不掉&#xff0c;改也改不了可能是以下原因导致 1.可能没更新&#xff0c;使用forceUpdate强制刷新 <el-input typetext v-modelvalue changechange()></el-input> change(){…