卷积神经网络 - 一维卷积、二维卷积

news/2025/3/15 7:55:35/

卷积(Convolution),也叫褶积,是分析数学中一种重要的运算。在信号处理或图像处理中,经常使用一维或二维卷积,本博文我们来学习一维卷积和二维卷积。

理解一维卷积和二维卷积的核心在于把握维度对特征提取方式的影响。我们从数学定义、几何意义和应用场景三个维度展开分析,并通过对比揭示其本质差异。

一、数学定义对比

1. 一维卷积 (1D Convolution)

特性

  • 滑动方向:单一方向(时间轴/序列方向)

  • 感受野:连续区间

  • 参数数量:K×Cin×Cout

2. 二维卷积 (2D Convolution)

特性

  • 滑动方向:两个正交方向(高度+宽度)

  • 感受野:矩形区域

  • 参数数量:Kh​×Kw​×Cin​×Cout​

二、几何意义解析

1. 一维卷积的几何视角

特征提取模式

  • 在时间轴上滑动的局部窗口

  • 捕获时序相关性(如语音中的音素过渡)

  • 典型模式检测:

    • 上升沿检测核:[1, 0, -1]

    • 振动检测核:[1, -2, 1]

2. 二维卷积的几何视角

特征提取模式

  • 在平面网格上滑动的局部窗口

  • 捕获空间相关性(如图像中的边缘走向)

  • 典型模式检测:

    • 水平边缘检测核:

    • 45度对角线检测核:

三、计算过程对比演示

案例1:一维卷积实例

输入序列[3, 5, 2, 6, 8]
卷积核[0.5, -1]
计算过程(步长=1,无填充):

位置1: 3×0.5 + 5×(-1) = 1.5 -5 = -3.5  
位置2: 5×0.5 + 2×(-1) = 2.5 -2 = 0.5  
位置3: 2×0.5 + 6×(-1) = 1 -6 = -5  
位置4: 6×0.5 + 8×(-1) = 3 -8 = -5

输出[-3.5, 0.5, -5, -5]

案例2:二维卷积实例

输入矩阵

卷积核

计算过程(步长1,无填充):

位置(1,1): 
1×1 + 3×0 + 4×(-1) + 6×0.5 = 1 -4 +3 = 0位置(1,2): 
3×1 + 2×0 + 6×(-1) + 5×0.5 = 3 -6 +2.5 = -0.5位置(2,1): 
4×1 + 6×0 + 7×(-1) + 9×0.5 = 4 -7 +4.5 = 1.5位置(2,2): 
6×1 + 5×0 + 9×(-1) + 8×0.5 = 6 -9 +4 = 1

输出矩阵

四、本质差异深度分析

维度特征提取方向参数空间不变性典型应用
1D单方向时序关系O(K)时间平移语音识别、股票预测
2D二维空间关系O(K^2)空间平移图像分类、医学影像

关键差异点

  1. 邻域结构

    • 1D:线性邻域(前序-当前-后续)

    • 2D:平面邻域(包含空间拓扑关系)

  2. 参数复杂度

    • 1D参数量随核长度线性增长

    • 2D参数量随核尺寸平方增长

  3. 平移不变性

    • 1D处理时间平移(早/晚出现相同模式)

    • 2D处理空间平移(不同位置相同物体)

  4. 特征组合方式

    • 1D通过堆叠卷积层捕获长程依赖

    • 2D通过分层卷积建立多尺度表征

五、统一数学框架

两种卷积都可以纳入张量卷积的一般形式:

  • 对于1D卷积,其中一个维度退化(如j=0)

  • 对于2D卷积,两个维度都保持活跃

几何解释

  • 1D:在直线上滑动的线段检测器

  • 2D:在平面上滑动的平面检测器

六、现代扩展形式

扩展类型1D实现2D实现目的
空洞卷积间隔采样时序点棋盘式采样扩大感受野
可分离卷积深度分离时序卷积空间分离卷积降低参数量
动态卷积时间自适应的核空间自适应的核增强灵活性

七、选择指导原则

  1. 数据类型决定维度

    • 时间序列 → 1D卷积

    • 图像/视频 → 2D/3D卷积

  2. 特征方向性需求

    • 需要捕获空间方向特征 → 2D卷积

    • 仅需序列模式 → 1D卷积

  3. 计算资源约束

    • 资源有限时优先1D

    • 允许复杂计算时使用2D

终极理解
一维卷积是时序特征提取器,关注事件发生的顺序规律;二维卷积是空间特征提取器,关注模式的几何分布。

二者的本质区别在于:
1D卷积处理的是因果性(causality),2D卷积处理的是共现性(co-occurrence)。这种维度差异决定了它们在特征表示、参数设计和应用场景上的根本不同。

八、示例

典型类比:
现实场景卷积对应
金属探测器扫沙滩在二维空间滑动检测
心电图机走纸在时间轴上滑动分析
验钞灯照射纸币多层级特征验证
一维卷积示例:

下层为输入信号序列, 上层为卷积结果。连接边上的数字为滤波器中的权重。下图的卷积结果为近似值。

二维卷积示例

在图像处理中,卷积经常作为特征提取的有效方法。一幅图像在经过卷积操作后得到结果称为特征映射(Feature Map)。下图给出在图像处理中几种常用的滤波器,以及其对应的特征映射。图中最上面的滤波器是常用的高斯滤波器,可以用来对图像进行平滑去噪;中间和最下面的滤波器可以用来提取边缘特征。

九、特性和关键优势:

卷积就像用同一个「特征扫描仪」在数据上逐段检查,专注寻找重复出现的局部模式。

想象你拿手机扫描超市货架找可乐:

  1. 扫描动作:手机摄像头每次对准货架的一小块区域(局部连接)

  2. 同一标准:无论扫描哪个位置,都用相同的"可乐logo识别程序"(权重共享)

  3. 滑动检测:从左到右移动手机,直到找到红底白字的经典标志(滑动窗口)

  • 效率高:1个扫描器重复使用,避免重复造轮子

  • 专注细节:每次只看局部,不受无关信息干扰

  • 模式专家:专门检测平移不变的特征(如无论猫咪在图片哪个位置都能识别)

终极记忆口诀:
"小窗滑动,同标检测,特征抓取,高效省力"


http://www.ppmy.cn/news/1579265.html

相关文章

AVL树的平衡算法的简化问题

AVL树是一种紧凑的二叉查找树。它的每个结点,都有左右子树高度相等,或者只相差1这样的特性。文章https://blog.csdn.net/aaasssdddd96/article/details/106291144给出了一个例子。 为了便于讨论,这里对AVL树的结点平衡情况定义2个名称&#…

Java 大视界 -- Java 大数据在智能教育虚拟实验室建设与实验数据分析中的应用(132)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…

P6772 [NOI2020] 美食家

训练角度:图上的状态转移,倍增 → \rightarrow → 优化状态转移; ▍ 题意 精灵王国共有 n n n 座城市,城市从 1 1 1 到 n n n 编号,其中城市 i i i 的美食能为小 W 提供 c i c_i ci​ 的愉悦值。精灵王国的城市…

市场价格波动的影响因素及交易策略优化

市场价格波动的影响因素及交易策略优化 在市场交易过程中,价格波动是不可避免的现象。不同的交易者会基于市场走势、技术分析和资金管理制定不同的交易策略。本文将分析市场价格波动的关键影响因素,并探讨优化交易策略的方法,以帮助交易者更有…

技术与情感交织的一生 (一)

目录 一条朋友圈 静默 至暗时刻 选择 成人高考 歇一下 一条朋友圈 大年初一是我合作伙伴的生日,我称呼他为老高,他发的朋友圈写到:“50岁了,留下的皆是珍贵回忆。” ,看到留言的瞬间,只有一个感觉&a…

Jump Desktop for Mac v9.0.94 优秀的远程桌面连接工具 支持M、Intel芯片

Jump Desktop for Mac 版是macOS平台上的一款远程控制程序,支持Windows和Mac 双平台,通过邮件关联即可帮助设备自动找到桌面并进行操作。 应用介绍 Jump Desktop for Mac 是一款Mac上非常强大和易用的远程桌面控制软件,支持RDP、VNC协议&am…

Excel两列和依次相减

Excel实现左列依次行数的和减去右列依次行数的和: 举例:结余SUM(预付款)-SUM(开支) 公式:SUM($B$2:B2)-SUM($C$2:C2)

计算机安全 第四节:访问控制(中)

中间控制 组:访问权限的管理依靠单个主体是相当麻烦的, 因此通常将用户置于组中,并也可以从用户组取得访问权限 理想状况,所有的访问许可可以通过组成员关系来居中调停通常,安全策略有一些特殊的场合,在这…