深度学习|表示学习|卷积神经网络|NIN 相比普通 CNN|17

devtools/2025/2/7 0:55:51/

如是我闻: Network in Network (NIN) 是 2014 年由 Min Lin 等人 提出的一个改进 CNN 结构的模型。它的核心思想是:用小型的多层感知机(MLP,Multi-Layer Perceptron)替代传统 CNN 中的卷积层,从而提高网络的表达能力。

在这里插入图片描述


NIN 相比普通 CNN 的不同之处

在普通的 CNN 中,每一层的卷积操作可以看作是使用 固定的线性滤波器 提取特征,然后通过非线性激活函数(如 ReLU)增加表达能力。然而,这种方法的局限性在于每个卷积核的表达能力较弱,因为它本质上是一个线性变换。

NIN 提出的核心改进点是:

  1. 使用 MLP 代替传统的卷积核

    • 传统 CNN:用一个形如 3 × 3 3 \times 3 3×3 5 × 5 5 \times 5 5×5 的卷积核进行特征提取,相当于一个简单的线性变换。
    • NIN:用一个 小型的神经网络(MLP) 代替卷积核,使得每个“卷积核”不仅仅是一个线性变换,而是一个具有 多层非线性结构 的函数,提高了特征提取能力。
  2. 使用 1x1 卷积实现 MLP

    • 具体来说,NIN 采用 多个 1×1 卷积层 作为 MLP,每个 1×1 卷积层可以看作一个神经元,这样可以在通道维度上学习更复杂的特征表示,而不仅仅是空间维度上的卷积操作。
  3. 全局平均池化 (Global Average Pooling, GAP)

    • 传统 CNN 在最后通常使用全连接层进行分类,而 NIN 用 GAP(Global Average Pooling) 取代全连接层,使得整个网络更轻量化,同时减少过拟合的风险。

总结对比

比较维度普通 CNNNetwork in Network (NIN)
卷积操作线性卷积核 + 非线性激活用 MLP 代替普通卷积
1×1 卷积很少使用作为 MLP 主要成分
表达能力受限于单层卷积核的线性变换通过 MLP 提高特征表达能力
全连接层需要额外的全连接层使用 GAP 取代全连接层
参数量可能较大通过 GAP 减少参数

NIN 的影响

NIN 通过引入 1×1 卷积 + MLP,极大地增强了 CNN 的特征提取能力,并且启发了后续许多深度学习模型的设计,比如:

  • GoogLeNet (Inception) 大量使用 1×1 卷积进行特征变换
  • ResNet 也借鉴了 1×1 卷积用于降维和非线性变换

以上


http://www.ppmy.cn/devtools/156661.html

相关文章

powershell编写一个简易的http服务器httpServer

文章目录 powershell一键启动检查相关进程 源码 powershell一键启动 一键启动脚本内容(powershell,兼容windows powershell和powershell7) irm https://gitee.com/xuchaoxin1375/scripts/raw/main/PS/Tools/Tools.psm1|iex sleep 0.5 help Start-HTTPServer #可以指定参数选择…

Rust场景示例:为什么要使用切片类型

通过对比 不用切片 和 使用切片 的场景,说明切片类型在 Rust 中的必要性: 场景:提取字符串中的单词 假设我们需要编写一个函数,从一个句子中提取第一个单词。我们将分别展示 不用切片 和 使用切片 的实现,并对比二者的…

单机性能调优中的程序优化

目录 一、系统框架的选择 二、程序优化 表单压缩 局部刷新 仅取所需 逻辑清晰 谨慎继承 程序算法优化 批处理 延迟加载 防止内存泄漏 减少大对象引用 防止争用死锁 存储过程 内存分配 并行 异步 缓存 单机优化顾名思义就是我们要在单机上对系统的性能进行调优…

8.PPT:小李-第二次世界大战【21】

目录 NO123 ​ NO4567 ​ NO8\9\10\11​ 图片→格式→大小对话框→锁定纵横比✔动画→飞入→效果选项:方向/序列→开始→持续时间→延迟时间持续时间:1s延迟:0.5s音频剪切时间:0.5s:00:00.500自动换片时间设置&…

javaEE初阶————多线程初阶(1)

多线程初阶———— 1,认识线程 1.1 概念 1)线程是什么 线程就是一个“执行流”,可以理解为程序执行的最小单位; 可以看成轻量级的进程; 2)为啥要有线程 “并发编程” 的需要,但是我们不…

pytorch图神经网络处理图结构数据

人工智能例子汇总:AI常见的算法和例子-CSDN博客 图神经网络(Graph Neural Networks,GNNs)是一类能够处理图结构数据的深度学习模型。图结构数据由节点(vertices)和边(edges)组成&a…

TCP连接管理与UDP协议IP协议与ethernet协议

SEO Meta Description: 深入解析TCP连接管理、UDP协议、IP协议与Ethernet协议的工作原理及其在网络通信中的应用,全面了解各协议的功能与区别。 介绍 网络通信依赖于一系列协议来确保数据的可靠传输和高效处理。本文将详细介绍TCP连接管理、UDP协议、IP协议和Ethe…

深入解析:如何获取商品 SKU 详细信息

在电商领域,SKU(Stock Keeping Unit,库存进出计量的基本单元)是商品管理中的一个重要概念。每个 SKU 都代表了一个具体的产品变体,例如不同的颜色、尺寸或配置。获取商品的 SKU 详细信息对于商家优化库存管理、提高运营…