卷积神经网络(CNN)的计算量和参数怎么准确估计?

embedded/2024/10/18 12:12:54/

🍉 CSDN 叶庭云https://yetingyun.blog.csdn.net/


在这里插入图片描述

1. 卷积层(Convolutional Layer)

a) 计算量估计:

卷积层的 FLOPs = 2 * H_out * W_out * C_in * C_out * K_h * K_w

详细解释:

  • H_out, W_out:输出特征图的高度和宽度
  • C_in:输入通道数
  • C_out:输出通道数(卷积核数量)
  • K_h, K_w:卷积核的高度和宽度
  • 乘以 2 是因为每次卷积操作包含一次乘法和一次加法

注意:输出特征图的尺寸可以通过以下公式计算:
H_out = (H_in - K_h + 2P) / S + 1
W_out = (W_in - K_w + 2P) / S + 1
其中,H_in 和 W_in 是输入特征图的高度和宽度,P 是填充(padding),S 是步长(stride)。

b) 参数数量估计:

卷积层的参数数 = (K_h * K_w * C_in + 1) * C_out

解释:

  • K_h * K_w * C_in 是每个卷积核的权重数量
  • 加 1 是因为每个卷积核还有一个偏置项(bias)
  • 乘以 C_out 是因为有 C_out 个卷积核

2. 全连接层(Fully Connected Layer)

a) 计算量估计:

全连接层的 FLOPs = 2 * N_in * N_out

解释:

  • N_in:输入神经元数量
  • N_out:输出神经元数量
  • 乘以 2 同样是因为每个连接包含一次乘法和一次加法

b) 参数数量估计:

全连接层的参数数 = (N_in + 1) * N_out

解释:

  • N_in * N_out 是权重的数量
  • 加 1 再乘以 N_out 是因为每个输出神经元有一个偏置项

3. 池化层(Pooling Layer)

a) 计算量估计:

对于最大池化(Max Pooling):FLOPs ≈ H_out * W_out * C * K_h * K_w
对于平均池化(Average Pooling):FLOPs ≈ 2 * H_out * W_out * C * K_h * K_w

解释:

  • H_out, W_out:输出特征图的尺寸
  • C:通道数(与输入相同)
  • K_h, K_w:池化窗口的高度和宽度

b) 参数数量:池化层通常没有可学习的参数

4. 激活函数(Activation Functions)

激活函数的计算量通常较小,但在精确计算时可以考虑:

ReLU 的 FLOPs ≈ H * W * C (仅需要比较操作)
Sigmoid / {/} /Tanh 的 FLOPs 会更多,因为涉及指数计算

5. 批归一化层(Batch Normalization)

a) 计算量估计:

BN 层的 FLOPs ≈ 4 * H * W * C

解释:需要计算均值、方差、归一化和缩放 / {/} / 平移

b) 参数数量:

BN 层的参数数 = 2 * C (每个通道有一个缩放因子和一个平移因子)

6. 总体估算

要估算整个 CNN计算量参数数量,需要:

  1. 分析网络架构中的每一层
  2. 根据上述方法计算每层的 FLOPs 和参数
  3. 将所有层的结果相加

注意事项:

  • 实际运行时的计算量可能与理论估计有差异,因为现代硬件和优化技术可能会影响实际性能。
  • 某些操作(如数据传输)虽然不直接体现在 FLOPs 中,但也会影响实际运行时间。
  • 在设计神经网络时,平衡计算复杂度和模型性能是很重要的。


http://www.ppmy.cn/embedded/120514.html

相关文章

【机器学习(七)】分类和回归任务-K-近邻 (KNN)算法-Sentosa_DSML社区版

文章目录 一、算法概念二、算法原理(一)K值选择(二)距离度量1、欧式距离2、曼哈顿距离3、闵可夫斯基距离 (三)决策规则1、分类决策规则2、回归决策规则 三、算法优缺点优点缺点 四、KNN分类任务实现对比&am…

构建5G-TSN测试平台:架构与挑战

论文标题:Building a 5G-TSN Testbed: Architecture and Challenges 作者信息: Anna Agust-Torra, Marc Ferr-Mancebo, David Rincn-Rivera, Cristina Cervell Pastor, Sebasti Sallent-Ribes,来自西班牙巴塞罗那的加泰罗尼亚理工大学&…

蓝桥杯【物联网】零基础到国奖之路:十二. TIM

蓝桥杯【物联网】零基础到国奖之路:十二. TIM 第一节 理论知识第二节 cubemx配置 第一节 理论知识 STM32L071xx器件包括4个通用定时器、1个低功耗定时器(LPTIM)、2个基本定时器、2个看门狗定时器和SysTick定时器。 通用定时器(TIM2、TIM3、…

面试知识点总结篇四

一、计算机网络 概念:互连的、自治的计算机系统的集合组成:硬件、软件、协议。功能组成:通信子网(物理层、数据链路层、网络层)、资源子网(会话层、表示层、应用层)分别有广域网、城域网、局域…

【深度学习基础模型】玻尔兹曼机BM|受限玻尔兹曼机RBM|深度置信网络DBN详细理解并附实现代码。

【深度学习基础模型】玻尔兹曼机Boltzmann machines (BM)|受限玻尔兹曼机Restricted Boltzmann machines (RBM)|深度置信网络Deep belief networks (DBN)详细理解并附实现代码。 【深度学习基础模型】玻尔兹曼机Boltzmann machines (BM)|受限玻尔兹曼机Restricted Boltzmann m…

使用API有效率地管理Dynadot域名,设置域名服务器(NS)

前言 Dynadot是通过ICANN认证的域名注册商,自2002年成立以来,服务于全球108个国家和地区的客户,为数以万计的客户提供简洁,优惠,安全的域名注册以及管理服务。 Dynadot平台操作教程索引(包括域名邮箱&…

js设计模式(26)

js设计模式(26) JavaScript 中常用的设计模式可以分为几大类,包括创建型模式、结构型模式和行为型模式。以下是它们的分类和常见设计模式的完整列表: 一、创建型模式 这些模式主要关注对象的创建方式,目的是降低系统耦合和复杂性。 工厂模…

harproxy

安装依赖包 apt update && apt -y install gcc make libssl-dev libpcre3 libpcre3-dev zlib1g-dev libreadline-dev libsystemd-dev liblua5.3-dev 下载 [rootubuntu2204 ~]#wget http://www.haproxy.org/download/2.8/src/haproxy- 2.8.0.tar.gz 编译安装 [rootubun…