深度学习camp-第J7周:对于ResNeXt-50算法的思考

news/2025/1/14 20:11:44/
  • 🍨 本文为🔗365天深度学习训练营 中的学习记录博客
  • 🍖 原作者:K同学啊

📌你需要解决的疑问:这个代码是否有错?对错与否都请给出你的思考
📌打卡要求:请查找相关资料、逐步推理模型、详细写下你的思考过程

代码如下

# 定义残差单元  
def block(x, filters, strides=1, groups=32, conv_shortcut=True):  if conv_shortcut:  shortcut = Conv2D(filters * 2, kernel_size=(1, 1), strides=strides, padding='same', use_bias=False)(x)  # epsilon为BN公式中防止分母为零的值  shortcut = BatchNormalization(epsilon=1.001e-5)(shortcut)  else:  # identity_shortcut  shortcut = x  # 三层卷积层  x = Conv2D(filters=filters, kernel_size=(1, 1), strides=1, padding='same', use_bias=False)(x)  x = BatchNormalization(epsilon=1.001e-5)(x)  x = ReLU()(x)  # 计算每组的通道数  g_channels = int(filters / groups)  # 进行分组卷积  x = grouped_convolution_block(x, strides, groups, g_channels)  x = Conv2D(filters=filters * 2, kernel_size=(1, 1), strides=1, padding='same', use_bias=False)(x)  x = BatchNormalization(epsilon=1.001e-5)(x)  x = Add()([x, shortcut])  x = ReLU()(x)  return x

如果conv_shortcut=False,那么执行“x=Add()…”语句时,通道数不一致的,为什么不会报错呢?

思考

关键点分析:

  1. conv_shortcut=False 时的 shortcut

    • conv_shortcut=False 时,shortcut 直接等于 x,没有经过卷积层处理。也就是说,在 x = Add()([x, shortcut]) 这一行之前,shortcutx 是相同的张量。因此,它们的通道数和空间尺寸应该是相同的,直接相加是没有问题的。
    • 因此,执行 Add() 时,xshortcut 的维度是匹配的。
  2. conv_shortcut=True 时的 shortcut

    • conv_shortcut=True 时,shortcut 会通过一个 1x1 卷积进行通道数调整:
      shortcut = Conv2D(filters * 2, kernel_size=(1, 1), strides=strides, padding='same', use_bias=False)(x)
      
      • 这里 shortcut 的通道数被修改为 filters * 2,使其与主路径输出的通道数一致。
      • 如果步长 strides 是大于1的值(例如2),则 shortcut 的空间尺寸(高度和宽度)也会发生变化,因此需要保证它们的空间尺寸与主路径的输出相匹配。为此,使用 Conv2DBatchNormalization 来调整通道数,并保持 padding='same' 来避免空间尺寸的变化。
  3. Add() 层的作用

    • Add() 层要求输入张量的维度一致。如果 conv_shortcut=Falseshortcutx 在通道数和空间尺寸上已经是相同的,因此直接相加是不会出现维度不匹配的错误的。
    • 但是,如果通道数或空间尺寸不一致,Keras 会抛出错误,提示“维度不匹配”或类似错误。

为什么没有报错:

  • conv_shortcut=False 时,shortcutx 的维度是一样的,因为 shortcut = x,它们在通道数、空间尺寸等维度上都相同,因此 Add() 操作没有问题。
  • Add() 操作本身不会对维度进行任何变换,它只是简单地将两个张量逐元素相加。如果两个张量的维度不一致,Keras 会报错。

结论:

  • conv_shortcut=False 的情况下,shortcut 直接等于 x,因此它们的维度是相同的,Add() 操作能够成功执行。
  • 只有当 conv_shortcut=True 时,shortcut 会通过卷积进行维度调整,这样就确保了通道数和空间尺寸与主路径的输出一致,避免了维度不匹配的问题。

测试:

为了验证,可以在代码中添加调试语句,打印出 x.shapeshortcut.shape,看看它们在执行 Add() 之前是否匹配。例如:

print("x shape:", x.shape)
print("shortcut shape:", shortcut.shape)

这可以帮助进一步确认 xshortcut 在执行加法之前是否一致。


http://www.ppmy.cn/news/1563114.html

相关文章

基于element UI el-dropdown打造表格操作列的“更多⌵”上下文关联菜单

<template><div :class"$options.name"><el-table :data"tableData"><el-table-column type"index" label"序号" width"60" /><!-- 主要列 BEGIN---------------------------------------- --&g…

【2025 Rust学习 --- 15 迭代器的消耗】

消耗迭代器 使用带有 for 循环的迭代器&#xff0c;也可以显式调用 next&#xff0c;但有许多常见任务不必一遍又一遍地写出来。Iterator 特型提供了一大组可选方法来涵盖其中的许多任务。 简单累加&#xff1a;count、sum 和 product count&#xff08;计数&#xff09;方法…

[C#] 调用matlab 类型初始值设定项引发异常

我的环境/开发工具&#xff1a;Matlab2016b&#xff08;64位&#xff09;vs2017 报的异常&#xff1a;System.TypeInitializationException:““MathWorks.MATLAB.NET.Arrays.MWNumericArray”的类型初始值设定项引发异常。”。 异常原因&#xff1a;解决方案平台是AnyCPU&am…

WINFORM - DevExpress -> DevExpress总结[安装、案例]

安装devexpress软件 路径尽量不换&#xff0c;后面破解不容易出问题 vs工具箱添加控件例如: ①使用控制台进入DevExpress安装目录: cd C:\Program Files (x86)\DevExpress 20.1\Components\Tools ②添加DevExpress控件&#xff1a; ToolboxCreator.exe/ini:toolboxcreator…

热烈祝贺“钛然科技”选择使用订单日记

感谢珠海钛然科技有限公司选择使用订单日记&#xff01; 珠海钛然科技有限公司&#xff0c;成立于2020年&#xff0c;位于广东省珠海市高新区&#xff0c;是一家以从事研发和生产功能型纳米高分子涂层为主的企业。 在业务不断壮大的过程中&#xff0c;想使用一种既能提升运营…

单片机-定时器中断

1、相关知识 振荡周期1/12us; //振荡周期又称 S周期或时钟周期&#xff08;晶振周期或外加振荡周期&#xff09;。 状态周期1/6us; 机器周期1us; 指令周期1~4us; ①51单片机有两组定时器/计数器&#xff0c;因为既可以定时&#xff0c;又可以计数&#xff0c;故称之为定时器…

macOS 安装tomcat9

macOS 安装tomcat9 URL&#xff1a;https://tomcat.apache.org/download-90.cgi 解压之后放到指定目录 /Users/lanren/install/tomcat-9 自己取个名字就行 给权限&#xff1a; ① 先进行权限修改&#xff1a;终端输入sudo chmod 755 /Users/lanren/install/tomcat-9/bin/…

Shell 脚本与 Pytest 结合:交替运行 Pytest 的两个测试方法

有这样一个情况&#xff0c;在test_user_center.py文件中有两个测试方法&#xff0c;test_login和test_logout&#xff0c; 如果在终端这样指定命令&#xff1a; pytest -q -s -ra --count500 test_user_center.py --alluredir./report/login_and_logout/resource | tee pyte…