AI学习指南深度学习篇-卷积神经网络基础

devtools/2024/9/24 8:06:01/
aidu_pl">

AI学习指南深度学习篇-卷积神经网络基础

深度学习技术在近年来取得了巨大的发展,并且在各个领域都取得了非常好的效果。其中,卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习的重要分支,在计算机视觉、自然语言处理等领域都取得了非常好的效果。

在本篇博客中,我们将重点介绍CNN中的基本组成部分,包括卷积层、池化层和全连接层,以及解释卷积操作的原理和作用。

卷积层

卷积层是CNN的核心组成部分,它通过卷积操作来提取输入数据中的特征信息。在卷积操作中,卷积核(也称为过滤器)对输入数据进行滑动操作,并计算每个位置上的内积,从而得到输出特征图。

具体来说,假设输入数据的大小为 H × W × D H×W×D H×W×D,其中 H H H表示输入数据的高度, W W W表示输入数据的宽度, D D D表示输入数据的深度(通道数),卷积核的大小为 h × w × D × K h×w×D×K h×w×D×K,其中 h h h表示卷积核的高度, w w w表示卷积核的宽度, D D D表示卷积核的输入通道数, K K K表示卷积核的输出通道数,卷积操作的输出特征图的大小为$ (H-h+1)×(W-w+1)×K$。

下面我们通过一个具体的示例来说明卷积操作的原理。假设输入数据的大小为 4 × 4 × 1 4×4×1 4×4×1,卷积核的大小为 3 × 3 × 1 × 1 3×3×1×1 3×3×1×1,则卷积操作的输出特征图的大小为 2 × 2 × 1 2×2×1 2×2×1

import numpy as np# 输入数据
input_data = np.array([[1, 2, 2, 0],[0, 1, 3, 2],[3, 1, 2, 3],[2, 0, 1, 1]
])# 卷积核
kernel = np.array([[1, 0, 1],[1, 1, 1],[0, 0, 1]
])# 卷积操作
def convolution(input_data, kernel):H, W = input_data.shapeh, w = kernel.shapeoutput_data = np.zeros((H-h+1, W-w+1))for i in range(H-h+1):for j in range(W-w+1):output_data[i, j] = np.sum(input_data[i:i+h, j:j+w] * kernel)return output_data# 执行卷积操作
output_data = convolution(input_data, kernel)
print(output_data)

上述示例中,我们定义了一个 4 × 4 × 1 4×4×1 4×4×1的输入数据和一个 3 × 3 × 1 × 1 3×3×1×1 3×3×1×1的卷积核,然后执行了卷积操作。最终得到了一个 2 × 2 × 1 2×2×1 2×2×1的输出特征图。

从上述示例可以看出,卷积操作可以有效地提取输入数据的特征信息,因此在深度学习中被广泛应用于图像处理、语音识别等领域。

池化层

池化层是CNN中的另一个重要组成部分,它通过对输入数据进行降采样操作来减少数据的维度。池化操作通常包括最大池化(Max Pooling)和平均池化(Average Pooling)两种方式,其中最大池化是取池化窗口中的最大值作为输出,而平均池化是取池化窗口中的平均值作为输出。

具体来说,假设输入数据的大小为 H × W × D H×W×D H×W×D,池化操作的窗口大小为 h × w h×w h×w,则池化操作的输出特征图的大小为$ \lceil \frac{H}{h} \rceil × \lceil \frac{W}{w} \rceil × D$。

下面我们通过一个具体的示例来说明最大池化操作的原理。假设输入数据的大小为 4 × 4 × 1 4×4×1 4×4×1,池化窗口的大小为 2 × 2 2×2 2×2,则最大池化操作的输出特征图的大小为 2 × 2 × 1 2×2×1 2×2×1

import numpy as np# 输入数据
input_data = np.array([[1, 2, 2, 0],[0, 1, 3, 2],[3, 1, 2, 3],[2, 0, 1, 1]
])# 最大池化操作
def max_pooling(input_data, pool_size):H, W = input_data.shapeh, w = pool_sizeoutput_data = np.zeros((H//h, W//w))for i in range(0, H, h):for j in range(0, W, w):output_data[i//h, j//w] = np.max(input_data[i:i+h, j:j+w])return output_data# 执行最大池化操作
output_data = max_pooling(input_data, (2, 2))
print(output_data)

上述示例中,我们定义了一个 4 × 4 × 1 4×4×1 4×4×1的输入数据和池化窗口的大小为 2 × 2 2×2 2×2,然后执行了最大池化操作。最终得到了一个 2 × 2 × 1 2×2×1 2×2×1的输出特征图。

从上述示例可以看出,池化操作可以有效地减少数据的维度,从而降低模型的复杂度,减少过拟合的风险。

全连接层

全连接层是CNN中的最后一层,它将卷积层和池化层得到的特征图展开成一维向量,并通过全连接操作来实现分类或回归等任务。

具体来说,假设输入数据的大小为 H × W × D H×W×D H×W×D,则全连接操作的输入大小为 H × W × D H×W×D H×W×D,输出大小为 K K K,其中 K K K表示类别的个数。

下面我们通过一个具体的示例来说明全连接操作的原理。假设输入数据的大小为 2 × 2 × 1 2×2×1 2×2×1,则全连接操作的输入大小为 4 4 4,输出大小为 2 2 2

import numpy as np# 输入数据
input_data = np.array([[1, 2],[3, 0]
])# 全连接操作
def fully_connected(input_data, weight):output_data = np.dot(input_data.flatten(), weight)return output_data# 权重
weight = np.array([0.5, 0.8])# 执行全连接操作
output_data = fully_connected(input_data, weight)
print(output_data)

上述示例中,我们定义了一个 2 × 2 × 1 2×2×1 2×2×1的输入数据和权重为 0.5 0.5 0.5 0.8 0.8 0.8的全连接层,然后执行了全连接操作。最终得到了一个包含2个元素的输出。

从上述示例可以看出,全连接操作可以将卷积层和池化层得到的特征图转换成一维向量,并通过权重进行线性变换,从而实现分类或回归等任务。

综上所述,卷积神经网络(CNN)包括卷积层、池化层和全连接层等基本组成部分,通过卷积操作和池化操作来提取输入数据的特征信息,并通过全连接操作来实现分类或回归等任务。希望本篇博客可以帮助大家更好地理解CNN的基础知识。


http://www.ppmy.cn/devtools/94570.html

相关文章

golang for range time.Ticker 和 time.Timer时间通道使用示例 - 每隔指定时间执行一次,执行指定时长后退出执行

golang中的 ticker和timer时间通道除了可以使用for select case语句来执行外, 还可以使用 for range语句来执行ticker或者timer时间通道。 for range time.Ticker 和 time.Timer时间通道使用示例 下面的示例演示了time.Ticker 和 time.Timer的区别和使用演示。 Ti…

系统重装简记

写在文章开头 因为固态损毁而更换固态,所以需要进行系统重装,由于系统重装都是固定的繁琐的步骤,所以就以这篇文章来记录一下系统重装的一些日常步骤,希望对你有帮助。 Hi,我是 sharkChili ,是个不断在硬核…

PHP移动端商城分销全平台全端同步使用

📱【掌中购物新纪元:探索移动端购物商城系统的无限魅力】🛍️ 🚀 随时随地,购物自由新体验 在这个快节奏的时代,移动端购物商城系统彻底颠覆了传统购物方式,让消费者享受到了前所未有的便捷与…

企业通用报表平台代码审计

1 第三方组件漏洞审计 本项目是基于Maven构建的。对于Maven项目,我们首先从 pom.xml 文件开始审计引入的第三方组件是 否存在漏洞版本,然后进一步验证该组件是否存在漏洞点。 本项目引入的组件以及组件版本整理如下。 组件名称组件版本SpringBoot2.2.4.RELEASEFastjson1.2…

微服务熔断与降级

服务熔断: 熔断是在服务端进行配置。 一般是某个服务故障,或者异常引起的,类似现实世界中的保险丝,当某个异常条件被触发,直接熔断整个服务,而不是一直等到此服务超时。 服务降级: 降级是在客…

VGMShield:揭秘视频生成模型滥用的检测与追踪技术

人工智能咨询培训老师叶梓 转载标明出处 视频生成模型,如 Stable Video Diffusion 和 Videocrafter,已经能够生成合理且高分辨率的视频。但这些技术进步也带来了被恶意利用的风险,比如用于制造假新闻或进行政治宣传。因此,来自弗…

【数据结构详解】——计数排序(动图详解)

目录 🕒 1. 计数排序 🕒 1. 计数排序 💡 算法思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用,操作步骤: 统计相同元素出现次数根据统计的结果将序列回收到原来的序列中 void Coun…

Qt 小功能:加载等待动画——转圈圈

加载等待动画实现——转圈圈 效果图:(看封面最好) 关键要点 流畅的动画: 使用 QTimer 每 50 毫秒更新一次动画,确保动画流畅。 视觉效果: 使用 QPainter 的平滑像素转换和抗锯齿选项,提高动画…