【22-23春】AI作业10-经典卷积网络

news/2024/11/29 8:37:55/

1.LeNet & MNIST

LeNet是一种神经网络的模型,用于图像识别和分类。他包含 3 个卷积层,2 个池化层,1 个全连接层。其中所有卷积层的所有卷积核都为 5x5,步长 strid=1,池化方法都为全局 pooling,激活函数为 Sigmoid。

MNIST是一个手写数字识别数据集,包含60000张训练图片和10000张测试图片。图片是单通道灰度图像。MNIST被广泛用于训练和测试机器学习模型的性能。

2. AlexNet & CIFAR

AlexNet是一种深度卷积神经网络的模型,用于图像识别和分类。他包含 8 层,第 1、2、5 层由卷积层和最大池化层构成,其中最大池化层可以降低特征图尺寸和减少网络参数量。第 3 和第 4 层是卷积层,第 6、7、8 层是全连接层,全连接层最后一层是 Softmax 层。AlexNet首次使用了Relu激活函数。
CIFAR是一个包含十个分类的彩色图像数据集,共包含60000张32*32的彩色图像(包含50000张训练图片,10000张测试图片),数据集是三通道的,分别是R,G,B3 个通道被广泛用于训练和测试机器学习模型的性能。

3.VGG Net

VGG Net是一种深度卷积神经网络的模型,用于图像识别和分类。该模型结构非常深,拥有多个卷积层和池化层。VGG Net是由LeNet、Alexnet发展而来的,VGGnet相比于Alex-net而言,具有更小的卷积核,都是3x3的,而Alex-net卷积核较大(11x11,7x7,5x5)。并且相比于AlexNet的3x3的池化核,VGG全部为2x2的池化核。其结构如下图所示:
在这里插入图片描述

4.GoogLeNet & Inception v1

GoogLeNet是一种深度卷积神经网络的模型,用于图像分类和识别。GoogleNet相比VGG,参数量减少了很多,性能表现的更为优越。
Inception v1是该模型的一个版本。它采用一种称为Inception模块的架构,可以在不增加模型参数的同时提高模型性能。

5.ResNet

ResNet是一种深度卷积神经网络的模型,用于图像分类和识别。它采用一种称为残差块的架构,可以避免深度模型训练时出现的梯度消失问题,有助于提高模型性能。


http://www.ppmy.cn/news/76480.html

相关文章

05 JDBC基础

什么是持久化 将内存中的数据永久保存在磁盘中,方便以后使用 JDBC是什么 java数据库连接 用于执行sql语句的java API java官方提供接口,各大厂商提供实现类,程序员使用实现类的jar包 JDBC的开发流程 添加包: mysql-connector-java-5.1.48.jar lombok.jar 口诀:贾连欲…

Windows操作系统的文件组织结构和计算方法

我是荔园微风,作为一名在IT界整整25年的老兵,今天总结一下Windows操作系统的文件组织结构和计算方法。 这是一块非常实用的知识,感谢大家来看这个帖子。 Windows组织结构就是文件的组织形式,其中: 1.Windows逻辑结构…

java+springboot留学生新闻资讯网的设计与实现

Spring框架是Java平台的一个开放源代码的Full-stack(全栈)应用程序框架,和控制翻转容器的实现。Spring框架的一些核心功能理论,可以用于所有Java应用,Spring还为Java EE构建的Web应用提供大量的扩展支持。Spring框架没有实现任何的编程模型&a…

基于脉冲神经网络的物体检测

访问【WRITE-BUG数字空间】_[内附完整源码和文档] 研究的意义在于探索脉冲神经网络在目标检测上的应用,目前主流的脉冲神经网络训练算法有直接BP训练、STDP无监督训练和训练好的ANN的转化,虽然训练算法众多,但是SNN仍然没有一套成熟的训练算…

Apache Pulsar部署搭建

1.部署规划 部署 Pulsar 集群包括以下步骤(按顺序): 1.部署一个 ZooKeeper 集群,初始化 Pulsar 集群元数据。2.部署一个 Bookeeper 集群。3.部署一个或多个 Pulsar brokers。4.部署 Pulsar manager(可选)。 2.节点规划 主机名…

AIGC技术研究与应用 ---- 下一代人工智能:新范式!新生产力!(1-简介)

文章大纲 AI GC简介决策式/分析式AI(Discriminant/Analytical AI)和生成式AI (Generative AI)参考文献与学习路径模型进化券商研报陆奇演讲AI GC 《我,机器人》中所演绎的一样,主角曾与机器人展开了激烈的辩论,面对“机器人能写出交响乐吗?”“机器人能把画布变成美丽…

(一)before initialization of D3D(初始化D3D之前你需要了解的D3D基础知识)

什么是D3D? D3D全称Direct X 3D,即一组API可以用来针对GPU编程,不过他最主要的作用是用来渲染(不过现在也有很多其他应用比如d3d11va[Direct X 3D 11 Video API]用来进行硬件加速解码) Tips:Direct X 3D主要用来渲染,既然我们说到可以针对GPU编程了,当然不只是渲染的工作可以…

亿发ERP系统,全链条采购协同管理数智化平台,中小企业采购业务全流程管理

在数字时代,中小型企业在采购管理方面面临多项挑战。 集采管理难:由于资源和专业知识有限,中小企业通常难以建立集中采购职能,无法有效简化整个组织的采购活动。这一挑战包括定义采购政策、标准化程序和实施高效的采购系统。 信…