深度学习(前馈神经网络)知识点总结

news/2024/10/25 5:25:27/

用于个人知识点回顾,非详细教程

1.梯度下降

  • 前向传播

特征输入—>线性函数—>激活函数—>输出

在这里插入图片描述

  • 反向传播

根据损失函数反向传播,计算梯度更新参数

在这里插入图片描述

在这里插入图片描述

2.激活函数(activate function)

  • 什么是激活函数?

在神经网络前向传播中,每一层的输出还需要经过激活函数再作为下一层的输入,即 a [ 1 ] = σ ( z [ 1 ] ) a^{[1]}=\sigma(z^{[1]}) a[1]=σ(z[1])

  • 为什么需要激活函数?

如果没有非线性激活函数,模型的最终输出实际上只是输入特征x的线性组合
在这里插入图片描述

  • 激活函数的分类

(1)sigmoid函数:除了输出层是一个二分类问题基本不会用
a = σ ( z ) = 1 1 + e − z a=\sigma(z)=\frac{1}{1+e^{-z}} a=σ(z)=1+ez1
(2)tanh函数:数据平均值更接近0,几乎所有场合都适用
a = t a n h ( z ) = e z − e − z e z + e − z a=tanh(z)=\frac{e^{z}-e^{-z}}{e^{z}+e^{-z}} a=tanh(z)=ez+ezezez

sigmoid函数和tanh函数两者共同的缺点是,在z特别大或者特别小的情况下,导数梯度或者函数斜率会变得特别小,最后就会接近于0,导致降低梯度下降的速度。

(3)Relu函数:修正线性单元,最常用的默认函数
a = m a x ( 0 , z ) a=max(0, z) a=max(0,z)
(4)Leaky Relu函数:进入负半区
a = m a x ( 0.01 z , z ) a=max(0.01z, z) a=max(0.01z,z)

sigmoid函数和tanh函数在正负饱和区的梯度都会等于0,而Relu和Leaky Relu可以避免梯度弥散现象,学习速度更快

在这里插入图片描述

3. 正则化

  • 偏差和方差

高方差过拟合,高偏差欠拟合

在这里插入图片描述

  • L1/L2正则化

在损失函数加上正则化,L1正则化更稀疏

在这里插入图片描述

  • dropout正则化

根据概率随机删除节点

在这里插入图片描述

  • 其它正则化方法

在这里插入图片描述

4.优化算法

  • mini-batch梯度下降法

数据集分成多个子集来更新梯度

在这里插入图片描述

  • 动量梯度下降(momentum)

参数更新时的梯度微分值计算方式采用指数加权平均

在这里插入图片描述
在这里插入图片描述

  • RMSprop(root mean square prop)

在这里插入图片描述

  • Adam

momentum+RMSprop

在这里插入图片描述


http://www.ppmy.cn/news/1076041.html

相关文章

xml中in的使用

目录 一、简介 二、使用 1、参数为list 2、参数为Array 3、参数为Map XML中大于、小于、不等于符号使用 一、简介 在xml中使用in查询需要使用foreach标签 <foreach item"item" collection"list" index"index" open"(" sep…

从传统到智能化:汽车内部通信的安全挑战与SecOC解决方案

01/需求背景 Demand background 在传统的汽车电子结构中&#xff0c;车内的电控单元&#xff08;ECU&#xff09;数量和复杂性受到限制&#xff0c;通信带宽也受到限制。因此&#xff0c;人们普遍认为车内各个ECU之间的通信是可靠的。只要ECU节点接收到相应的消息&#xff0c…

饮食保健杂志饮食保健杂志社饮食保健编辑部2023年第38期目录

论著 中青年人群非酒精性脂肪肝与颈动脉粥样硬化之间关系 徐晓萌1-4 阿司匹林与氯吡格雷对老年冠心病的治疗效果观察 张海峰5-8《饮食保健》投稿&#xff1a;yixuebj126.com 临床研究 骨折复位钢板固定联合自体骨泥植入治疗胫骨中下段骨折的研究 杨翼众 李东生 黄三明 刘禄林 曾…

Matlab(画图进阶)

目录 大纲 1.特殊的Plots 1.1 loglog(双对数刻度图) ​1.3 plotyy(创建具有两个y轴的图形) 1.4yyaxis(创建具有两个y轴的图) 1.5 bar 3D条形图(bar3) 1.6 pie(饼图) 3D饼图 1.7 polar 2.Stairs And Ste阶梯图 3.Boxplot 箱型图和Error Bar误差条形图 3.1 boxplot 3.2 …

go读取yaml,json,ini等配置文件

实际项目中&#xff0c;要读取一些json等配置文件。今天就来说一说&#xff0c;Golang 是如何读取YAML,JSON,INI等配置文件的。 一. go读取json配置文件 JSON 应该比较熟悉&#xff0c;它是一种轻量级的数据交换格式。层次结构简洁清晰 &#xff0c;易于阅读和编写&#xff0…

YOLO V5 和 YOLO V8 对比学习

参考文章&#xff1a; 1、YOLOv5 深度剖析 2、如何看待YOLOv8&#xff0c;YOLOv5作者开源新作&#xff0c;它来了&#xff01;? 3、anchor的简单理解 完整网络结构 YOLO v5和YOLO v8的Head部分 YOLO v8的Head 部分相比 YOLOv5 改动较大&#xff0c;换成了目前主流的解耦头结构…

iOS - 资源按需加载 - ODR

一、瘦身技术大图 二、On-Demand Resources 简介 将其保存管理在苹果的服务器&#xff0c;按需使用资源、优化包体积&#xff0c;实现更小的应用程序。ODR 的好处&#xff1a; 应用体积更小&#xff0c;下载更快&#xff0c;提升初次启动速度资源会在后台下载操作系统将会在磁…

学习使用Scrapy框架进行高效的爬取,了解其基本结构和使用方法

Scrapy是一个用Python编写的开源网络爬虫框架&#xff0c;它可以帮助开发者快速高效地从网页中提取数据。下面是使用Scrapy进行爬取的基本结构和使用方法的概述&#xff1a; 安装Scrapy&#xff1a;首先&#xff0c;确保你已经安装了Python和pip。然后可以通过运行以下命令来安…