学习率衰减、局部最优、Batch归一化、Softmax回归

news/2024/11/28 22:38:46/

目录

1.学习率衰减(Learning rate decay)

在训练初期,梯度下降的步伐大一点,开始收敛的时候,小一些的学习率能让步伐小一些。

1 epoch = 遍历一遍训练集

学习率衰减公式

:假设衰减率decayrate = 1,=0.2

epochNum

α

1

0.1

2

0.067

3

0.05

4

0.04

其它学习率衰减公式:α=0.(指数衰减)。。。等等

2. 局部最优(local optima)的问题

梯度下降的时候可能会困在一个局部最优中,而不会抵达全局最优。

3.Batch归一化(Batch Normalization)

我们知道,训练一个模型,比如logistic回归,归一化输入特征可加速学习过程。

对于更深一点的模型,也可以归一化隐藏层的输出,比如归一化(代入激活函数就是),以便更有效率地训练,

4.Softmax回归(Softmax regression)

不同于logistic回归,解决的是二分类问题,Softmax回归能解决多分类问题,即识别多种分类中的一个。

假设要区分3个类别(A,B,C),那么神经网络的输出层要有4个神经单元(分别输出"A,B,C,其它"这四类的识别概率)。

最后一层layer L的神经元执行操作如下:

是上一层的输出。

举例:

训练一个Softmax分类器:

正向传播:从输入层到输出层,依次计算并存储模型的参数。

反向传播:从输出层到输入层,依次计算参数的梯度,来更新参数。


http://www.ppmy.cn/news/19308.html

相关文章

基本UDP套接字编程

文章目录基本流程recvfrom和sendto函数试着用用基本流程 客户端 创建套接字socket()填充服务器网路信息结构体通信recvfrom()/sendto() 服务器 创建套接字填充服务器网路信息结构体将套接字与服务器网络信息结构体绑定bind()进行通信recvfrom()/sendto() recvfrom和sendto…

GROMACS 教程--水中的溶菌酶

GROMACS 教程–水中的溶菌酶 中文教程:http://jerkwin.github.io/ 英文教程:http://www.mdtutorials.com 此示例将指导新用户完成模拟系统的设置过程,该模拟系统在一盒水和离子中包含蛋白质(溶菌酶)。每个步骤都将包含…

java线程中断 interrupt

1. 线程的状态: new -> 创建完线程,但是还没有启动runnable -> 表示线程是活跃状态terminated -> 表示线程已经结束了线程在sleep的时候是什么状态?time-waited 2. stop 终止线程已经被淘汰 简单来说是因为:使用stop…

Redis持久化-RDB

Redis持久化-RDB 1.官方资料 在线文档 : https://redis.io/topics/persistence 2.Redis持久化方案 1.RDB(Redis DataBase) 2.AOF(Append Of File) 3.RDB是什么 在指定的时间间隔内将内存中的数据集快照写入磁盘&#xff0c…

在linux下安装docker

文章目录 目录 文章目录 前言 一、docker 二、使用步骤 1.环境准备 2.安装 三、配置阿里云镜像加速 四、卸载 总结 前言 一、docker 镜像(image): docker镜像就好比是一个模板,可以通过这个模板来创建容器服务,tomc…

【C++】类和对象(上)---什么是类?

目录1.面向过程和面向对象初步认识2.类的引入2.1使用struct定义类3.类的定义3.1类的两种定义方式:3.2成员变量命名规则的建议3.3成员函数与成员变量定义的位置建议4.类的访问限定符及封装4.1访问限定符4.2封装5.类的作用域6.类的实例化7.类对象模型7.1如何计算类对象…

打造Spring Boot应用时常用到的轮子

文章目录前言万能的SpringBoot应用包含哪些组件?主要技术点SpringBoot应用常用的开源组件Spring内置工具类一些完整的SpringBoot的开源项目开源博客和社区优秀CMS开源电商Java awesome前言 如何打造一款完备的、可复制的SpringBoot应用? 所谓完备,就是…

前端艺术之毛玻璃-倾斜-日历

前端艺术之毛玻璃-倾斜-日历描述项目效果index.htmlindex.css描述 项目描述开发语言HTML、JavaScript、CSS库dyCalendarJS、vanilla-tiltEdge108.0.1462.54 (正式版本) (64 位) 该项目中需要使用到的库有: dyCalendarJS vanilla-tilt.js 是 JavaScript 中的一个平…