【machine learning-十-梯度下降-学习率】

devtools/2024/9/24 3:05:43/

学习率

  • 学习率
    • 不同的学习率

在梯度下降算法中,学习率的选择很重要,不恰当的选择,甚至可能导致损失发散,而非收敛,下面就看一下学习率的影响。

学习率

学习率是下图中的红框圈出来的部分,
在这里插入图片描述
学习率是模型的超参数,输入模型用来更新权重,那么它的大小意味着什么呢?

不同的学习率

小的学习率,意味着公式中学习率和偏导数的乘积值变得很小,那梯度下降就会很慢,收敛的时间就会很长。
大的学习率,导致公式中学习率和偏导数的乘积值变化很大,虽然某一步可能损失变化很大,但很可能会错过局部极小值,导致一直在极值附近打转,损失不仅不会收敛反而会导致发散的结果,就像下图中下面那个图片显示的一样。
92f5e378b9bf.png)
虽然学习率固定,但是当合适的学习率,导数项会有变化,就以上图中导数刚开始的变化很大,到局部最小值的时候,导数为0


http://www.ppmy.cn/devtools/116291.html

相关文章

计算机毕业论文题目:设计与实现一个校园通知信息系统

设计与实现一个校园通知信息系统是一个涉及多个方面的复杂项目,它旨在提高信息传递的效率和准确性,确保学生、教师以及学校管理人员能够及时获取到重要的通知信息。以下是关于如何设计并实现这样一个系统的详细说明: 1. 需求分析 用户…

react hooks--useContext

概述 ◼ 在之前的开发中,我们要在组件中使用共享的Context有两种方式:  类组件可以通过 类名.contextType MyContext方式,在类中获取context; 多个Context或者在函数式组件中通过 MyContext.Consumer 方式共享context&…

Vue 自定义指令实战

引言 Vue自定义指令是Vue.js框架中强大而灵活的功能之一,它允许开发者根据具体需求创建自定义的指令,以实现更加精细化的交互和数据绑定效果。本文将带你深入探索Vue自定义指令的使用方法、原理和实战,为你打开前端开发的新视野。 我们前面…

全国职业院校技能大赛(大数据赛项)-平台搭建Spark、Scala笔记

Spark作为一个开源的分布式计算框架拥有高效的数据处理能力、丰富的生态系统、多语言支持以及广泛的行业应用。Scala是一种静态类型的编程语言,它结合了面向对象编程和函数式编程的特性,被誉为通用的“大数据语言”。而二者的结合更能迸发出新奇的化学反…

【运维】微软官方包管理器winget的使用, 对比scoop/choco(含常用软件清单,本地镜像源自建,静默安装教程)

【运维】微软官方包管理器winget的使用, 对比scoop/choco(含常用软件清单,本地镜像源自建,静默安装教程) 文章目录 一、winget安装使用1、winget介绍(对比scoop,choco)2、winget安装(win11自带,…

使用Docker Compose一键部署

文章目录 使用Docker Compose一键部署一、引言二、环境准备1、安装Docker和Docker Compose1.1、安装Docker1.2、安装Docker Compose 2、验证安装 三、编写Docker Compose文件1、创建目录结构2、编写Dockerfile3、编写docker-compose.yml 四、部署项目1、构建镜像2、启动服务3、…

2016年国赛高教杯数学建模D题风电场运行状况分析及优化解题全过程文档及程序

2016年国赛高教杯数学建模 D题风电场运行状况分析及优化 风能是一种最具活力的可再生能源,风力发电是风能最主要的应用形式。我国某风电场已先后进行了一、二期建设,现有风机124台,总装机容量约20万千瓦。请建立数学模型,解决以下…

使用HTML和CSS制作网页的全面指南

目录 引言 一、理解HTML 1. 什么是HTML? 2. HTML文档的基本结构 3. 常用的HTML标签 4. 示例:创建一个简单的HTML页面 二、理解CSS 1. 什么是CSS? 2. CSS的使用方式 3. CSS选择器和属性 4. 常用的CSS属性 三、创建网页的步骤 1. 规…