Datawhale X 李宏毅苹果书 AI夏令营_深度学习基础学习心得Task2

news/2024/9/15 12:07:40/ 标签: 人工智能, 深度学习

本次学习主要针对自适应学习率;介绍了Adagrad,RMSprop和Adam优化器

1、为什么需要自适应学习率:

训练一个网络,在走到临界点的时候损失不再下降,而梯度并没有变得很小。相当于下坡路在两步之间,而步子迈大了,直接把下坡路跳过了,又走到上坡路上了。在这时候就需要把学习率(步幅)调低一点让梯度继续下降。

但是常规的 学习率下降方法是不够用的,我们希望在梯度大的时候走慢点,在梯度小的时候走快点,所以需要引入自适应学习率

2、Adagrad

Adagrad就可以做到上述的功能。更新公式:

其中η/σ这一项是不断更新的学习率,σ又随着迭代不断更新,新的σ来自之前每次迭代的梯度。根据公式可以看到梯度g小了,σ就小了,η/σ就大了,反之亦然。

3、RMSprop

公式:

可以看到每一阶段的σ都来自于继承于前一阶段,所以这种算法也是包含了过往所有的梯度信息,与Adagrad不同的是α是一个可以调整的超参数,可以根据需要来调整当前梯度的重要程度,如果设置α比较小,则代表比较侧重于当前梯度,在梯度下降大的时候可以很快的刹车。

4、Adam

Adam 可以看作 RMSprop 加上动量,其使用动量作为参数更新方向,并且能够自适应调整学习率。

5、学习率退火、预热

在训练后期遇到了梯度很小,而距离很近的情况时,积累的σ会变得很小,步伐会变得很大,导致往其他方向走,虽然能够修正回来,但是我们希望避免这种情况

因此引入学习率退火,即实时调整η大小,让η随着迭代不断变小,步伐也可以不断变小。

预热的方法是让学习率先变大后变小

##########################

本次学习了不同优化器调整学习率的策略,在我做课题的时候一般都是用Adam,问了别人也都说时Adam最好用,通过本次学习深入了解了它为什么好。通过查询资料了解到RMSprop更适合CNN网络,因为RMSprop 的平滑效果有助于加快收敛速度,以及RNN,因为这些模型的梯度更新具有较强的波动性;Adagrad更适合例如文本分类、自然语言处理(NLP)中的词嵌入训练等场景,因为不同的词汇或特征可能出现的频率差异很大。


http://www.ppmy.cn/news/1519434.html

相关文章

加载SQLite扩展的db.loadExtension方法

在Node.js环境中,sqlite3库为开发者提供了一个与SQLite数据库进行交互的简洁API。除了基本的数据库操作外,sqlite3还支持加载SQLite扩展,这些扩展可以提供额外的功能,如全文搜索、地理空间支持等。db.loadExtension方法就是用来加…

JavaScript 在 VSCode 中的开发体验

JavaScript 在 VSCode 中的开发体验 JavaScript 是一种广泛使用的编程语言,它让网页变得生动有趣。而 VSCode(Visual Studio Code)则是一款非常流行的代码编辑器,以其强大的功能和灵活性著称。在这篇文章中,我们将探讨在 VSCode 中使用 JavaScript 进行开发的体验,包括其…

Ubuntu 安装个人热点

1. 安装必要的软件 首先,我们需要确保有一些工具已经装好,这些工具会帮助我们创建 Wi-Fi 热点。打开终端,输入以下命令来安装这些工具: sudo apt-get install git hostapd iptables dnsmasq 2. 下载并安装 create_ap 我们接下来…

JavaScript 中的数组与对象

在 JavaScript 编程的浩瀚世界中,数组和对象作为核心的数据结构,扮演着至关重要的角色。它们不仅为数据的存储和操作提供了强大的工具,还在各种应用场景中展现出独特的魅力。 一、数组:有序的数据集合 数组是一组有序的数据集合…

51单片机——模块化编程

1、模块化编程介绍 传统方式编程:所有的函数均放在main.c里,若使用的模块比较多,则一个文件内会有很多的代码,不利于代码的组织和管理,而且很影响编程者的思路。 模块化编程:把各个模块的代码放在不同的.…

Leetcode 3272. Find the Count of Good Integers

Leetcode 3272. Find the Count of Good Integers 1. 解题思路2. 代码实现 题目链接:3272. Find the Count of Good Integers 1. 解题思路 这一题我思路上是比较暴力的,就是典型地分步骤执行: 找出所有的可能构成回文的长度为n的字符组合…

.NetCore发布到IIS

一:安装sdk(下载 .NET 8.0 SDK (v8.0.302) - Windows x64 Installer) 与donet Runtime(.NET Downloads (Linux, macOS, and Windows))选择对应的版本下载 二:解决问题:HTTP 错误 500.19 - Internal Server Error 无法访问请求的页面&#x…

快速回顾-CSS

<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>CSS66</title><style>/* 选择器 *//* h4…

云计算第二阶段---DBA Day8-Day9

DBA Day8 该阶段的2天内容,都会和数据库中间件,集群配置有关. 什么是中间件&#xff1f; 通俗来说&#xff0c;就是在正式文件内容从客户端发送或获取请求时&#xff0c;在传播过程中地点中间商&#xff0c;负责管理请求&#xff0c;并对其进行分类。 环境准备: 准备…

计算机网络概述(协议层次与服务模型)

目录 1.协议层次 2.服务模型 1.协议层次 层次化方式实现复杂网络功能&#xff1a; 将网络复杂的功能分成明确的层次&#xff0c;每一层实现了其中一个或一组功能&#xff0c;功能中有其上层可以使用的功能&#xff1a;服务本层协议实体相互交互执行本层的协议动作&#xff0…

Force Yc 第九引导公告页HTML源码

源码介绍 Force Yc 第九引导公告页HTML源码 此源码可以播放自己的音乐 - 视频 背景修改:dist\images 名字:bg.jpg 源码由HTMLCSSJS组成&#xff0c;记事本打开源码文件可以进行内容文字之类的修改&#xff0c;双击html文件可以本地运行效果&#xff0c;也可以上传到服务器里面…

数智化粮仓综合监控管理系统设计方案WORD-2023

关注智慧方案文库&#xff0c;学习9000多份智慧城市智慧医院&#xff0c;智慧水利&#xff0c;智能制造&#xff0c;数字化转型&#xff0c;智慧工厂&#xff0c;智慧矿山&#xff0c;智慧交通&#xff0c;智慧粮仓&#xff0c;工业互联网&#xff0c;数字孪生......持续更新热…

【AI】自动驾驶的分级

国际汽车工程学会&#xff08;SAE&#xff09;自动驾驶标准将汽车驾驶技术分为从L0&#xff08;无驾驶自动化&#xff09;至L5&#xff08;完全驾驶自动化&#xff09;的6个级别&#xff0c;通常称L3及以上级别的自动驾驶为高级别自动驾驶&#xff0c;车辆驾驶任务的主导权由驾…

GPT-SoVITS-WebUI 初体验

一、安装 conda create -n GPTSoVits python3.9 # …

心法利器[117] | 算法技术设计思考:迭代的思维方式

心法利器 本栏目主要和大家一起讨论近期自己学习的心得和体会。具体介绍&#xff1a;仓颉专项&#xff1a;飞机大炮我都会&#xff0c;利器心法我还有。 2023年新的文章合集已经发布&#xff0c;获取方式看这里&#xff1a;又添十万字-CS的陋室2023年文章合集来袭&#xff0c;更…

【Qt】项目打包发布

Relsease&#xff1a;发布版本&#xff0c;编译时对应用程序的速度进行了优化&#xff0c;运行时比Debug速度快很多&#xff0c;对用户友好。 Debug&#xff1a;调试版本&#xff0c;包含调试信息&#xff0c;比较冗余&#xff0c;编译速度比较慢&#xff0c;一般用于编写代码时…

智菜谱推|基于SprinBoot+vue的智能菜谱推荐系统(源码+数据库+文档)

智能菜谱推荐系统 基于SprinBootvue的智能菜谱推荐系统 一、前言 二、系统设计 三、系统功能设计 系统功能实现 管理员功能模块实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博主介绍&#xff1a;✌️大厂…

日常刷题(24)

1. 拼接最大数 1.1. 题目描述 给你两个整数数组 nums1 和 nums2&#xff0c;它们的长度分别为 m 和 n。数组 nums1 和 nums2 分别代表两个数各位上的数字。同时你也会得到一个整数 k。 请你利用这两个数组中的数字中创建一个长度为 k < m n 的最大数&#xff0c;在这个必…

sqlite3的db.serialize方法:确保数据库操作串行化的利器

在Node.js中&#xff0c;sqlite3是一个广受欢迎的轻量级数据库库&#xff0c;它提供了一个简洁的API来与SQLite数据库进行交互。在进行数据库操作时&#xff0c;为了确保操作的串行化执行&#xff0c;避免并发问题&#xff0c;sqlite3提供了db.serialize方法。本文将深入解析db…

springboot中分页插件的使用

安装依赖 这里有个版本的报错&#xff0c;循环依赖的问题&#xff0c;大家可以去具体查下&#xff0c;我这是sp3,所以要选择高点的版本&#xff0c;否则启动会报错 <!--mybatis起步依赖--><dependency><groupId>org.mybatis.spring.boot</groupId>&l…