机器学习和深度学习 -- 李宏毅(笔记与个人理解)Day 13

news/2025/3/14 22:47:29/

Day13 Error surface is rugged……

Tips for training :Adaptive Learning Rate

critical point is not the difficult

image-20240411203156248 image-20240411203302996

image-20240411203539343

image-20240411203702557 image-20240411205450104

Root mean Square --used in Adagrad

image-20240411205707534

这里为啥是前面的g的和而不是直接只除以当前呢?

这种方法的目的是防止学习率在训练过程中快速衰减。如果只用当前的梯度值来更新学习率,那么任何较大的梯度值都可能会导致很大的学习率变化,这可能会使得学习过程不稳定。通过使用所有过去梯度的平方的平均值,我们可以使学习率的变化更加平滑,因为这个值不会因为个别极端的梯度值而发生剧烈波动。

以及这个式子和之前讲的那个正则化是不是一样的呢?image-20240411205922799

啊!!!woc 我发现这两个是差不多的思想啊,你把上面那个正则化的东西用Gradient做出来
gi = 2xw+ ∑ \sum 2w…… 额……好吧完全不一样,但是我又不知道这个会不会对于我的……

废了,乱了;稳一稳哈

  1. 这里为什么不是让这个梯度直接等于0 呢?-- 或许是因为有的loss function 我们无法直接求出来梯度等于0 的w?哦哦 那我就知道了md 吓死,差点以为自己的machine Learning route ending了

image-20240411212536721

image-20240412182923450 image-20240412183150634

RMSProp

因为上一个方法只能解决 不同的 θ \theta θ 时候的学习率,但是由图我们可以知道有时候同一个参数我们也希望起有变化率的不同取值

image-20240412184406452

我怎么没看出来这种思想啊

image-20240412184542398

image-20240412184604578

image-20240412184818805 image-20240412184841137

image-20240412185016576

解决井喷问题

image-20240412185048990

在bert里面需要用到

image-20240412185417436

image-20240412185710165

SUmmary of OPtimization

image-20240412185829595

image-20240412185858252

下节预告:

image-20240412190008721


http://www.ppmy.cn/news/1424401.html

相关文章

前端请求404,后端保无此方法

1、微信小程序前端路径404 2、后端报无此路径 3、查看路径下对应的方法 发现忘了在list方法前加GetMapping(“/list”),加上即可

【python+Excel】读取和存储测试数据完成接口自动化测试

http_request2.py用于发起http请求 #读取多条测试用例 #1、导入requests模块 import requests #从 class_12_19.do_excel1导入read_data函数 from do_excel2 import read_data from do_excel2 import write_data from do_excel2 import count_case #定义http请求函数COOKIENon…

20.安全性测试与评估

每年都会涉及;可能会考大题;多记!!! 典型考点:sql注入、xss; 从2个方面记: 1、测试对象的功能、性能; 2、相关设备的工作原理; 如防火墙,要了解防…

【LeetCode热题100】【动态规划】乘积最大子数组

题目链接:152. 乘积最大子数组 - 力扣(LeetCode) 要找乘积最大的连续子数组,我们之前做过找和最大的连续子数组【LeetCode热题100】【普通数组】最大子数组和-CSDN博客 对于和来讲,定义dp[i]是以nums[i]为结尾的最大…

常见分类算法及其应用

常见分类算法及其应用 一、引言 在机器学习和数据挖掘领域,分类算法是非常重要的一类算法。它们被广泛应用于各种场景,如邮件过滤、金融欺诈检测、疾病预测等。本文将介绍几种常见的分类算法,包括逻辑回归、决策树、随机森林、支持向量机和…

Android 打包 65535是什么

在 Android 打包过程中提到的 “65535” 是指 Dex 文件中单个方法引用的上限,这通常被称为 “65K 方法限制”。在 Android 应用程序中,所有 Java/Kotlin 代码在编译后都会转换成 DEX (Dalvik Executable) 文件,这是一种特别为 Android 优化的…

[学习笔记] 网络安全 bp爆破

我们用的靶场是用的一个皮卡丘的漏洞练习平台的一个靶场首先要开启浏览器代理,然后开启在bp上开启就是拦截代理模块里面的拦截它有4个攻击模式,分别是: Sniper(狙击手):这种攻击方式主要是将包内各个用$$符…

apache Tomcat 入门介绍+windows 部署

Tomcat Apache Tomcat 软件是 Java Servlet、JavaServer Pages、Java Expression Language 和 Java WebSocket 技术的开源实现。 简洁 Apache Tomcat是一个开源的、免费的Servlet容器,由Apache软件基金会的Jakarta项目开发。它实现了对Servlet和JSP规范的支持&am…