【machine learning-15-如何判定梯度下降是否在收敛】

devtools/2024/9/23 6:08:49/

我们在运行梯度下降的时候,如何判定梯度下降是否在收敛呢?
梯度下降的时候,权重和偏置根据如下的公式同时更新:
在这里插入图片描述
程序要做的就是更新w 和 b,让梯度下降尽快的收敛,但是如何判定正在收敛呢?

方法一:绘制损失函数的曲线

这个是最通常的做法,绘制损失函数的曲线:
注意此时横轴不再是w权重,而是迭代次数,这个迭代是指w和b同时更新为一个迭代。
在这里插入图片描述
这个曲线的每一个点就表示,执行横轴的迭代次数后,损失是纵轴的数值。
真正梯度收敛的曲线应该就是上图这样的。损失成下降趋势,到某一个阈值的时候,损失几乎不再变化,像是一条直线,比如上图示例中300到400迭代。
另外需要注意的是,具体需要迭代多少次才能达到收敛,这个是不确定的,需要看具体的应用。

方法二:自动收敛测试

这种方法是先指定一个阈值,比如0.001,当损失到达这个值,我们就认为此时收敛了。但是通常情况下这个值很难确定。


http://www.ppmy.cn/devtools/115850.html

相关文章

Go小专栏 第一期

Go的前世今生 如标题所述,这篇文章主要是来聊聊Go的历史,现状以及未来,或者也可称为Go的发展脉络。我认为任何事物存在皆有原因,技术也不例外。这篇文章主要探讨Go为什么会出现,Go的特点。 Go为什么会出现&#xff1…

Android-UI设计

控件 控件是用户与应用交互的元素。常见的控件包括: 按钮 (Button):用于执行动作。文本框 (EditText):让用户输入文本。复选框 (CheckBox):允许用户选择或取消选择某个选项。单选按钮 (RadioButton):用于在多个选项中…

Maven国内镜像(四种)

配置Maven使用国内镜像是一个常见的做法&#xff0c;因为这样可以显著提高依赖下载的速度并避免网络不稳定带来的问题 在 settings.xml 文件中&#xff0c;需要添加或修改 <mirrors> 标签来指定国内镜像。 以下是几个可用的镜像 1. 阿里云 <mirrors> <mi…

prompt攻击与防范

Prompt攻击是指通过精心设计的输入提示来操纵AI模型&#xff0c;使其产生不准确或有害的输出。这些攻击可能包括提示词注入、提示词泄露和提示词越狱等。攻击者可能会尝试通过提供包含恶意内容的输入&#xff0c;来操纵语言模型的输出&#xff0c;或者从模型的响应中提取敏感或…

美食共享圈:Spring Boot校园周边美食平台

第二章 系统分析 2.1 可行性分析 可行性分析的目的是确定一个系统是否有必要开发、确定系统是否能以最小的代价实现。其工作主要有三个方面&#xff0c;分别是技术、经济和社会三方面的可行性。我会从这三个方面对网上校园周边美食探索及分享平台进行详细的分析。 2.1.1技术可行…

html 几行的空间分成3个区域

1.代码 <!DOCTYPE html> <html lang"en"> <head> <meta charset"UTF-8"> <meta name"viewport" content"widthdevice-width, initial-scale1.0"> <title>三个区域示例</title> …

LeetcodeLCR 116. 省份数量

文章目录 题目原题链接思路C代码 题目 原题链接 LCR 116. 省份数量 思路 利用并查集的思想&#xff0c;将连接的诚实放在一个集合当中&#xff0c;最后遍历并查集数组判断有几颗树 初始化一个并查集&#xff1b;将连通的城市合并&#xff1b;统计并查集中树的个数&#xff1b…

面试金典题8

编写一种算法&#xff0c;若M N矩阵中某个元素为0&#xff0c;则将其所在的行与列清零。 示例 1&#xff1a; 输入&#xff1a; [[1,1,1],[1,0,1],[1,1,1] ] 输出&#xff1a; [[1,0,1],[0,0,0],[1,0,1] ]示例 2&#xff1a; 输入&#xff1a; [[0,1,2,0],[3,4,5,2],[1,3,1…