对于L1正则化和L2正则化的理解

news/2024/12/28 17:46:32/

在DL中,L1和L2正则化经常被使用到,因为大于1L的正则化都是凸优化的问题,是个简单问题,可以被解决。

首先说正则的意义:

一切可以缓解过拟合的方法,都可以被叫做正则化

我最开始理解正则化的时候就是看lhy老师所理解的:防止模型w过大,导致过拟合,为什么?

因为w过大,之后测试或者验证的时候,你如果引入了噪声,噪声也会被放大,我们不要那么敏感,引入了正则项,也就是w的欧式距离(L2)或者曼距离(l1)。这样就考虑loss函数的时候,你也必须看距离也要小。

现在看来,为什么后面加入的是lambad/2 *l2的范数

要让w在一个可行域的范围之类,b只是平移的结果,所以不考虑

这样就可以限制距离范围

这里就是在约束w的距离,不要太大

而这里,求函数的极值,引入了拉格朗日乘数法来求解,lambad就是拉格朗日乘数法的系数。

这样一切都好解释,绿色代表距离,红色代表以前loss的线

但是和我们加入的正则项不同,因为这里只是多了个常数项,超参数只有c,我们可以更简单的理解为我们求导求极值,其实w是相同的!

 

因为我们加的就是没有常数项,相当于很多个圆,很多个交点?不对,我们超参数就变成了lambad,这张图告诉我们左图L2正则化带来的是w的衰退,而右图就是L1带来的不仅是衰退,还有稀疏性,因为调整lambad甚至可以让一个feauture不起作用,不用考虑!

L1调整lambad可以简化问题,可以带来稀疏性

 不用担心这样做,会以为本来的w很大,结果故意限制了w的大小,带来的偏差,因为本来就可以等价,因为很多w和b的值都能够成为最值,我们要做的 限制他的大小罢了

带来的偏差只是图中的d罢了,而不是到中心的距离!

这是目前我对l1,l2的理解

参考lm wmt lhy老师


http://www.ppmy.cn/news/1143742.html

相关文章

java基础 日期工具类

目录结构: DateUtils.java package dateStudy; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date;public class DateUtils {private static final String FORMAT_1"yyyy-MM-dd HH:mm:ss";//私有方法&#xf…

设计模式 - 行为型模式:策略模式(概述 | 案例实现 | 优缺点 | 使用场景)

目录 一、行为型模式 1.1、策略模式 1.1.1、概论 1.1.2、案例实现 1.1.3、优缺点 1.1.4、使用场景 一、行为型模式 1.1、策略模式 1.1.1、概论 策略模式设计的每一个算法都封装了起来,使他们可以相互替换,通过一个对象委派不同的算法给相应的客户…

CocosCreator 面试题(三)JavaScript闭包原理和作用

1、JavaScript闭包是什么? JavaScript闭包是指在函数内部创建的函数,它可以访问并持有创建它的父函数作用域中的变量,即使父函数已经执行完毕。闭包是JavaScript中强大而有用的概念,它可以用于创建私有变量、实现模块化和封装性&a…

某果的一个小参数分析

分析链接:aHR0cHM6Ly9hcHBsZWlkLmFwcGxlLmNvbS9hY2NvdW50 分析目标:X-Apple-I-Fd-Client-Info 1.在浏览器搜索关键词,打下断点 我们再里面进行搜索,定位到这个位置,可以看到X-Apple-I-FD-Client-Info这个参数等于e,…

FreeRTOS自我救赎2之基本工程建立

System Core 1.System Core >SYS 2.System Core >RCC 3.System Core >NVIC Middleware Middleware >FREERTOS Clock configuration Project Manager 在编译生成的代码前需要找一个与芯片对应的启动文件,启动文件添加进来,编译就没问题了

Sql和NoSql

Sql和NoSql SQL使用:如果有大量的更新操作,一定要使用事务,效率高。大数据情况下,要对表字段建索引。比nosql好的地方:有事务,能回滚。 SQL遇到的瓶颈:水平扩展 场景:不同设备&am…

LVGL8.3.6 Flex(弹性布局)

使用lv_obj_set_flex_flow(obj, flex_flow)函数 横向拖动 LV_FLEX_FLOW_ROW 将子元素排成一排而不包裹 LV_FLEX_FLOW_ROW_WRAP 将孩子排成一排并包裹起来 LV_FLEX_FLOW_ROW_REVERSE 将子元素排成一行而不换行,但顺序相反 LV_FLEX_FLOW_ROW_WRAP_REVERSE 将子元素…

修炼k8s+flink+hdfs+dlink(三:安装dlink)

一:mysql初始化。 mysql -uroot -p123456 create database dinky; grant all privileges on dinky.* to dinky% identified by dinky with grant option; flush privileges;二:上传dinky。 上传至目录/opt/app/dlink tar -zxvf dlink-release-0.7.4.t…