Regularization in ML:简述机器学习中的正则化

news/2024/9/22 22:32:01/

一. 在机器学习(ML)中,正则化是什么?

• 正则化是一种解决机器学习中过拟合问题的方法。
• 过拟合的模型无法对测试数据做出良好的泛化估计。
• 当潜在的学习模型具有低偏差/高方差特征,或者当我们只有少量的数据时,所估计的模型容易发生过拟合。
• 正则化可以减少模型的方差。

在这里插入图片描述

二. 正则化的类型:

1. 修改损失函数:

• L2 正则化: 防止权重变得过大(由 L2 范数定义)。权重越大,模型越复杂,过拟合的可能性越高。

l o s s = e r r o r ( y , y ^ ) + λ ∑ j β j 2 where  λ ≥ 0 , λ ∝ m o d e l _ b i a s , λ ∝ 1 m o d e l _ v a r i a n c e loss = error(y,\hat{y}) + \lambda\sum_{j}^{}\beta_j^2 \quad \text{where } \lambda \geq 0, \; \lambda \propto model\_bias, \; \lambda \propto \frac{1}{model\_variance} loss=error(y,y^)+λjβj2where λ0,λmodel_bias,λmodel_variance1

• L1 正则化: 防止权重变得过大(由 L1 范数定义)。权重越大,模型越复杂,过拟合的可能性越高。L1 正则化引入了权重的稀疏性。它迫使更多的权重变为零,而不是简单地减小所有权重的平均大小。

l o s s = e r r o r ( y , y ^ ) + λ ∑ j ∣ β j ∣ where  λ ≥ 0 , λ ∝ m o d e l _ b i a s , λ ∝ 1 m o d e l _ v a r i a n c e loss = error(y,\hat{y}) + \lambda\sum_{j}^{}|\beta_j| \quad \text{where } \lambda \geq 0, \; \lambda \propto model\_bias, \; \lambda \propto \frac{1}{model\_variance} loss=error(y,y^)+λjβjwhere λ0,λmodel_bias,λmodel_variance1

• 熵: 用于输出概率的模型。迫使概率分布趋向于均匀分布。

l o s s = e r r o r ( p , p ^ ) − λ ∑ i n p ^ i l o g ( p ^ i ) where  λ ≥ 0 , λ ∝ m o d e l _ b i a s , λ ∝ 1 m o d e l _ v a r i a n c e loss = error(p,\hat{p}) - \lambda\sum_{i}^{n}\hat{p}_ilog(\hat{p}_i) \quad \text{where } \lambda \geq 0, \; \lambda \propto model\_bias, \; \lambda \propto \frac{1}{model\_variance} loss=error(p,p^)λinp^ilog(p^i)where λ0,λmodel_bias,λmodel_variance1

2. 修改数据采样:

• 数据增强: 通过随机裁剪、膨胀、旋转、添加少量噪声等方式从现有数据中创建更多数据。
• K-fold 交叉验证: 将数据分为 K 组。在 K-1 组上训练,在剩余的一组上进行测试。尝试所有 K 种可能的组合。

在这里插入图片描述

3. 改变训练方法:

• 注入噪声: 在学习权重时向其添加随机噪声。这促使模型对于权重的小幅变化相对不敏感,从而实现正则化。
• Dropout: 通常用于神经网络。根据一定的丢弃率随机丢弃连续层之间的连接,并在当前迭代中训练剩余的网络。在下一个迭代中,再随机丢弃另一组连接。
在这里插入图片描述

🚀 获取更多详细资料可点击链接进群领取,谢谢支持👇

点击免费领取更多资料


http://www.ppmy.cn/news/1508924.html

相关文章

AI秘境-墨小黑奇遇记 - 修炼成神经(二)

在解开了感知机和门电路的谜题后,墨小黑对人工智能的世界渐渐产生了浓厚的兴趣。他开始意识到,自己不仅是在学习一门复杂的技术,更是在探索一个充满未知与挑战的神秘领域。 入夜,墨小黑一脸无奈地盯着电脑屏幕,思考着自…

快速上手Spring Boot

快速上手Spring Boot (qq.com)

Spring Boot内嵌Tomcat处理请求的链接数和线程数

Spring Boot内嵌Tomcat处理请求的连接数和线程数 处理请求的连接数和线程数配置 Spring Boot的配置项 #等待连接数 server.tomcat.accept-count100 #最大链连接数 server.tomcat.max-connections8192#最小备用线程数 server.tomcat.threads.min-spare10 #最大工作线程数 ser…

lvs的相关应用2

lvs 安装lvs 配置规则,查看所有的规则,如果已经配置好规则,重启之后就没了 [rootds01 ~]# ipvsadm -Ln IP Virtual Server version 1.2.1 (size4096) Prot LocalAddress:Port Scheduler Flags -> RemoteAddress:Port Forwa…

LVS部分配置1

LVS nat服务器(作时间服务器) [rootlocalhost ~]# systemctl stop firewalld [rootlocalhost ~]# setenforce 0 [rootlocalhost ~]# yum -y install ntpdate [rootlocalhost ~]# ntpdate cn.ntp.org.cn [rootlocalhost ~]# which ntpdate [rootlocalhost…

平安城市行业无人机解决方案(网格化巡逻场景应用)

场景痛点: 缺少飞手,导致无人机应用频次偏低 无人机需要人工换电池、维护及存储 日常巡逻 | 无人机补盲巡逻 大疆航点飞行功能,重复性任务只飞一遍,后续重复调用 无人机航点规划,一次设置,后续重复调用…

Cmake编译工程

Cmake目录结构:项目主目录中会放一个CmakeList.txt的文本文档,后期使用cmake指令时候,依赖的就是该文档 1.包含源文件的子文件夹包含Cmakelist.txt文件时,主目录的Cmakelists.txtx要通过add_subdirector添加子目录 2.包含源文件…

8月13日学习笔记 LVS

一.描述以及工作原理 1. 什么是LVS linux virtural server的简称,也就是linxu虚拟机服务器,这是一个 由章文嵩博士发起的开源项目,官网是 http://www.linuxvirtualserver.org,现在lvs已经是linux内核标 准的一部分,使用lvs可以达…