Regularization in ML：简述机器学习中的正则化

news/2024/9/22 22:32:01/

一. 在机器学习（ML）中，正则化是什么？

• 正则化是一种解决机器学习中过拟合问题的方法。
• 过拟合的模型无法对测试数据做出良好的泛化估计。
• 当潜在的学习模型具有低偏差/高方差特征，或者当我们只有少量的数据时，所估计的模型容易发生过拟合。
• 正则化可以减少模型的方差。

在这里插入图片描述

二. 正则化的类型：

1. 修改损失函数：

• L2 正则化：防止权重变得过大（由 L2 范数定义）。权重越大，模型越复杂，过拟合的可能性越高。

$error(y,\hat{y}) + \lambda\sum_{j}^{}\beta_j^2 \quad \text{where } \lambda \geq 0, \; \lambda \propto model\_bias, \; \lambda \propto \frac{1}{model\_variance}$

• L1 正则化：防止权重变得过大（由 L1 范数定义）。权重越大，模型越复杂，过拟合的可能性越高。L1 正则化引入了权重的稀疏性。它迫使更多的权重变为零，而不是简单地减小所有权重的平均大小。

$error(y,\hat{y}) + \lambda\sum_{j}^{}|\beta_j| \quad \text{where } \lambda \geq 0, \; \lambda \propto model\_bias, \; \lambda \propto \frac{1}{model\_variance}$

• 熵：用于输出概率的模型。迫使概率分布趋向于均匀分布。

$error(p,\hat{p}) - \lambda\sum_{i}^{n}\hat{p}_ilog(\hat{p}_i) \quad \text{where } \lambda \geq 0, \; \lambda \propto model\_bias, \; \lambda \propto \frac{1}{model\_variance}$