机器学习11:逻辑回归-Logistic Regression

news/2025/3/14 16:39:54/

目录

1.计算概率

2.损失和正则化

2.1 逻辑回归的损失函数

2.2 逻辑回归中的正则化

3.参考文献


1.计算概率

许多问题需要概率估计作为输出。逻辑回归是一种极其有效的概率计算机制。实际上,我们可以通过以下两种方式使用返回的概率:

  • 原始概率:不经转换的原始计算结果
  • 二元类别:将原始计算结果转换为二元类别

那么,如何 “按原样” 使用概率?假设我们创建一个 逻辑回归(Logistic Regression模型来预测狗在半夜吠叫的概率。我们称这个概率为:

p(bark | night)

如果逻辑回归模型预测 p(bark | night) = 0.05,那么在一年多的时间里,狗的主人应该被惊醒大约 18 次:

startled = p(bark | night) * nights = 0.05 * 365 = 18

在许多情况下,我们倾向于将逻辑回归输出映射到二元分类问题的解决方案中,其中的目标是正确预测两个可能的标签之一(例如 “垃圾邮件” 或 “非垃圾邮件”)。那么,逻辑回归模型如何确保输出始终落在 0 和 1 之间呢?这就需要特殊的函数来辅助了,如下的 sigmoid 函数会产生具有相同特征的输出:

y = \frac{1}{1 + e^{-z}}

sigmoid 函数产生以下图:

图 1:S 型函数

如果 z 表示用逻辑回归训练的模型的线性层的输出,然后 sigmoid(z) 将产生一个介于 0 和 1 之间的值(概率)。用数学术语来说:

y' = \frac{1}{1 + e^{-z}}

其中,

  • y' 是特定示例的逻辑回归模型的输出。
  • z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N
    •  w 值是模型的学习权重,并且 b 是偏差。
    • x 值是特定示例的特征值。

注意:z 也称为对数概率,因为 sigmoid 的倒数表明,z 可以定义为概率的对数:

z = \log\left(\frac{y}{1-y}\right)

这是带有 ML 标签的 sigmoid 函数:

图 2:逻辑回归输出

 

2.损失和正则化

2.1 逻辑回归的损失函数

线性回归的损失函数是平方损失。逻辑回归的损失函数是对数损失:Log Loss,其定义如下:

\text{Log Loss} = \sum_{(x,y)\in D} -y\log(y') - (1 - y)\log(1 - y')

上述公式中,

  • (x,y)\in D 是包含许多标记示例的数据集,这些示例是 (x,y) 对。
  • y 是带标签示例中的标签。由于这是逻辑回归,因此每个 y 值必须为 0 或 1。
  • y' 是预测值(介于 0 和 1 之间),给定特征集 x

2.2 逻辑回归中的正则化

正则化 在逻辑回归建模中极其重要。如果没有正则化,逻辑回归的渐近性质会将高维损失推向 0。因此,大多数逻辑回归模型使用以下两种策略之一来降低模型复杂性:

  • L_{2} 正则化。
  • 提前停止,即限制训练步骤数或学习率。

在后面的文章中,笔者将介绍第三种策略——L_{1} 正则化 。想象一下,为每个示例分配一个唯一的 id,并将每个 id 映射到其自己的特征。如果不指定正则化函数,模型将完全过拟合。这是因为该模型会尝试将所有示例的损失推至零,但永远无法实现这一目标,从而将每个指标特征的权重推向+无穷大或-无穷大。这种情况可能发生在具有特征交叉的高维数据中,当存在大量罕见交叉且每个交叉仅发生在一个示例上时。幸运的是,使用 L_{2} 或提前停止训练可以避免这个问题。

概括

  • 逻辑回归模型生成概率。
  • 对数损失是逻辑回归的损失函数。
  • 逻辑回归被许多从业者广泛使用。

3.参考文献

链接-https://developers.google.cn/machine-learning/crash-course/logistic-regression/model-training


http://www.ppmy.cn/news/636071.html

相关文章

CVE-2023-34541 LangChain 任意命令执行

漏洞简介 LangChain是一个用于开发由语言模型驱动的应用程序的框架。 在LangChain受影响版本中,由于load_prompt函数加载提示文件时未对加载内容进行安全过滤,攻击者可通过构造包含恶意命令的提示文件,诱导用户加载该文件,即可造成…

F1电竞全球锦标赛首度落地中国

来源:证券时报网 作者:陈文斌 上海市政府新闻办公室官方微博消息,久事体育集团旗下的久事智慧体育和F1管理公司今天共同宣布,F1电竞全球锦标赛于今年首度落地中国。F1希望通过创新吸引并拉近更多的粉丝,在中国能更好…

RNG战队LPL春季赛夺冠 中国电竞产业未来如何实现“破与立”?

易观分析:《数字经济全景白皮书》浓缩了易观分析对于数字经济各行业经验和数据的积累,并结合数字时代企业的实际业务和未来面临的挑战,以及数字技术的创新突破等因素,最终从数字经济发展大势以及各领域案例入手,帮助企…

“腾讯电竞”向前,“腾讯游戏”向后

文丨陈选滨 来源 | 螳螂财经 “在这属于中国电竞的最好时刻,腾讯电竞希望携手行业伙伴,抓住时代赋予的机遇,共创中国电竞的黄金时代!” 上个月6月20日,主题为“竞在此刻”的2019全球电竞运动领袖峰会暨腾讯电竞年度…

【你离硅谷只差一步】网易中国创业家大赛项目火热征集中

近日,由网易云和网易联合创新中心发起的第二届网易中国创业家大赛在北上广深、杭州、长春等全国15个城市启动招募,各地将自8月起,陆续开展分赛,角逐全国20强,并进入11月份的全国总决赛。 据了解,网易中国创…

常见的短视频平台

短视频平台(以及自媒体常见平台): 企业QQ账号:https://admin.qidian.qq.com 抖音:https://www.douyin.com/ (手机账号就登录) 快手:https://www.kuaishou.com/ (手机账…

电商巨头纷纷涉水电竞,撬动游戏产业恐为时尚远

历经低迷期后,游戏行业等来了春暖花开。 数据显示,2017年中国游戏产业在整体收入的增长上开始回暖,实际销售收入达到2036.1亿元,同比增长23%。 电竞市场表现十分亮眼,去年中国电竞市场实际销售收入达到730.5亿元&#…

2019网易游戏开发者峰会正式开启报名

2019网易游戏开发者峰会N.Game将于1月20日在广州富力君悦大酒店举办,本次峰会聚焦于“趋势、融合、创意”的行业热门话题,汇聚业内众多知名专家,从游戏设计与运营、技术创新、风格设定等方面进行多维度的交流。网易游戏期望携手业内优秀的游戏…