机器学习基础-线性回归和逻辑回归

news/2025/1/8 2:57:29/

目录

基本概念和定义

线性回归

逻辑回归

线性回归中的最小二乘法和梯度下降法

最小二乘法

梯度下降法

参数调整策略

梯度下降类型

梯度下降的调参的基本操作

数据归一化方法

1. 最小-最大归一化(Min-Max Scaling)

2. 白化变换(Whitening Transformation)

过拟合和欠拟合的概念及处理方法

过拟合(Overfitting)

欠拟合(Underfitting)

激活函数SIGMOD表示及特点

线性回归逻辑回归的异同


基本概念和定义

线性回归

逻辑回归


线性回归中的最小二乘法和梯度下降法

两种常用的参数估计方法,都旨在找到最佳拟合数据的直线或超平面,但实现方式有所不同。以下是这两种方法的详细介绍:

最小二乘法

  • 目标最小化预测值与实际值之间的平方误差之和

梯度下降法

  • 目标:同样是为了最小化损失函数 L(β),但是梯度下降法采用的是迭代优化的方法。
  • 迭代地调整参数θ,从而使 L最小

参数调整策略

  • 步长(学习率):控制每次迭代中参数 θ 更新的幅度。
    • 步长太大:可能导致学习过程发散,无法收敛到最小值。
    • 步长太小:虽然可以收敛,但训练时间会很长。

梯度下降类型

  • 批量梯度下降每次调参,训练集的所有样本计算新参数
  • 随机梯度下降:每次调参,在训练集中随机选择一个样本来更新参数
  • 批量梯度下降:每次调参,都会对训练集中一小部分进行梯度下降计算更新参数

梯度下降的调参的基本操作

  • 当计算值>实际值时,下调相关参数
  • 当计算值<实际值时,上调相关参数

数据归一化方法

数据归一化(Normalization)是机器学习和数据分析中常见的预处理步骤,它通过对原始数据进行变换,使得不同特征具有相似的尺度,从而避免某些特征因量级差异过大而对模型训练产生不利影响。

1. 最小-最大归一化(Min-Max Scaling)

2. 白化变换(Whitening Transformation)

  • 它不仅标准化数据,还将不同特征之间的相关性去除,使得特征之间相互独立且具有单位方差。


过拟合和欠拟合的概念及处理方法

过拟合(Overfitting)

  • 概念:机器学习模型在训练数据上表现良好,但在测试数据或新的数据上表现较差。
  • 原因:模型过于复杂,导致模型在训练数据中学习到了数据的噪声和细节。
  • 处理方法:① 简化模型 ②正则化 ③早停法 ④数据增强 
    • 正则化
    • 工作原理:通过约束模型权重,即减小参数θ的值,来限制模型复杂度,使得每个特征都对输出的影响尽可能小
    • 方法:Lasso回归、岭回归

欠拟合(Underfitting)

  • 概念:模型既不能很好地拟合训练数据,也不能很好地预测新数据。
  • 原因:模型过于简单,未能捕捉到数据中的潜在模式。
  • 处理方法:① 增加模型复杂度 ②特征工程 ③训练更长时间

激活函数SIGMOD表示及特点

使用场景

  • 二分类问题:由于 Sigmoid 函数可以将任意实数值映射到 (0, 1) 区间,因此它常被用作二分类问题的最后一层激活函数。
  • 逻辑回归:在逻辑回归中,Sigmoid 函数用于估计事件发生的概率。

表示

特点

  1. 输出范围输出范围是 (0, 1),这意味着它可以用来表示概率。

  2. 非线性:Sigmoid 函数是非线性的,这允许神经网络学习复杂的模式。

  3. 平滑梯度:Sigmoid 函数是处处可导的,其导数在所有点都是正值。这意味着它可以提供一个平滑的梯度,有利于使用梯度下降法进行优化。


线性回归逻辑回归的异同

同:①基础原理相同,都试图通过拟合一个线性方程建立特征X和目标变量Y之间的关系。②都可以使用梯度下降、最小二乘法等优化算法来估计模型参数,都依赖于损失函数衡量预测值与实际值的差距。

异:① 回归问题(连续数值型目标变量的预测)vs分类问题(二元分类或多分类问题)② 损失函数不同

特征线性回归(Linear Regression)逻辑回归(Logistic Regression)
主要用途回归问题分类问题
因变量预测连续数值型因变量(如房价、销售额等)预测二分类或多元分类问题中的类别标签(如是否患病、邮件是否为垃圾邮件)。
输出类型连续的数值,输出可以是任意实数 (-∞, +∞)。概率值,输出被压缩在 (0, 1) 区间内,表示概率。
损失函数常用最小化均方误差(MSE)作为损失函数。使用对数损失(log loss)或交叉熵损失函数。
激活函数没有使用特定的激活函数,直接输出预测值。使用 Sigmoid 函数(对于二分类)将线性组合转换成概率。
解释性可以直接解释自变量与因变量之间的关系(斜率代表变化率)。可以通过几率比(Odds Ratio)来解释自变量对结果概率的影响。
过拟合风险较低,尤其是当特征数量较少时。如果不加以控制(例如使用正则化),可能有过拟合的风险。
数据要求要求自变量和因变量之间存在线性关系,并且残差应满足正态分布等假设。对输入数据没有严格的线性假设,但仍然需要考虑特征选择和工程。
参数估计方法最小二乘法(OLS)、梯度下降等。最大似然估计(MLE),也可以使用梯度下降优化。

http://www.ppmy.cn/news/1561439.html

相关文章

智慧农业应用场景|珈和科技高标准农田信息化监管平台解决方案

近年来&#xff0c;珈和科技持续深耕农业领域&#xff0c;深耕农业时空大数据服务。 珈和利用遥感大数据、云计算、移动互联网、物联网、人工智能等先进技术&#xff0c;搭建“天空地一体化”监测体系&#xff0c;并创新建设了150的全球领先算法模型&#xff0c;可为100多种农作…

NLP项目实战——基于Bert模型的多情感评论分类(附数据集和源码)

在当今数字化的时代&#xff0c;分析用户评论中的情感倾向对于了解产品、服务的口碑等方面有着重要意义。而基于强大的预训练语言模型如 Bert 来进行评论情感分析&#xff0c;能够取得较好的效果。 在本次项目中&#xff0c;我们将展示如何利用 Python 语言结合transformers库&…

potato-suncsr

使用命令扫描靶机ip arp-scan -l 尝试访问一下ip 发现一个大土豆没什么用 尝试扫描一下子域名 没有发现什么有用的信息 尝试扫描端口 namp -A 192.168.19.137 -p- 尝试访问一下端口,发现都访问不进去 查看源代码发现了网页的标题 potato&#xff0c;就想着爆破一下密码 h…

CloudDM 接入主流 OA 系统,简化工单审批流程

数据库数据管控平台在维护企业数据安全、数据库规范方面不可或缺&#xff0c;这一点毋庸置疑。但在实际使用数据库数据管理系统时&#xff0c;常常面临一个问题&#xff1a;工单审批流程集中在数据管理系统&#xff0c;然而并非所有员工都使用这个系统&#xff0c;导致审批困难…

七次课掌握 Photoshop

mediaTEA 的《七次课掌握 Photoshop》系列文章以循序渐进的教学方式&#xff0c;帮助学员在短时间内高效掌握 Photoshop 的核心功能。 从基础知识到高级技巧&#xff0c;课程涵盖图像编辑、选区与抠图、形状与文字、绘画与修饰、调整与混合、样式与滤镜&#xff0c;以及自动化与…

在调用 borrowObject 方法时,Apache Commons Pool 会根据连接池的配置触发一系列相关的方法

在调用 borrowObject 方法时&#xff0c;Apache Commons Pool 会根据连接池的配置触发一系列相关的方法 1. GrpcChannel 的概念 GrpcChannel 是 gRPC 客户端与服务器之间通信的核心组件。它是基于 HTTP/2 的连接&#xff0c;支持多路复用&#xff0c;即通过单个通道可以发送多…

计算机网络第五章--运输层--课后习题

1.连续ARQ协议 【5-21】 假定使用连续ARQ 协议&#xff0c;发送窗口大小是3,而序号范围是[0,15],而传输媒 体保证在接收方能够按序收到分组。在某一时刻&#xff0c;在接收方&#xff0c;下一个期望收到的 序号是5。试问&#xff1a; (1)在发送方的发送窗口中可能出现的序号组…

uniapp 微信小程序 自定义日历组件

效果图 功能&#xff1a;可以记录当天是否有某些任务或者某些记录 具体使用&#xff1a; 子组件代码 <template><view class"Accumulate"><view class"bx"><view class"bxx"><view class"plank"><…