吃瓜教程2|线性模型

news/2025/1/18 9:02:36/

线性回归

“广义的线性模型”(generalized linear model),其中,g(*)称为联系函数(link function)。

线性几率回归(逻辑回归)

线性判别分析

想让同类样本点的投影点尽可能接近,不同类样本点投影之间尽可能远,即:让各类的协方差之和尽可能小,不用类之间中心的距离尽可能大。基于这样的考虑,LDA定义了两个散度矩阵。

  • 类内散度矩阵(within-class scatter matrix)

Image Name

  • 类间散度矩阵(between-class scaltter matrix)

Image Name

因此得到了LDA的最大化目标:“广义瑞利商”(generalized Rayleigh quotient)。

Image Name

从而分类问题转化为最优化求解w的问题,当求解出w后,对新的样本进行分类时,只需将该样本点投影到这条直线上,根据与各个类别的中心值进行比较,从而判定出新样本与哪个类别距离最近。求解w的方法如下所示,使用的方法为λ乘子。

Image Name


若将w看做一个投影矩阵,类似PCA的思想,则LDA可将样本投影到N-1维空间(N为类簇数),投影的过程使用了类别信息(标记信息),因此LDA也常被视为一种经典的监督降维技术。

 类别不平衡问题

类别不平衡(class-imbanlance)就是指分类问题中不同类别的训练样本相差悬殊的情况,例如正例有900个,而反例只有100个,这个时候我们就需要进行相应的处理来平衡这个问题。常见的做法有三种:

  1. 在训练样本较多的类别中进行“欠采样”(undersampling),比如从正例中采出100个,常见的算法有:EasyEnsemble。
  2. 在训练样本较少的类别中进行“过采样”(oversampling),例如通过对反例中的数据进行插值,来产生额外的反例,常见的算法有SMOTE。
  3. 直接基于原数据集进行学习,对预测值进行“再缩放”处理。其中再缩放也是代价敏感学习的基础。

http://www.ppmy.cn/news/1173462.html

相关文章

设计模式(13)适配器模式

一、介绍: 1、定义:是一种结构型设计模式,它可以将一个类的接口转换成客户端所期望的另一种接口。适配器模式常用于系统的不兼容性问题。 2、组成: (1)目标接口(Target)&#xff…

MySQL update 是锁行还是锁表?

事务竞争 在多个事务并行对同一个数据进行修改的时候,会产生事务的竞争造成脏读、幻读、不可重复读等问题。所以 Mysql 为了避免这类问题的出现,引入了事务隔离级别,其实本质上来说,最终解决的方式无非就是 LBCC 和 MVCC 两种。 …

Java将djvu文件转成pdf

需求来源 迫于有部分资源是djvu格式的文件,需要预览这部分文件,web端无法直接预览djvu,所以需要将djvu转成pdf。 转换方法 简单来说就是先把djvu文件转换成tiff文件,再将tiff文件转换成pdf文件。 Ubuntu服务器 如果服务器是U…

unity中使用protobuf工具将proto文件转为C#实体脚本

unity中使用protobuf工具将proto文件转为C#实体脚本 介绍优点缺点Protobuf 为什么比 XML 快得多?Protobuf的EncodingProtobuf封解包的过程通常编写一个Google Protocol Buffer应用需要以下几步: Protostuff是什么Protobuf工具总结 介绍 protobuf也就是G…

Jackson 反序列化失败,出现JSON: Unrecognized field

问题: 这边在灰度发布的时候,其他未发布的机器出现过could not read JSON: Unrecognized field “type”,这个报错,原因是有一个表新加了一个字段,并且灰度发布了一台机器,刚好有请求命中这台机器&#xf…

2003-2020年全国各地级市金融发展水平测算数据(含原始数据和具体测算过程)

2003-2020年全国各地级市金融发展水平测算数据 1、时间:2003-2020年 2、来源:城市统计年鉴 3、指标:年末金融机构存款余额、金融机构贷款余额、GDP、金融发展水平 4、范围:300个地级市 5、计算公式:金融发展水平&…

typeof 与 instanceof 区别

typeof 和 instanceof 是 JavaScript 中用于检测数据类型的运算符,它们在使用和功能上有一些区别。 typeof 运算符: typeof 运算符用于检测给定值的数据类型,返回一个表示数据类型的字符串。typeof 可以用于检测基本数据类型(如字符串、数字、布尔值)和函数,也可以用于检…

CSS 基础知识-02

CSS 基础知识-01 1. flex布局 1. flex布局