机器学习（3）

机器学习（3）

server/2024/9/24 0:19:24/

目录

3-1线性回归

3-2最小二乘解

3-3多元线性回归

3-4广义线性模型

3-5对率回归

3-6对率回归求解

3-7线性判别分析

3-8LDA的多类推广

3-9多分类学习基本思路

3-10类别不平衡

3-1线性回归

线性模型为什么重要？

人类在考虑问题时，通常很难直接思考非线性的问题

线性模型：试图学得一个通过属性的线性组合来进行预测的函数

优点：简单，基本，可理解性好

线性回归

“线性回归”试图学得一个线性模型以尽可能地预测实值输出标记。

均方误差有非常好的几何意义，它对应了常用的欧几里得距离或简称“欧式距离”。基于均方误差最小化来进行模型求解的方法为“最小二乘法”。在线性回归中，最小二乘法就是试图找到一条直线，使所有样本到直线上的欧氏距离之和最小。

3-2最小二乘解

求解w和b使E（w，b）最小化的过程，称为线性回归模型的最小二乘“参数估计”

偏导的物理意义表示的是变化率（理解为什么令导数为0）

3-3多元线性回归

我们把包括两个或两个以上自变量的回归称为多元线性回归。

同样令其为零可得最优解得闭式解，但由于涉及逆矩阵的计算，比单变量情形要复杂一些，需要做简单的讨论。

若存在逆矩阵，直接求解

若不存在，加上不同的归纳偏好，即引入正则化项

3-4广义线性模型

线性模型虽然简单，却有着丰富的变化

广义线性模型，线性模型经过操作来逼近y，其中函数g（）被称为“联系函数”

3-5对率回归

考虑“二分类任务”，而线性回归模型产生的预测值是实值，于是我们需要将实值转换成0/1值。

最理想的是“单位阶跃函数”，但性质不好，我们需要找到替代函数，“对数几率函数”，简称
“对率函数”。

“对数几率回归”虽然名字是回归，但它实际却是一种分类学习方法

3-6对率回归求解

求解思路

3-7线性判别分析

如何用线性模型直接做分类？线性判别分析简称LDA

同类尽可能近，异类尽可能远。

将样例投影到一条直线，可看作降维技术。

LDA的目标（最大化广义瑞丽商）

求解过程

3-8LDA的多类推广

LDA推广到多类

3-9多分类学习基本思路

现实中常遇到多分类学习任务。有些二分类学习方法可直接推广到多分类。但在更多情形下，我们是基于一些基本策略，利用二分类学习器来解决多分类问题。

多分类学习的基本思路是“拆分法”。最典型的拆分策略有三种：“一对一”（简称“OvO”），“一对其余”（简称OvR），“多对多(简称MvM)"

3-10类别不平衡

前面介绍的分类学习方法都有一个共同的假设，即不同类别的训练样本数目相当。但若不同类别的训练样例差距过大，则会对学习过程造成很大的影响。

也不是所有的类别不平衡都要处理，只有当丢掉的小类价值很高时才进行处理。（eg：信用卡检测）

过采样：增加小类的采样，在中间插值

欠采样：减少大类的采样，丢弃部分数据

阈值移动：修改阈值

http://www.ppmy.cn/server/41969.html

相关文章

创新指南 | 企业AI战略实施方案探讨（上）：如何构建基于AI的新商业模型和业务场景

创新指南 | 企业AI战略实施方案探讨（上）：如何构建基于AI的新商业模型和业务场景

2023年以ChatGPT为代表的生成式AI推出以来，从投资界到企业界都掀起了一股热潮。那么从企业角度来看，生成式AI到底能为业务带来哪些增量呢？企业如何构建基于AI的商业模式并进行落地实施呢？ 企业AI战略实施方案探讨分为上下两篇&am…

阅读更多...

人脸识别之bbox【det_10g】-ncnn(c++)

人脸识别之bbox【det_10g】-ncnn(c++)

模型描述 det_10g是insightface 人脸框图和人脸关键点的分类，最终能够得到人脸框图bbox，分值还有人脸五官（眼x2、鼻子x1、嘴巴x2） 由于我这里没有采用最终结果，通过onnx转换为ncnn，所以后面的步骤结果丢弃…

阅读更多...

安全关闭Tcp连接

安全关闭Tcp连接

close与shutdwon int close(int sockfd);关闭sokcet，这里注意：当程序调用close关闭socket的时候,如果缓冲区中仍然有数据的话,协议栈会发送RST包代替FIN包，丢弃缓冲的数据，强行关闭连接 int shutdown(int sockfd, int howto);该…

阅读更多...

太阳能无人机的多元化应用

太阳能无人机的多元化应用

随着新能源技术的不断发展和成熟，太阳能在无人机的应用技术已经成熟。太阳能无人机得到了量产和广泛的应用。传统无人机相比，太阳能无人机无需燃油，运行费用低廉，搭载多种高科技设备，能够高效、多元化地采集和分析各类…

阅读更多...

LeetCode 题目 118：杨辉三角

LeetCode 题目 118：杨辉三角

作者介绍：10年大厂数据\经营分析经验，现任字节跳动数据部门负责人。会一些的技术：数据分析、算法、SQL、大数据相关、python，欢迎探讨交流欢迎加入社区：码上找工作作者专栏每日更新： LeetCode解锁1000题…

阅读更多...

GIN框架_响应

GIN框架_响应

响应 1. 字符串方式 r.GET("/user/save", func(ctx *gin.Context) {ctx.String(http.StatusOK, "this is a %s", "ms string response")})2. JSON方式 r.GET("/user/save", func(ctx *gin.Context) {ctx.JSON(http.StatusOK, gin.H…

阅读更多...

目标检测项目：设定正负样本实现单目标检测

目标检测项目：设定正负样本实现单目标检测

目标检测单目标检测数据准备数据1：检测目标数据2：背景图（负样本） 数据3：检测目标背景图（正样本） 目标背景图、背景图作为正负样本，作为二分类问题，来训练模型 …

阅读更多...

神经网络复习--循环神经网络

神经网络复习--循环神经网络

文章目录 RNNLSTM神经网络GAN神经网络 RNN 有些任务人工神经网络，CNN解决不了，自然语言处理中，输入和输出之间不独立，而传统神经网络中，输入和输出都是相互独立的，因此需要一种神经网络让输出和之前的输入…

阅读更多...

最新文章