监督分类器

news/2024/11/22 22:14:33/

监督分类器总结

分类器具有学习能力的描述:通过数据提高分类器的分类表现!!!

1 监督回归问题中的:线性回归、多元线性回归、非线性回归

2 分类标准中的:伯努利分布的Logistic二分类和多项式分布的Softmax多分类

3 距离法则和投票法则的KNN

4 小规模数据十分效果的决策树

5 超平面方法的SVM

6 神经网络中的稀疏编码

1 线性回归、多元线性回归、非线性回归

从回归模型(包括单元线性和多元线性)到回归方程(包括单元线性和多元线性)

从回归方程(包括单元线性和多元线性)得到估计量(单元线性举例):

计算模型:Y尖 = B0 + B1 * X计算B0和B1

估计方法与优化方法:平方和方法:min(Y-Y尖)的平方

对于多元线性回归中存在分类型变量的问题:将分类型变量进行编码来解决

最后非线性模型:g(Z)= g(B0 * X0 + B1 * X1 + B2 * X2 + B3 * X3 …… )

从这里可以引入我们下面要讲的Logistic,以及更新法则

2 Logistic && Softmax

常常作为神经网络激活函数的Logistic二分类和Softmax多分类都是贝叶斯概率的基础建立起来的理论。

Softmax是logistic回归模型在多分类问题上的推广,评分归一化(3类:0.82  0.18  0)

多个Logistic多分类:类与类之间不互斥

一个Softmax多分类:类与类之间互斥

3 KNN

总结:距离规则 + 投票规则 决定预测样本的归属问题。

通过已知实例来预测未知实例:现有的一堆被标签的数据堆,对于未知实例到底应该分类到哪一类中呢?通过欧式距离或者曼哈顿距离(在距离上可以依据实际问题进行改进)计算得到未知实例与已知实例中的top K个最近的“邻居”,邻居投票决定其未知实例的归属。

缺点很显著:算法空间和时间的复杂度都很高(大量空间存储已知实例,大量的计算距离消耗),还有很重要的一点是:当我们已知样本分布不平衡的时候,是不是未知实例很容易被主导样本误导(例:训练数据中A类样本50个,B类样本10个,就会出问题了)。

4 决策树

总结:贪心算下,自下而上(熵大者作为根节点),按分裂规则树形生长。

ID3算法使用信息增益作为不纯度;

C4.5算法使用信息增益率作为不纯度;

CART算法使用基尼系数作为不纯度

5 支撑向量机

起源于logistic回归(0/1分类模型)的分类标准,SVM就是特征空间的线性分类器:

线性可分:超平面线性拉开数据特征空间的距离,Gap(凸二次优化)越大,Confidence越大。

线性不可分:拉格朗日对偶性解决,KTT条件,维度一直高下去,无法找到超平面的问题(满足条件的超平面不存在),最终我们是引入核函数(计算在低维,分类表现在高维)

训练方式:通过标签数据来训练超平面

基本方法:one-against-all && one-against-one

6 神经网络

利用神经网络中神经元(卷积核)参数对某一状态稀疏编码(激活)出一个很抽象的感受(神经网络最大的创新),这个感受可以直接端到端地降维计算出一个具体的我们想要的解结构的关键部分

训练就是学习和改变神经元参数,去使得解结构的关键部分朝着目标的梯度去更新。


http://www.ppmy.cn/news/679473.html

相关文章

史上最简单的Spring Security教程(十九):AccessDecisionVoter简介及自定义访问权限投票器

为了后续对 AccessDecisionManager 的介绍,我们先来提前对 AccessDecisionVoter 做个简单的了解,然后,在捎带手自定义一个 AccessDecisionVoter。 AccessDecisionVoter 的注释介绍如下: Indicates a class is responsible for vo…

三种方法用Verilog实现多人表决器

module biaojue( a,b,c,d,e,f); input a,b,c,d,e; output f; reg f; reg[2:0] count1; initial count10; always(a,b,c,d,e) begin count1abcde; fcount1<3?0:1;//当人数在三人以下是输出1 end endmodule module biaojue5( input a,b,c,d,e, output f ); assign fa&b&…

76、基于STM32单片机车牌识别摄像头图像处理扫描设计(程序+原理图+PCB源文件+相关资料+参考PPT+元器件清单等)

单片机主芯片选择方案 方案一&#xff1a;AT89C51是美国ATMEL公司生产的低电压&#xff0c;高性能CMOS型8位单片机&#xff0c;器件采用ATMEL公司的高密度、非易失性存储技术生产&#xff0c;兼容标准MCS-51指令系统&#xff0c;片内置通用8位中央处理器(CPU)和Flash存储单元&a…

Power BI 如何实现时间切片器默认选择最新日期

目前Power BI暂不支持切片器选择动态的默认值的功能&#xff0c;只能通过在Power BI Desktop 中预先选择某个固定值的方式发布到Power BI Service来实现过滤器的默认值效果。这可 以满足部分的需求&#xff0c;但是对于时间这种实时变化的维度&#xff0c;客户肯定希望每次打开…

标签、类选择器及CSS命名规范

一、标签选择器(元素选择器) 使用HTML标签名称作为选择器&#xff0c;按标签名称分类&#xff0c;为页面中某一类标签指定统一的CSS样式。 基本语法格式&#xff1a; 标签名{属性1&#xff1a;属性值1&#xff1b;属性2&#xff1a;属性值2&#xff1b;属性3&#xff1a;属性…

机器学习(十二)-基于规则的分类器

原创不易&#xff0c;转载前请注明博主的链接地址&#xff1a;Blessy_Zhu https://blog.csdn.net/weixin_42555080 本次代码的环境&#xff1a; 运行平台&#xff1a; Windows Python版本&#xff1a; Python3.x IDE&#xff1a; PyCharm   一 算法简介 基于规则的分类器是使…

有没有微信相互投票群?

“你好&#xff0c;我需要投票&#xff0c;你可以帮我吗&#xff1f;” 相信很多人在需要投票的时候&#xff0c;会联系各个亲戚朋友同事&#xff0c;熟悉的会帮你&#xff0c;不熟悉的呢&#xff1f;会想&#xff0c;凭什么我要帮你啊&#xff01; 我们相互间&#xff0c;都是…

smartscreen筛选器阻止了这个不安全的下载

今天用IE从云盘下载PPT文件时&#xff0c;提示&#xff1a;smartscreen筛选器阻止了这个不安全的下载。 如下图&#xff1a; 真是让人反感。 解决方法&#xff1a; 打开ie浏览器&#xff0c;选择工具-》internet选项。 在弹出的对话框上选择“安全”-》internet-“自定义级别…