【machine learning-17-分类(逻辑回归sigmod)】

server/2024/10/7 23:24:18/

分类问题

先说一下什么是分类问题,举个例子:
判定一封邮件是否是垃圾邮件;
判定图片是不是一直猫;
等等
这些问题的答案都是有限的,而不像是线性回归,是存在无限可能的不确定值。

这种问题就是分类问题,那么线性回归可以解决分类问题么?
答案是可以,但是效果可能不太好

线性回归解决分类问题的弊端

在这里插入图片描述

比如上面是检测肿瘤是否良性的一个数据集,有蓝色和红色这两种数据,分别表示不同的结果,是或者不是(0或者1标识),如果线性回归来拟合这个数据的话,可能用图中那条蓝色直线来表示,然后我们定一个阈值,比如y轴0.5以上的就表示非良性,那么这时候x轴位置的点就表示临界点了。输入在X左边的为0,否则为1。现在看起来是没问题的。但是如果数据集增加一个下图中的数据呢?

在这里插入图片描述
那样拟合的直线就应该像图中绿色这条线,这时候如果阈值还是0.5,然后就会发现水平轴的临界值就变了,这时候这条直线x轴这个临界点左边这两个红色数据跟右边的两个红色数据已经不是同一种类了。
显然这个结果不是我们想要的。

怎么解决这个问题,就是逻辑回归,虽然也是回归,但其实跟线性回归没关系,不要误解,这其实是一个二分类算法。

sigmod 逻辑回归

sigmod 函数如下:
在这里插入图片描述
它的函数图像如下
在这里插入图片描述
注意观察下,这个函数值总是在0和1之间,正好与二分类的算法要求输出0和1的结果相对应,二分类的算法是在线性回归基础上再加上一个sigmode,如下:

sigmod(f(x))

在这里插入图片描述
至于深层次的详细解读会在下一节中介绍


http://www.ppmy.cn/server/125383.html

相关文章

Python电能质量扰动信号分类(六)基于扰动信号特征提取的超强机器学习识别模型

创新度高!!!需要发论文的同学即买即用 往期精彩内容: Python-电能质量扰动信号数据介绍与分类-CSDN博客 Python电能质量扰动信号分类(一)基于LSTM模型的一维信号分类-CSDN博客 Python电能质量扰动信号分类(二)基于CNN模型的一维…

NAND Flash虚拟层设计概述

NAND Flash虚拟层的建立需要对NAND Flash虚拟层进行初始化,根据相应的NAND Flash的物理结构参数建立逻辑结构,并建立索引表来管理逻辑虚拟层与物理虚拟层之间的联系;而在NAND Flash虚拟层运行过程中需要对NAND Flash虚拟层进行相应的垃圾回收、坏块管理和平滑处理操作,从而…

海陆钻井自动化作业机器人比例阀放大器

海陆钻井自动化作业机器人是现代海洋石油勘探与钻井领域的关键装备,它通过自动化和无人化技术显著提高了钻井效率和安全性。海陆钻井自动化作业机器人主要用于在海上和陆地的钻井平台上进行自动化、无人化的一体化作业。这种设备能够自动切换钻杆,极大地…

高防服务器的优劣势有哪些?

高防服务器是专门用于防御分布式拒绝服务攻击和其他网络攻击所设计的服务器,高防服务器可以用于保护企业网站和应用不会受到网络攻击,但是高防服务器咋某些方面还是有着一些不足的,下面我们就来一起了解一下吧! 高防服务器通常都具…

字符串逆序

字符串逆序,面试常考点,由于实现思路很容易,面试官也通常会让你使用多种解法实现,并手写c伪代码,其中每种解法的时空复杂度都要很清楚,能够分析,尤其是最后一种递归实现属于比较进阶的思维了&am…

计算机网络(第二章 物理层)

文章目录 1.物理层的基本概念2.数据通信的基础知识2.1数据通信系统模型2.2有关信道的基本概念2.3信道极限容量 3.物理层3.2引导性传输媒体3.3非引导性传输媒体 4.信道复用技术4.1频分复用、时分复用和统计时分复用4.2波分复用 5.宽带接入技术 本文首先讨论物理层的基本概念。然…

Leetcode 3306. Count of Substrings Containing Every Vowel and K Consonants II

Leetcode 3306. Count of Substrings Containing Every Vowel and K Consonants II 1. 解题思路2. 代码实现 题目链接:3306. Count of Substrings Containing Every Vowel and K Consonants II 1. 解题思路 这一题的话思路上就是一个滑动窗口,考察没一…

测试面试题:pytest断言时,数据是符点类型,如何断言?

在使用 Pytest 进行断言时,如果数据是浮点类型,可以使用以下方法进行断言: 一、使用pytest.approx pytest.approx可以用来比较两个浮点数是否近似相等。例如: import pytestdef test_float_assertion():result 3.14159expecte…