半监督学习为什么能work？以及直推式学习是什么

半监督学习为什么能work？以及直推式学习是什么

news/2024/11/28 4:34:42/

今天在看半监督的时候，突然想起这个问题：

半监督用训好的模型去生成伪标签，再把伪标签当做真标签去训，但是模型能生成伪标签说明模型已经学到了这部分内容，把模型已经学会的内容加进去，让模型继续学，能学出什么新东西呢？

去知乎搜了一下，一张图简洁明了地解决了我的疑问，太有力了，所以记录一下。
在这里插入图片描述
比如这张图展示的分布，如果我们一开始只有红蓝两个点是labelled，那么我们直接分，只能分出右边的情况。

但是使用半监督，我们不断地用已有的数据，给新的未标签的数据打标签，就可以变成左边这种分类器。

所以，半监督的意义是，在给未标注的数据打标签的过程中，我们实际上还是引入了新的信息：真实的数据分布。

如果某个场景里用半监督不能引入这个信息，那么在那个场景里半监督是无效的。

顺便记录一下查询过程中了解的直推式学习。

直推式学习不同于一般的归纳式学习，它是可以看到测试集的。

核心思想就是，我们常用的归纳型学习是通过在训练集上优化并学习，但是我们的最终目标是在数据集上做得好，并不是很在乎训练集上能有多少准确度。所以，可以把测试集的情况也拿进来看到，在这种前提下，去预测测试集的结果。（有点像半监督学习的作用对吧）

但是他的缺点在于，不同于归纳式学习学好了之后，如果有新的数据，直接塞进模型预测就好。直推式学习每引进一个新的测试数据，都要重新训练。

http://www.ppmy.cn/news/39290.html

相关文章

大器晚成我服刘邦，48岁才开始创业

大器晚成我服刘邦，48岁才开始创业

读史使人明智，周末放下手机，静下心来读点人文历史。大器晚成我最佩服刘邦，48岁才开始创业。在此之前，他是一个出身平凡的农民，早年曾多次失败和受挫。刘邦最后能够战胜项羽，常常让人觉得匪夷所思&#xff…

阅读更多...

网络编程三要素

网络编程三要素

网络编程三要素 IP、端口号、协议三要素分别代表什么 ip：设备在网络中的地址，是唯一的标识端口号：应用程序在设备中的唯一标识协议：数据在网络中传输的规则常见的协议有UDP、TCP、http、https、ftp ip：IPv4和…

阅读更多...

DataGrip连接数据库设置(MySQL、Oracle、SQL Server)

DataGrip连接数据库设置(MySQL、Oracle、SQL Server)

一、DataGrip连接MySQL 1.1 配置信息 1.2 测试查询employees库中departments表信息 employees为测试库，具体来源，参考这篇文章下载并导入MySQL示例数据库employees 。 1.3 测试查询employees库中employees表信息二、DataGrip连接Oracle 将SID改为o…

阅读更多...

Java中String类型的创建关系、什么是常量池、以及StringBuilder/Buffer等

Java中String类型的创建关系、什么是常量池、以及StringBuilder/Buffer等

Java的String字符串使用 String s1 "Hello World";String s2 "Hello World";String s3 new String("Hello World");String s4 new String("Hello World");System.out.println(s1s2); // trueSystem.out.println(s1s3); // falseSy…

阅读更多...

线性回归算法

线性回归算法

class LR_LS(): def __init__(self): self.w None def fit(self, X, y): # 最小二乘法矩阵求解 # show me your code self.w np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y) # show me your code def predict(self…

阅读更多...

重复的子字符串代码随想录刷题 (力扣刷题)

重复的子字符串代码随想录刷题 (力扣刷题)

给定一个非空的字符串 s ，检查是否可以通过由它的一个子串重复多次构成。来源：力扣（LeetCode） 链接：https://leetcode.cn/problems/repeated-substring-pattern 为什么会使用KMP 在一个串中查找是否出现过另一个串…

阅读更多...

集合详解之（三）单列集合接口Set及具体子类HashSet、TreeSet

集合详解之（三）单列集合接口Set及具体子类HashSet、TreeSet

文章目录🐒个人主页🏅JavaSE系列专栏📖前言：🎀Set集合接口🎀HashSet实现类🎀TreeSet实现类🪅HashSet类常用方法：🪅TreeSet类常用方法：&#x1f41…

阅读更多...

访问学者评审工作的考察内容

访问学者评审工作的考察内容

访问学者评审工作主要从以下几方面进行考察： 一、申请人的综合素质及发展潜力。二、申请人的主要业绩及获奖情况。三、出国研修学科专业及方向的需要程度、国内和国际发展水平的差距。四、出国访学的必要性、研修计划的可行性及访学目标的应用前景。五、访学…

阅读更多...

最新文章