第三章.­ Types of Learning

news/2025/1/3 19:36:49/

第三章.­ Types of Learning

3.1 Learning with Different Output Space Y

1.机器学习解决问题的类型

1).分类问题—输出值为离散值

①.二元分类问题:

·二元分类是机器学习领域的基本核心问题,二元分类有线性模型和非线性模型,根据具体情况,选择合适的模型种类。i

·应用场景:例如信用卡的发放,垃圾邮件的判别,患者疾病诊断等等

②.多元分类问题:

·多元分类的输出对于两个,y={1, 2, … , k}, k>2

·应用场景:数字识别,图像内容识别

2).回归问题—输出值为连续值

①.这类问题的输出y=R,即范围在整个实数空间,是连续的.

②.应用场景:股票收益,房屋价格预测等

3).自然语言处理领域—结构化学习(Structured Learning)

①.结构化学习的输出空间包含了某种结构在里面,它的一些解法通常是从多分类问题延伸而来的。

3.2 Learning with Different Data Label yn

1.机器学习方式:

1).监督学习:

·定义:
在训练集中既有输入特征x,也有输出标签yn
·应用:
二元分类,多元分类,回归.

2).非监督学习:

·定义:
在训练集中只有输入特征x,非监督的问题很多都可以使用监督式学习的一些算法思想来实现。
·应用:
聚类问题:网页上新闻的自动分类,交通路况分析;异常检测:用户网络流量监控.

3).半监督学习:

·定义:是监督学习和非监督学习相结合的一种学习方式,一部分数据有输出标签yn,一部分数据没有输出标签yn.

4).增强学习:

·定义:
给模型一些输入特征,但是给不了我们希望的真实输出yn,根据模型的输出反馈,若反馈结果好,接近真实输出,就给正向激励,若反馈结果不好,偏离真实输出,就给反向激励,不断通过“反馈­修正”这种形式,一步一步让模型学习的更好,这就是增强学习的核心.
·举例:
比如我们要训练狗狗坐下,但是狗狗无法直接听懂我们的指令“sit down”。在训练过程中,我们给狗狗示意,如果它表现得好,就给它奖励,如果它做跟sit down无关的动作,我们就给它小小的惩罚,通过不断修正狗狗的动作,最终能让它按照我们的指令来行动.

3.3 Learning with Different Protocol f(xn,yn)

1.按照不同协议,机器学习可分为3类:

1).Batch Learning(填鸭式)

·定义:
batch learning是一种在实际应用中最广泛的类型,一次性获取一批次的训练集,进行学习建模,得到我们最终的机器学习模型。

2).Online(老师教学)

·定义:
online是一种在线学习模型,数据是实时更新的 ,根据数据的更新同步更新算法,
·举例:
这是一个动态的过程:比如在线邮件过滤系统,根据每封邮件的内容,根据当前算法判断是否为垃圾邮件,再根据用户反馈,及时更新当前算法,例如上一章节中的PLA和增项学习都可以使用online模型。

3).Active Learning(主动问问题)

·定义:
让机器具备主动问问题的能力,例如手动数据识别,机器自动生成一个数字或者对他不确定的手写字主动提问。
·优势:
在获取样本label比较困难的时候,可以节约时间和成本,只对一些重要的label提出需求。

3.4 Learning with Different Input Space X

1.按照输入类型,机器学习可分为3类

1).concrete features

·举例:
硬币分类问题中硬币的大小和重量;疾病诊断中病人的信息的具体特征。

2).raw features

·定义:
raw features一般比较抽象,需要人或者机器来转换为对应的concrete features,这个转换过程叫做Feature Transform。
·举例:
手写数字识别中每个数字在图形中n维像素值;语音信号的频谱等

3).abstract features

·定义:
abstract features的特征是完全抽象的,没有实际的物理意义。对机器学习来说是比较困难的,需要对特征进行更多的提取和转换。
·举例:
某购物网站做购买预测;提供给参赛者抽象加密后的资料编号。

3.5 总结

本节主要介绍了机器学习按照不同的标准可以分成不同的类型。


http://www.ppmy.cn/news/98053.html

相关文章

虚拟机扩容

文章目录 虚拟机扩容扩容背景软件版本操作步骤1、VM上修改磁盘信息2、在系统中挂载磁盘(1) 使用命令查看磁盘状态(2) 通过命令查看到新磁盘的分区(3) 然后对新加的磁盘进行分区操作(4)重启虚拟机(5) 再次用以下命令查看到磁盘当前情况(6) 查看卷组名(7) 初始化刚刚的分区(8) 将…

数据结构基础内容-----第四章 栈与队列

文章目录 栈栈的定义站的抽象数据类型两栈共享空间栈的作用递归的定义 栈运算 队列循环队列队列链式存储结构及实现 栈 栈的定义 栈(Stack)是计算机科学中的一种抽象数据类型,它是一个只能在一端进行插入和删除操作的线性数据结构。栈按照后…

shell三剑客之grep

要想了解shell,grep是绕不过去的,今天就说说grep。 grep简介 grep是Linux中最常用的”文本处理工具”之一,grep与sed、awk合称为Linux中的三剑客。 grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文…

每日学术速递5.23

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CL 1.Tree of Thoughts: Deliberate Problem Solving with Large Language Models 标题:思想树:用大型语言模型有意识地解决问题 作者:Shunyu Yao, …

Python3数据分析与挖掘建模(1)python数据分析的流程与概述

1. 数据分析流程之一 Python数据分析的完整流程通常包括以下步骤: 数据收集:收集需要分析的数据,可以是从数据库、API、文件或其他来源获取数据。 数据清洗:对数据进行清洗和预处理,包括处理缺失值、异常值、重复值等…

使用CompletionService进行多个文件打包为zip下载

最近没怎么写博客了,因为前段时间在准备软考复习,昨天考完试,现在总算轻松一点了,有更多自由的时间了,总结一下JUC包下的一些并发工具类,主要是从使用场景入手。 CompletionService可以用于实现任务并行化…

Java多线程学习

1. 多线程 线程与任务的关系 脱离了任务的线程是没有意义的 线程对象是通过Thread类来创建的 任务是通过Runnable接口来定义的 1.继承Thread类 2.实现Runnable接口 3.实现Callable接口 (与Runnable的区别,可以拿到返回值) Thread线程…

jvm问题排查

常用工具 命令查询资源信息 top:显示系统整体资源使用情况 vmstat:监控内存和 CPU iostat:监控 IO 使用 netstat:监控网络使用 查看java进程 jps 查看运行时信息 jinfo pid gc工具 jstat: 查看jvm内存信息 GCViewer — 离线分析G…