机器学习的两种典型任务

devtools/2024/10/18 12:26:37/

机器学习中的典型任务类型可以分为分类任务(Classification)和回归任务(Regression)

分类任务

   回归任务

简单的理解,分类任务是对离散值进行预测,根据每个样本的值/特征预测该样本属于类 型A、类型B 还是类型C,例如情感分类、内容审核,相当于学习了一个分类边界(决策 边界),用分类边界把不同类别的数据区分开来。 回归任务是对连续值进行预测,根据每个样本的值/特征预测该样本的具体数值,例如房 价预测,股票预测等,相当于学习到了这一组数据背后的分布,能够根据数据的输入预 测该数据的取值。

有监督学习:监督学习利用大量的标注数据来训练模型,对模型的预测值和数据的真实 标签计算损失,然后将误差进行反向传播(计算梯度、更新参数),通过不断的学习, 最终可以获得识别新样本的能力。

每条数据都有正确答案,通过模型预测结果与正确答案的误差不断优化模型参数

无监督学习:无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间 的关系,比如聚类相关的任务。有监督和无监督最主要的区别在于模型在训练时是否需 要人工标注的标签信息。

只有数据没有答案,常见的是聚类算法,通过衡量样本之间的距离来划分类别

半监督学习:利用有标签数据和无标签数据来训练模型。一般假设无标签数据远多于有 标签数据。例如使用有标签数据训练模型,然后对无标签数据进行分类,再使用正确分 类的无标签数据训练模型;

利用大量的无标注数据和少量有标注数据进行模型训练

自监督学习:机器学习的标注数据源于数据本身,而不是由人工标注。目前主流大模型 的预训练过程都是采用自监督学习,将数据构建成完型填空形式,让模型预测对应内容, 实现自监督学习。

通过对数据进行处理,让数据的一部分成为标签,由此构成大规模数据进行模型训练

远程监督学习:主要用于关系抽取任务,采用bootstrap的思想通过已知三元组在文本 中寻找共现句,自动构成有标签数据,进行有监督学习。

基于现有的三元组收集训练数据,进行有监督学习

强化学习:强化学习是智能体根据已有的经验,采取系统或随机的方式,去尝试各种可 能答案的方式进行学习,并且智能体会通过环境反馈的奖赏来决定下一步的行为,并为 了获得更好的奖赏来进一步强化学习。

以获取更高的环境奖励为目标优化模型


http://www.ppmy.cn/devtools/36375.html

相关文章

电脑设置在哪里打开?Window与Mac双系统操作指南

随着科技的不断发展,电脑已经成为我们日常生活和工作中不可或缺的一部分。然而,对于许多初学者来说,如何找到并熟悉电脑的设置界面可能是一个挑战。特别是对于那些同时使用Windows和Mac双系统的用户来说,更是需要一篇详尽的指南来…

【Linux IO基础】缓冲区

概念 缓冲区的主要作用是提高效率 --- 提高使用者的效率,因为有缓冲区的存在,我们可以积累一部分再统一发送,提高发送的效率。 刷新方式 缓冲区因为能够暂存数据,必定要有一定的刷新方式: 一般策略: 无…

JAVA入门2

前言: 不一样的编程——基于两个大前提,语言随便选一个,作者选java和c,在后续的内容会有c和java的共同使用 第一大前提:编程语言起源于语言 第二大前提:计算机理解不了语言的含义 这两大前提构成了不一样的…

LeetCode:滑动窗口最大值

文章收录于LeetCode专栏 LeetCode地址 滑动窗口最大值 题目 给你一个整数数组 nums,有一个大小为 k 的滑动窗口从数组的最左侧移动到数组的最右侧。你只可以看到在滑动窗口内的 k 个数字。滑动窗口每次只向右移动一位。   返回 滑动窗口中的最大值 。   示例 1…

五一 作业

#include <iostream>using namespace std; class Num { private:int a; public:Num() {}Num(int a):a(a){}//设置a的值void set(int a){this->aa;}//1-a的和void Sum(){if(a<1){cout<<"a<1"<<endl;return;}int sum0;for(int i1;i<a;i)…

Raft共识算法图二解释

下面是有关Raft协议中不同术语和概念的翻译及解释&#xff1a; 术语和概念&#xff1a; 任期号&#xff08;term number&#xff09;&#xff1a;用来区分不同的leader。前一个日志槽位的信息&#xff08;prelogIndex&#xff09;&#xff1a;这是前一个日志条目的索引&#…

后端如何处理接口的重复调用

首先是&#xff0c;原理在请求接口之前&#xff0c;使用过滤器拦截数据&#xff0c;来进行判断两次数据是否一致。 1.自定义注解 2.创建一个Handler处理器 3.RepeatSubmitInterceptor的实现类 4.过滤器的配置

翻译《The Old New Thing》- Does Windows have a limit of 2000 threads per process?

Does Windows have a limit of 2000 threads per process? - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20050729-14/?p34773 Raymond Chen 2005年07月29日 Windows 是否有一个每个进程2000线程的限制&#xff1f; 简要 文章解释了在 W…