1.2 无监督学习和强化学习

news/2024/11/20 9:44:07/

1.2 无监督学习和强化学习

  • 无监督学习
    • 定义
    • 无监督学习与监督学习的区别
    • 相关概念
    • 流程图
  • 强化学习


无监督学习

定义

无监督学习 (Unsupervised Learning)是指从无标注数据中学习预测模型的机器学习问题,其本质是学习数据中的统计规律或潜在结构。

无监督学习与监督学习的区别

监督学习:

  • 标注数据:表示输入输出的对应关系
  • 预测模型:对给定的输入产生相应的输出
  • 本质:学习输入到输出的映射的统计规律

无监督学习:

  • 无标注数据:自然得到的数据
  • 预测模型:表示数据的类别、转换或概率
  • 本质:学习数据中的统计规律或潜在结构

相关概念

输入空间:X
隐式结构空间:Z
模型:函数z=g(x)z=g(x)z=g(x),条件概率分布P(z∣x)P(z \mid x)P(zx)或条件概率分布P(x∣z)P(x \mid z)P(xz)
假设空间(Hypothesis Space):所有这些可能模型的集合。
目的:选出在给定评价标准下的最优模型。
样本容量为N的训练集:
U={x1,x2,⋯,xN}U=\left\{x_{1}, x_{2}, \cdots, x_{N}\right\}U={x1,x2,,xN}

流程图

在这里插入图片描述

强化学习

假如环境中,有一个奖励rtr_{t}rt,如果采取动作ata_{t}at,环境就能根据智能系统,来决定下一个状态st+1s_{t+1}st+1、奖励rt+1r_{t+1}rt+1,之后再不停地循环,智能系统决定下一个状态和奖励是根据长期累积奖励最大化来实现的。

强化学习可以基于策略,也可以基于价值,基于策略则选择最优策略,而基于价值的选择最优价值,之后会的得到一个最优模型。

在这里插入图片描述

注:以上笔记素材来自于 B站_简博士_十分钟 机器学习 系列视频 《统计学习方法》


http://www.ppmy.cn/news/785.html

相关文章

unity---Mesh网格编程(六)

目录 1.模型切割 2.代码 1.模型切割 如图,对3D模型的Mesh网格进行切割,会经过若干个三角面。而切割后,将会产生新的面来组成左右两边的物体。 要记录每个顶点与顶点下标,新的面要顺时针绘制, 2.代码 using System.…

云服务连续三年增长150%,网宿科技开拓新赛道

摘要:开拓云服务市场,网宿科技的打法。 提到网宿科技,很多人还停留在传统IT服务商的印象中。其实,网宿科技已经在一条新赛道加速前行,这就是云服务。 “借助亚马逊云科技的持续赋能,网宿科技积累了丰富的云…

【数据结构趣味多】时间复杂度和空间复杂度

算法效率分析分为两种:第一种是时间效率,第二种是空间效率。时间效率被称为时间复杂度,而空间效率被称作空间复杂度。 时间复杂度主要衡量的是一个算法的运行速度,而空间复杂度主要衡量一个算法所需要的额外空间, 在计…

React基础

文章目录1.简介1.1 react与vue1.1.1 相同点1.1.2 不同点1.1.3 函数式组件的特点(什么是函数式组件)a.幂等b.无副作用用:1.1.4 虚拟dom的作用1.1.5 vue当中template与render的关系:1.2 MVC、MVVM、MVP模式1.2.1 MVC1.2.2 MVVM1.2.3…

MySQL介绍与安装(超详细)

数据库介绍 数据库(database)简称DB,实际上就是一个文件集合,是一个存储数据的仓库,本质就是一个文件系统,数据库是按照特定的格式把数据存储起来,用户可以对存储的数据进行增删改查等操作。 数据库存储数据特点 ●…

Java处理数据成为树状结构

如题所示&#xff0c;项目中需要将部分数据处理成为树状结构&#xff0c;实现过程如下&#xff1a; 注&#xff1a;也可以使用sql达到该目的&#xff0c;但此处数据不多&#xff0c;故在代码中处理&#xff0c;主要是sql处理不是很会 // 获取需要封装的数据List<Data> d…

java(面向对象)的23种设计模式(11)——观察者模式

一、定义 观察者模式&#xff1a;指多个对象间存在一对多的依赖关系&#xff0c;当一个对象的状态发生改变时&#xff0c;所有依赖于它的对象都得到通知并被自动更新。 换种说法&#xff0c;定义两种对象&#xff0c;观察者和目标对象&#xff0c;多个观察者同时监听一个目标对…

pikachu平台SQL注入

pikachu平台SQL注入 日常心累、速通pikachu注入相关 目录pikachu平台SQL注入使用到的名词解释1. 数字型注入 --使用bp处理数据包2. 字符型注入 --hackbar处理3. 搜索型注入4. xx型注入5. insert/update注入6. delete注入7. http头注入8. 布尔盲注9. 时间盲注10. 宽字节注入使用…