从训练数据视角:看机器学习和深度学习的大三范式

news/2024/11/8 3:37:19/

从训练数据视角:机器学习和深度学习 “模型”的大三范式

训练数据一般分为两个部分,一部分是数据本身,一部分是标注(Label)。训练是通过数据对应的标注,让模型理解数据。

1.监督学习

即训练直接输入数据和对应的标注,让模型能识别数据的标注。

1.1 半监督学习

利用无标记数据来训练一个辅助分类器或者利用无标记数据来学习数据分布,从而改进有标记数据的分类效果。这些技术包括自编码器、半监督SVM、深度置信网络等。

2.无监督学习

即训练数据没有标注

Tips:通常将生成模型归为无监督学习

2.1 自监督学习

利用无标记的数据来自动生成标签或者特征,然后利用这些生成的标签或者特征来训练模型。

即通过大量的无标记数据,学习数据的内在结构和特征,从而产生高质量的表示,这些表示可以被用于各种任务,例如分类、目标检测、图像分割等。

3.强化学习

强化学习是通过探索未知数据来学习一切可能的结果,从而找到最佳结果。

强化学习需要记录连续的行动和状态空间,类似一个二维矩阵,俗称Q表或Q-Learning

定义了一个环境和一个代理。代理可以观察环境,并根据观察结果采取行动。

每次代理采取行动后,环境会反馈一个奖励信号,告诉代理这个行动是好的还是坏的。代理的目标是通过不断尝试和学习来最大化累积奖励信号。代理的学习过程通常是基于试错(trial-and-error)的,通过尝试多种行动并观察结果来更新策略。


http://www.ppmy.cn/news/56398.html

相关文章

中国社会科学院大学与美国杜兰大学金融管理硕士——只要出发就会顺利抵达彼岸

新的地方会发生新的故事,新的相遇会碰撞出新的火花。只要出发,我们就会顺利抵达我们想去的远方。就像选择在社科院杜兰大学金融管理硕士项目读研的我们,在这里与来自全国各地的精英同学相聚,共享行业前沿资讯,聆听名师…

智能算法系列之基于粒子群优化的模拟退火算法

文章目录 前言1. 算法结合思路2. 问题场景2.1 Sphere2.2 Himmelblau2.3 Ackley2.4 函数可视化 3. 算法实现代码仓库:IALib[GitHub] 前言 本篇是智能算法(Python复现)专栏的第四篇文章,主要介绍粒子群优化算法与模拟退火算法的结合,以弥补各自…

C#开发的OpenRA游戏的加载地图流程

C#开发的OpenRA游戏的加载地图流程 OpenRA游戏里,地图是一个很关键的数据, 因为地图里包括了地面状态,地面上建筑物状态, 还有玩家在地图上的布局情况,以及各种活动限制的条件。 在OpenRA里,需要把地图目录:OpenRA\mods\cnc\maps 里所有的文件进行加载, 并且保存在缓…

IDEA 使用系列之 Alibaba Cloud Toolkit 一件部署

一、前文 做开发,免不了要往服务器部署前端后端,首先要用xftp把前后端所在文件夹打开,把jar、dist备份再上传,然后再打开xshell把前后端kill掉,然后再敲命令重新启动前后端,少则2、3分钟,多则10…

使用BP神经网络和Elman Net预测航班价格(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

ESP32-硬件IIC读取温湿度传感器SHT30

简介 esp32 使用硬件I2C读取温湿度传感器SHT30,例程基于EDP-IDF-4.4.X 的I2C Simple Example 例程修改 工程创建 打开 VSCODE ,通过 查看-- 命令面板(快捷键CtrlShiftP),打开 ESP-IDF 的例程后,选择 i2c_simple 例程&#xff0…

【2023/04/21-04/28】回溯算法

学习链接&#xff1a; 回溯算法解题套路框架回溯算法秒杀所有排列-组合-子集问题一文秒杀所有岛屿题目 1.分割回文串 题目来源&#xff1a;131.分割回文串 题解&#xff1a; class Solution { public:vector<vector<int>> f;vector<vector<string>&g…

前端开发在本地开发与后台进行联调阶段时,接口自动重定向https、HSTS 与 307 状态码

开发者在本地开发与后台进行联调阶段时&#xff0c;Chrome 浏览器上出现 307 状态码&#xff0c;并跳转到 https 版 但是 307 代码是什么含义呢&#xff1f;页面又为何会出现 307 状态码呢&#xff1f;我之前都没见过这个状态码&#xff0c;查了才知道原来它也是一种重定向。 …