【AI-26】常见的监督学习方法集合

ops/2025/2/11 17:40:11/

监督学习是机器学习中的一个重要类别,它基于有标签的数据进行模型训练,目标是让模型学会从输入数据预测对应的输出标签。以下是一些常见的监督学习方法及其通俗易懂的解释:

线性回归

  • 原理:假设输入特征和输出标签之间存在线性关系,通过找到一条最佳的直线(在二维空间)或超平面(在多维空间)来拟合数据点,使得数据点到该直线或超平面的距离之和最小。简单来说,就是找到一个能最好地描述输入和输出之间线性变化规律的公式。
  • 示例:预测房屋价格时,可将房屋面积作为输入特征,价格作为输出标签。线性回归会根据已有的房屋面积和价格数据,找出一个线性公式,如价格 = 面积 × 系数 + 常数,后续给定一个新的房屋面积,就能用这个公式预测出大致价格。

逻辑回归

  • 原理:主要用于解决分类问题,特别是二分类问题。它通过一个逻辑函数(如 Sigmoid 函数)将线性回归的输出值映射到 0 到 1 之间的概率值,以此来判断样本属于某个类别的可能性。如果概率大于某个阈值(通常是 0.5),就将样本归为正类;否则归为负类。
  • 示例:判断一封电子邮件是否为垃圾邮件,把邮件的各种特征(如关键词出现频率、发件人信息等)作为输入,逻辑回归模型会计算这封邮件是垃圾邮件的概率。若概率大于 0.5,就判定为垃圾邮件;小于 0.5 则判定为正常邮件。

决策树

  • 原理:决策树就像一棵倒着生长的树,从根节点开始,根据输入特征的不同取值进行分支,逐步将数据划分到不同的子节点,直到到达叶子节点,每个叶子节点对应一个预测结果。决策树的构建过程就是不断选择最优的特征和划分点,使得划分后的子节点数据纯度尽可能高。
  • 示例:在判断一个水果是苹果、香蕉还是橙子时,决策树可能会先根据颜色进行判断,如果颜色是红色,再根据形状进一步判断。比如红色且圆形的可能判断为苹果,红色且细长的可能判断为其他情况,以此类推,逐步确定水果的类别。

支持向量机(SVM)

  • 原理:对于二分类问题,支持向量机的目标是找到一个最优的超平面,将不同类别的样本分开,并且使这个超平面到最近样本点的距离(即间隔)最大。这些最近的样本点被称为支持向量。对于线性不可分的数据,SVM 会通过核函数将数据映射到高维空间,使其在高维空间中变得线性可分。
  • 示例:假设有两类不同颜色的点分布在平面上,支持向量机就是要找到一条直线(在二维空间)或一个平面(在三维空间),让这条直线或平面能最好地将这两类点分开,并且使直线或平面到两类点中最近的点的距离尽可能大。

随机森林

  • 原理:随机森林是由多个决策树组成的集成学习模型。在训练过程中,它会随机选取一部分样本和一部分特征来构建每一棵决策树,然后通过对所有决策树的预测结果进行综合(如投票或平均)来得到最终的预测结果。这种随机性使得每棵决策树具有一定的差异性,从而提高了模型的泛化能力。
  • 示例:预测某个人是否会购买某种商品时,随机森林中的每一棵决策树会根据不同的样本和特征组合进行判断,最后综合所有决策树的判断结果,如超过半数的决策树认为这个人会购买,那么随机森林就预测这个人会购买该商品。

神经网络(多层感知机)

  • 原理:神经网络由多个神经元组成,这些神经元按层次排列,包括输入层、隐藏层和输出层。每个神经元接收来自上一层神经元的输入,经过加权求和和激活函数处理后,将输出传递给下一层神经元。通过不断调整神经元之间的连接权重,使得网络的输出尽可能接近真实的标签。
  • 示例:在图像识别任务中,输入层接收图像的像素值,隐藏层通过对这些像素值进行一系列的非线性变换和特征提取,输出层则输出图像属于各个类别的概率,概率最大的类别即为预测结果。例如识别一张图片中的动物是猫还是狗,神经网络会通过学习大量的猫和狗的图片,调整自身的权重,从而能够准确地进行分类。

http://www.ppmy.cn/ops/157569.html

相关文章

哪些专业跟FPGA有关?

FPGA产业作为近几年新兴的技术领域,薪资高、待遇好,吸引了大量的求职者。特别是对于毕业生,FPGA领域的岗位需求供不应求。那么,哪些专业和FPGA相关呢? 哪些专业跟FPGA有关? 微电子学与固体电子学、微电子科…

如何在WPS和Word/Excel中直接使用DeepSeek功能

以下是将DeepSeek功能集成到WPS中的详细步骤,无需本地部署模型,直接通过官网连接使用:1. 下载并安装OfficeAI插件 (1)访问OfficeAI插件下载地址:OfficeAI助手 - 免费办公智能AI助手, AI写作,下载…

【AI】在Ubuntu中使用docker对DeepSeek的部署与使用

这篇文章前言是我基于部署好的deepseek-r1:8b模型跑出来的 关于部署DeepSeek的前言与介绍 在当今快速发展的技术环境中,有效地利用机器学习工具来解决问题变得越来越重要。今天,我将引入一个名为DeepSeek 的工具,它作为一种强大的搜索引擎&a…

Vue 响应式渲染 - Vue2 Class和style

Vue 渐进式JavaScript 框架 基于Vue2的学习笔记 - Vue响应式渲染 - Vue2 Class和style 目录 Vue2 Class和style 动态切换class-对象 添加新类 如何解决方案 动态切换class-数组 增加类方式 动态切换style-对象 在data中设置变量 动态添加底层不支持 增加元素 动态添…

关于SoC产品介绍:ICNM8501

4K显示器 主控芯片scaler IC——ICNM8501。 结合了两个符合HDMI 2.0标准的数 字输入接口和HDCP1.4/HDCP2.2,两个DP1.4数字输入接口, 一个高质量的放大/缩小和收缩引擎,一个多色屏幕显示(OSD) 控制器和许多其他功能。3…

flink JobGraph解析

JobGraph组成 JobGraph主要是StreamGraph经过优化后生成的,主要优化的就是对符合条件节点进行chain,这样可以减少数据流动的序列化和传输。 JobGraph主要由三部分组成。 JobVertex:图的顶点。输入是一个JobEdge,输出是Intermedi…

STL函数算法笔记

STL函数算法笔记 今天我们来学习的是STL库中的一些函数。首先,STL这个东西大家一定非常熟悉,里面很多的数据结构都帮了大家不少忙,那么今天我们就来说几个重要的数据结构。 向量 向量,也就是数据结构vector,你也可以称之为动态数组,本质跟数组差不多,只不过有一些好处…

DeepSeek R1技术报告关键解析(8/10):DeepSeek-R1 的“aha 时刻”,AI 自主学习的新突破

1. 什么是 AI 的“aha 时刻”? 在强化学习过程中,AI 的推理能力并不是线性增长的,而是会经历一些关键的“顿悟”时刻,研究人员将其称为“aha 时刻”。 这是 AI 在训练过程中突然学会了一种新的推理方式,或者能够主动…