一起对话式学习-机器学习02——机器学习方法三要素

embedded/2024/9/23 16:02:48/

【一】核方法

        首先补充一下核方法,这应是机器学习分类中的内容。

        什么是核方法呢?听起来很高级,但理解很简单:

        官方定义:核方法是使用核函数表示和学习非线性模型的一种机器学习方法,可以用于监督学习和非监督学习。      

        理解:在分类问题中很多情况下并不能用线性(二维中是一条线,三维则是一个平面,当然还有更高维)去划分,而是非线性的。核方法则可以利用核函数将输入映射到一个特征空间中,使其映射后的样本点变得可分。

        如我们常见的几种模型:核函数支持向量机、核PCA、核K-means等。

【二】 机器学习方法三要素

机器学习方法=模型+策略+算法

可以理解为:机器学习模型在一定优化策略下使用相应求解算法来达到最优化目标。 

 1.模型 

        这里只介绍监督学习的两种:决策函数与条件概率分布,即非概率模型与概率模型。

        给出二者形式就明了了:

Y=f(X)

        这是一个决策函数,就是我们平时的一个x关于y的函数,给定x,如果已知全部参数,则模型确定输出y。当然,在模型中,这样的函数很可能不止一个,而是一个集合,自变量x可能也有很多,关系可能错综复杂。

P=P(Y|X) 

        这是一个条件概率分布,就是我们平时的概率密度函数,在已知X的情况下,确定Y的相应概率分布,只不过要注意,这个分布通常由参数\theta决定,具体可以参照01贝叶斯学习 。同样,在模型中,这样的函数很可能不止一个,而是一个集合。

2.策略

        所谓策略就是以什么准则进行学习以及选取最优模型。

        我们给出损失函数与风险函数:

有以下几种损失函数

(图片来自 此,侵删)

        就是在训练完后进行测试时,用来度量预测结果和真实值之间的差异。还有其他更复杂的损失函数,具体模型最优选取不同。

        接下是风险函数,很简单,就是损失函数的期望,模型平均意义下的损失。

R=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}) )

        其中,模型关于训练集的平均损失称为经验风险或经验损失。根据大数定律,当数据集样本数量N趋于无穷,经验风险就是期望风险,所以我们可以用训练集下的经验风险来代替所有数据下的期望风险。

        为什么不能直接计算期望风险呢?因为你不可能知道每次实例X下的输出Y,不然什么都知道还预测什么?

        但是我们知道,用样本代替总体(大数定律) 的思想很好,但总归是有误差,所以仅仅依靠经验风险来评估是不科学的,为此,我们提出结构风险

R=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}) )+\lambda J(f))       

        可以看到,其实就是将经验期望后加了一项,这项称之为正则化项或惩罚项,为的就是防止过拟合(由于模型捕捉了训练集上的过多细节导致的模型过于复杂化)。其中\lambda系数决定了惩罚力度。

        所以,我们最终要做的就是将经验风险最小化与结构风险最小化。

3.算法

        经过模型和策略的选定,实际上机器学习问题到这里就变成了最优化问题——求解经验风险最小化与结构风险最小化。

        这部分可以阅读最优化问题的相关书籍或观看视频深入了解。


 Over!!! 



http://www.ppmy.cn/embedded/115674.html

相关文章

深度学习经典模型解析

1. 概述 随着大数据时代的到来和计算能力的飞速提升,深度学习 已成为人工智能领域的核心技术之一。它通过模拟人脑神经元的连接方式,构建多层次的神经网络,能够自动从海量数据中学习复杂的特征表示。深度学习在图像识别、自然语言处理、语音…

如何在SpringCloud中使用Consul进行服务发现与配置管理

Spring Cloud是一个用于构建分布式系统的开发工具包。它提供了一系列解决方案,用于在分布式系统中管理和协调服务发现、配置管理、负载均衡、容错机制等功能。Consul是一种用于服务发现、配置管理和分布式一致性的工具,与Spring Cloud可以很好地集成在一…

安卓学习资源推荐

对于Android对于Android开发的学习资源,开发的学习资源,我可以推荐以下几类资源,这些我可以推荐以下几类资源,这些资源涵盖了从基础知识到高级技能的各个方面,适合不同学习阶段的开发者。资源涵盖了从基础知识到高级技…

HCIA--实验十九:配置接口DCHP

一、实验内容 1.需求/要求: 通过一台5700交换机和一台PC,通过在交换机的接口上配置接口DHCP来实现PC自动获取ip地址。 二、实验过程 1.拓扑图: 2.步骤: 1.给vlan10配置ip地址,进入vlan10开启接口的DHCP&#xff1…

专业视频编辑软件 MAGIX VEGAS Pro v21 中文授权版

MAGIX VEGAS Pro 是由德国MAGIX公司推出的一款专业视频编辑软件,软件支持8K/4K超清视频剪辑制作,具有无可替代的优势,包括业界领先的硬件加速、人工智能驱动的工具、复杂的颜色分级选项、业界领先的HDR支持、大量OFX特效插件和音视频插件脚本…

Java——包装类及认识泛型

包装类: 在学习泛型之前我们一定要认识包装类。 在Java 中,由于基本类型不是继承自 Object ,为了在泛型代码中可以支持基本类型, Java 给每个基本类型都对应了一个包装类型。 除了int类型和char类型的包装类不是它们对应的基本类型…

UniApp如何打包成客户端应用程序

像flutter是支持PC宽屏、桌面平台(Windows/macOS/Linux),我一直在期望UniApp什么时候也支持PC,桌面平台,终于盼到了。 1、支持PC宽屏 从uni-app 2.9起,支持PC宽屏的适配。 uni-app提供的屏幕适配方案&am…

Leetcode 2464. 有效分割中的最少子数组数目

1.题目基本信息 1.1.题目描述 给定一个整数数组 nums。 如果要将整数数组 nums 拆分为 子数组 后是 有效的,则必须满足: 每个子数组的第一个和最后一个元素的最大公约数 大于 1,且 nums 的每个元素只属于一个子数组。 返回 nums 的 有效 子数组拆分中…