机器学习期末复习 集成学习

news/2024/11/20 8:41:43/

1.集成学习的一般结构?

(1)产生一组个体学习器

(2)用某些策略将个体学习器结合

2.(判断)集成学习主要分为并行算法和串行算法。其中随机森林属于串行算法,即每一颗树的学习受其他树学习的影响。F

串行:boosting(代表:Adaboost

Adaboost的主要优点有:

Adaboost作为分类器时,分类精度很高
在Adaboost的框架下,可以使用各种回归分类模型来构建弱学习器,非常灵活。
作为简单的二元分类器时,构造简单,结果可理解。
不容易发生过拟合
Adaboost的主要缺点有:

对异常样本敏感,异常样本在迭代中可能会获得较高的权重,影响最终的强学习器的预测准确性。
 

并行:bagging,随机森林

bagging是一种在原始数据集上,通过有放回抽样分别选出k个新数据集(自助法),来训练分类器的集成算法。分类器之间没有依赖关系。

随机森林属于bagging集成算法。通过组合多个弱分类器,集思广益,使得整体模型具有较高的精确度和泛化性能。

3.Bagging和Boosting算法的区别 


(1)样本选择:

Bagging:训练集是在原始集中有放回选取的,从原始集中选出的各轮训练集之间是独立的。
Boosting:每一轮的训练集不变,只是训练集中每个样例在分类器中的权重发生变化。而权值是根据上一轮的分类结果进行调整。
(2)样例权重:

Bagging:使用均匀取样,每个样例的权重相等
Boosting:根据错误率不断调整样例的权值,错误率越大则权重越大。
(3)预测函数:

Bagging:所有预测函数的权重相等。
Boosting:每个弱分类器都有相应的权重,对于分类误差小的分类器会有更大的权重。
(4)并行计算:

Bagging:各个预测函数可以并行生成
Boosting:各个预测函数只能顺序生成,因为后一个模型参数需要前一轮模型的结果。
(5)预测结果:

Bagging:趋于降低方差,使模型更稳定。(各个基学习器并行训练,互不干扰,因此每个基学习器的误差实现对独立的。)
Boosting:趋于降低偏差,模型准确率更高。(采用向前分布算法,后一个基学习器需要优化前一个学习器的残差,因此误差越来越小,准确率会更高)
 


http://www.ppmy.cn/news/513581.html

相关文章

随机森林算法

文章目录 1. 随机森林原理1.1 集成学习1.2 Bagging算法1.3 随机森林算法 2. 随机森林算法步骤3. 随机森林特点4. 随机森林的Python应用4.1 RandomForestClassifier随机森林分类4.2 RandomForestRegressor随机森林回归 5. 源码仓库地址 1. 随机森林原理 1.1 集成学习 集成学习…

模糊测试基本介绍

模糊测试基本介绍 覆盖率指引的模糊测试方法获得覆盖率的四种追踪方式1: 使用编译器向基本块边缘插桩,可以准确地插桩并易于优化,但需要源码已知。静态二进制重写,不需要源码,仍在研究,因为静态代码插桩准…

【MTK】【功耗】息屏待机功耗超标

问题背景 【预置条件】进入camera后按home键退出,息屏,紧接着测试息屏功耗即可 【操作步骤】灭屏, 充电到91%开始待机 【实际结果】测试机待机电流大于25mA 【预期结果】平均功耗≤25mA息屏待机功耗一般都是系统那边先做分析,他们会看是哪个模块存在问题…

联想推出ThinkServer DN8836,超大容量存储服务器的性价比首选

联想推出ThinkServer DN8836,超大容量存储服务器的性价比首选 突如其来的新冠疫情让各行各业都看到了利用智能基础架构启动智能化转型,降本增效,优化资源配置的必要性。而从中央到地方近期加紧布局的新基建更是为这一进程按下了加速键。企、事业单位智能化转型的过程中必将产生…

MySQL系列——MySQL8+keepalived双主热备高可用

概述 本次的文章会格外的长,网上大多的配置流程已经不可使用,本篇文章可以称为保姆级教程 如上图,VIP地址为192.168.10.100,如果主机192.168.10.129挂了,会自动切换到备机192.168.10.130上,由于是双主&…

Linux笔记本电脑不省电,Linux 笔记本功耗优化一则

最近 Ubuntu Linux 升级内核之后,功耗增加了。 找了找,发现一个方法可以降低,而且似乎比原来更省电,记录一下。grep enabled /sys/firmware/acpi/interrupts/* 查看中断有没有数量高的恐怖的,我的是 /sys/firmware/acp…

SYD8821低功耗

SYD8821是具有全球领先低功耗(RX 2.4mA -94.5dBm灵敏度,TX 4.3mA 0dBm输出功率)的蓝牙低功耗SOC芯片,在极低电流下实现了优异的射频性能,搭配176kB SRAM,512kB flash,非常适合中高阶可穿戴、智能家居、物联网等低功耗应…

『手撕 Mybatis 源码』08 - 动态代理 invoke 方法

动态代理 invoke 方法 问题 mapperProxy.findByCondition(1); 是怎么完成的增删改查操作? 当通过 JDK 代理方式生成代理对象后,可以通过代理对象执行代理方法 public class MybatisTest {/*** 问题3:mapperProxy.findByCondition(1); 是怎…