3决策树随机森林与深度学习

news/2024/12/5 4:46:10/

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 一、Deep Neural Decision Forests
  • 二、Deep Forest
  • 阅读参考

关于决策树随机森林与深度学习,以两篇论文为切入,作简要分析。
作者的研究动机,和经典的Decision Tree的关系,方法的Limits或适用的场景(给出自己的分析)。希望得到纠正和补充。


一、Deep Neural Decision Forests

***研究动机:***一些学者对随机森林中表示学习的早期形式进行尝试,但它们的预测精度仍然低于最先进的水平。传统模型的拟合能力非常强,但是需要人工提取一些非常强力的特征,而CNN又以其超强的图片特征提取能力而著称。卷积神经网络提供特征,决策树(森林)提供分类。传统方法与深度学习结合进行端到端的训练,随机森林作为深度神经网络最后一层的分类器(代替了原来的Softmax层)。
***关系:***在传统的决策树中,分裂节点是二值的,即它决定了经过这个节点以后是向左分支走还是向右分支走,并且这个结果是一旦决定就不可更改的。这就导致网络有可能在当前node是最优的(根据info-gain的原则)但是最后的分类效果并不是最优的。因此本文考虑“概率”决策树,即每个node的分裂是一个概率。
Limits:由于反向传播,损失还需可微。
适用的场景:图像分类,语义分割。提供了一个全局最优策略来估计在叶子中所采取的预测。不需要大量额外超参数

二、Deep Forest

***研究动机:***目前的深度学习模型大多建立在神经网络之上,即可以通过反向传播进行训练的多层参数化可微非线性模块。本文探讨了基于决策树等不可微模块构建深度模型的可能性关系。
关系: 是一种决策树的集成方法。传统的学习模型决策树,与dnn区别因素在于,与生成新特征的dnn相比,决策树和助推机在学习过程中总是对原始特征表示进行工作;换句话说,没有模型内的特征转换。此外,与具有任意高模型复杂度的DNNs相比,决策树和增强机器只能具有有限的模型复杂度。虽然模型的复杂性本身并不能导致dnn的成功,但它仍然很重要,因为如果想要利用大的训练数据,就需要大的模型容量。
***Limits:1未来的一个重要问题是增强特性的重新表示过程。gcForest的当前实现采用了最简单的类向量形式,即相关实例所属的叶节点上的类分布。当原始特征向量是高维的时,这样少量的增强特征很容易被淹没。
2随机森林不适合gpu,对设备计算要求高。
适用的场景:图像分类、面部识别、音乐分类、手移动识别、语义分割、低维数据、高维数据。小规模数据中也能很好地工作,并使用户能够根据计算量控制训练成本,超参数也较少。当dnn并不优越时,它提供了一种替代方案。有很多任务,特别是分类/符号或混合建模任务。


阅读参考

https://blog.csdn.net/helei001/article/details/50777478
https://blog.csdn.net/wangqingbaidu/article/details/52575042
https://blog.csdn.net/weixin_43595430/article/details/105369697
https://blog.csdn.net/loading_123/article/details/78860344


http://www.ppmy.cn/news/592757.html

相关文章

全网独家--【图像色彩增强】方法梳理和问题分析

文章目录 图像增强图像色彩增强问题可视化比较 难点色彩空间大,难以准确表征?不同场景差异大,难以自适应?计算量大,但应用场景往往实时性要求高? 方法传统方法深度学习逐像素预测3D LUT模仿ISP 个人思考批判…

在线分析|在线做随机森林分析

今天小编给大家介绍的是TUTU(https://www.cloudtutu.com/)网站上新添的randomforest2分析,即随机森林模型分析。目前平台上有两个随机森林的分析,如下图,小伙伴们可根据自己的需求选择对应的工具。 ​ 随机森林&#…

森林防火综合解决方案

森林防火的原则要求是:“积极预防、早发现、早出动、早扑灭”,目前森林防火的手段主要有传统人防、普通监控和智能化自动监控这三种。传统人防手段只能靠护林员对重点时段、重点区域野外火源进行人工巡查,不具备全时、全天候、全地形的监测能…

随机森林算法(Random Forest)Python实现

目录 前言 一、什么是Random Forest ? 1.1 什么是监督式机器学习? 1.2 什么是回归和分类?

基于随机森林算法的人脸数据集分类

目录 1. 作者介绍2. 关于理论方面的知识介绍随机森林3. 实验过程3.1 数据集介绍3.2 实验代码3.3 运行结果3.3 实验总结 参考 1. 作者介绍 李佳敏,女,西安工程大学电子信息学院,2021级研究生 研究方向:模式识别与人工智能 电子邮件…

随机森林 – Random forest

随机森林 – Random forest 随机森林是一种由决策树构成的集成算法,他在很多情况下都能有不错的表现。 本文将介绍随机森林的基本概念、4 个构造步骤、4 种方式的对比评测、10 个优缺点和 4 个应用方向。 什么是随机森林? 随机森林属于 集成学习 中的 …

保姆级随机森林算法Python教学

摘要 机器学习算法是数据挖掘、数据能力分析和数学建模必不可少的一部分,而随机森林算法和决策树算法是其中较为常用的两种算法,本文将会对随机森林算法的Python实现进行保姆级教学。 0 绪论 数据挖掘和数学建模等比赛中,除了算法的实现&…

meta分析的森林图不会画?看这里

欢迎关注”生信修炼手册”! metasoft是一款对多个study的GWAS分析结果进行meta分析的工具,该软件执行速度快,而且配套了画森林图的工具,非常的方便,官网如下 http://genetics.cs.ucla.edu/meta/ 在处理不同study的异质性时&#x…