决策树和随机森林介绍

news/2024/9/18 14:52:57/ 标签: 决策树, 随机森林, 算法

hello大家好,俺是没事爱瞎捣鼓又分享欲爆棚的叶同学!!!今天我来给大家介绍一下决策树随机森林,说起随机森林俺还有件很久远的丑事,之前有关课的结课作业就是用模型训练并预测,那时我比较天真,想着先玩,然后随便在网上找个代码糊弄糊弄就行了,然后到答辩那天我站在讲台上说出:“本次预测用了随机森林”,讲的绘声绘色,那自信的差点把自己都骗了哈哈哈哈,然后俺讲完,老师点评时,望着手中的报告笑着说了句:“你这代码里也没涉及随机森林啊!?!?怎么回事啊!?”,我心想(啊?完蛋!开摆!)然后厚着脸皮礼貌的笑了笑说:“哎!那不知道哎......“, 然后老师也很善解人意的放过了我哈哈哈哈!噗嗤又扯了这么多,下面进入正题哈!!!

一.决策树:像问问题做决定

就和你在打 “某者荣耀” ,需要根据对面阵容出装备。你就可以通过一系列问题来做决定。比如,你先问自己:“对面有没有高爆发的物理输出的?”如果有,你可能会出反甲或不祥征兆来提高物理防御。接着你再看:“对面有很老6的法师没?”如果有,你可能会选择魔女斗篷或破魔刀来增强魔抗。如果发现对面控制技能很多,你可能会考虑出辉月或净化来规避致命的控制......。通过这一系列问题,你一步步分析对面阵容,选择最佳装备来应对,帮助自己和团队取得胜利。

这就是决策树的工作方式。它通过不断问问题(这些问题就是你的数据里的“特征”),一步步缩小范围,直到得出最终结论。

决策树的优点

  • 直观简单:像玩游戏一样,易于理解。
  • 直接使用数据:几乎不需要复杂的数据预处理。

决策树的缺点

  • 容易过拟合:如果问题太多、问得太细,可能会对训练数据依赖过度,从而导致在新数据上表现不佳。
  • 不稳定:小的变化可能导致整棵树的结构和结果发生变化。

二.随机森林:集思广益,避免偏见

单一的决策树有时会“想太多”或“走偏”,这时我们可以依靠多个树的集体智慧。这就是随机森林的核心思想。

随机森林就是让很多棵决策树(通常几十到几百棵)一起工作,每棵树独立思考,然后通过投票决定最终答案。

随机森林有两个重要策略:

  1. 随机抽样:每棵树都从原始数据中随机抽取一部分样本来训练,这让每棵树看到的数据不同,每个“专家”都有自己独特的视角。
  2. 随机选择特征:在每个节点分裂时,每棵树只随机选择一部分特征来考虑,这让每棵树的决策过程各不相同。

为什么随机森林更聪明?

  • 避免单一思考:每棵树独立思考,避免了单一决策树可能陷入的“过拟合”问题。
  • 集体智慧:通过结合多棵树的判断,最终结果更加可靠和准确。
举个例子

假设你是一位班主任,要预测学生的期末成绩。你有学生的出勤率、作业完成情况、平时测验成绩等信息。你可以用一棵决策树来做预测,但它的准确性可能有限。如果你使用100棵决策树,每棵树基于不同的信息和数据做出预测,然后结合所有树的结果,你就得到了一个随机森林模型。这样,预测结果会更准确,因为它结合了多个“专家”的意见。

三.总结

决策树就像是一个喜欢问问题的小专家,它通过一步步提问来做出决策。但它有时会过度依赖训练数据,导致在新问题上表现不佳。随机森林则由许多这样的“小专家”组成,他们各自独立思考,然后结合大家的意见,最终做出更准确的决策。

使用随机森林,你能得到更稳定、更靠谱的预测结果,这也是它在数据分析和机器学习任务中广受欢迎的原因。

希望能让你对决策树随机森林有进一步的了解!!!


http://www.ppmy.cn/news/1517111.html

相关文章

OpenCV(第二关--读取图片和摄像头)实例+代码

以下内容,皆为原创,制作不易,感谢大家的关注和点赞。 一.读取图片 我们来读取图片,当你用代码读取后,可能会发现。怎么跟上传的图片颜色有些许的不一样。因为OpenCV的颜色通道是BGR,而我们平常用的matplotl…

百日筑基第六十天-学习一下Tomcat

百日筑基第六十天-学习一下Tomcat 一、Tomcat 顶层架构 Tomcat 中最顶层的容器是 Server,代表着整个服务器,从上图中可以看出,一个 Server可以包含至少一个 Service,用于具体提供服务。Service 主要包含两个部分:Conn…

Flask SQLALchemy 的使用

Flask SQLALchemy 的使用 安装 Flask-SQLAlchemy配置 Flask-SQLAlchemy定义模型创建数据库和表插入和查询数据更新和删除数据迁移数据库总结Flask-SQLAlchemy 是一个 Flask 扩展,它简化了 Flask 应用中 SQLAlchemy 的使用。SQLAlchemy 是一个强大的 SQL 工具包和对象关系映射(…

【AI智能体】在AI浪潮中,程序员如何在这复杂的环境中生存下去

在这个瞬息万变的时代,人工智能(AI)如同一阵狂风,席卷了各行各业,尤其是程序员这一群体。面对AI的迅猛发展,程序员们不仅要适应新的技术潮流,更要在这场变革中找到自己的立足之地。如何在AI浪潮…

Shader笔记:光照与阴影1

引:旋转动画(三角函数) float3 rotationY(float3 vertex){float c cos(_Time.y*_Speed);float s sin(_Time.y*_Speed);float3x3 m {c,0,s,0,1,0,-s,0,c};return mul(m,vertex); } v2f vert (a2v v) {v2f o;o.pos UnityObjectToClipPos(r…

Charles苹果手机https抓包

1、电脑设置Charles代理端口 1)设置代理端口 Proxy-》Proxying Settings-》HTTP Proxy 设置端口 2)设置监控的代理地址 Proxy-》SSL Proxying Settings 添加Add允许所有地址*.* 2、电脑导入Charles的ssl证书 3、电脑查看Charles的IP地址和端口 4、手机无线wifi配置代理 5、手…

Vue3常见知识**MS【4】

一、vue2和vue3的区别 1、数据绑定原理不同 vue2:数据绑定是利用ES5的一个API:Object.definePropert() 对数据进行劫持,结合发布订阅模式的方式来实现的。 vue3:使用了ES6的Proxy API对数据代理。相比vue2.x,使用proxy…

【Java设计模式】Builder模式:在Java中清晰构建自定义对象

文章目录 【Java设计模式】Builder模式:在Java中清晰构建自定义对象一、概述二、Builder设计模式的意图三、Builder模式的详细解释及实际示例四、Java中Builder模式的编程示例五、Builder模式类图六、Java中何时使用Builder模式七、Builder模式Java教程八、Builder模…

【Linux篇】Linux的压缩与解压

1. 压缩格式 市面上有非常多的压缩格式: zip格式:Linux,win,MacOS,常用7zip:win常用rar:win常用tar:Linux,MacOS常用gzip:Linux,MacOS常用 如何…

C++_ch07_visual studio调试代码

C_ch07_visual studio调试代码 1.1 Break Point 断点就是程序执行到这里就会暂停,一个程序可以设置很多短点。在visual studio中只需要点击侧栏就可以设置断点。 点击左边的栏目,出现红点就是设置的断点。 另外要确保打断点的位置必须是可执行的代码&…

WordPress美化节日灯笼插件,适合春节的时候使用

源码介绍: WordPress美化节日灯笼插件,适合每年过年的时候安在网站上使用,这款插件可以备用着,一款WordPress节日灯笼美化插件,可以给网页自动加一个灯笼效果使用说明:到网站WP后台 - 插件 - 安装插件 - 上…

【学术会议征稿】第六届智能控制、测量与信号处理国际学术会议 (ICMSP 2024)

第六届智能控制、测量与信号处理国际学术会议 (ICMSP 2024) 2024 6th International Conference on Intelligent Control, Measurement and Signal Processing 文化是人类社会相对于经济和政治的精神活动和产物。传统的人类观念认为,文化是一种社会现象&#xff0…

CDGA|数据治理:统一数据标准成为核心关切

在数字化转型浪潮席卷全球的今天,数据已成为企业最宝贵的资产之一,其价值不言而喻。然而,随着数据量呈爆炸式增长,数据来源多样化、格式不一、质量参差不齐等问题日益凸显,给企业的数据管理和利用带来了前所未有的挑战…

C语言基础(二十)

链表是一种常见的数据结构,通常用来存储一系列元素,每个元素由一个节点来表示。在链表中,每个节点包含两部分:数据元素本身和指向下一个节点的指针。这种结构使得链表中的元素在内存中不是连续存储的,而是通过指针连接…

电商支付异常处理分享

时间:2024年08月28日 作者:小蒋聊技术 邮箱:wei_wei10163.com 微信:wei_wei10 音频地址:https://xima.tv/1_1qSvgv?_sonic0 希望大家帮个忙!如果大家有工作机会,希望帮小蒋内推一下&#x…

Spring Boot如何压缩Json并写入redis?

1.为什么需要压缩json? 由于业务需要,存入redis中的缓存数据过大,占用了10G的内存,内存作为重要资源,需要优化一下大对象缓存,采用gzip压缩存储,可以将 redis 的 kv 对大小缩小大约 7-8 倍&…

如何考取PostgreSQL认证证书?

PostgreSQL数据库炙手可热,国内知名的腾讯云TDSQL、阿里云PolarDB都有PostgreSQL版本的产品,还有人大金仓、华为opengauss、翰高数据库等都跟PostgreSQL有关系,所以考一个PostgreSQL认证非常有必要。要获得PostgreSQL认证,可以从以…

PTA - C语言国庆题集1

目录 7-1 阶梯电价7-2 求矩阵的最大值(设惟一)7-3 换硬币(鸡兔同笼)7-4 逆序输出一个整数的各位数字7-5 交换最小值7-6 分段函数27-7 数组中能被5整除的数的和7-8 统计字母出现的次数(hash思想)7-9 字母三角…

openEluer安装软件提示系统缺少的一些库的解决

mysql客户端相关的坑 问题:mysql: error while loading shared libraries: libncurses.so.5 解决: ln -s /usr/lib64/libncurses.so.6 /usr/lib64/libncurses.so.5 问题:mysql: error while loading shared libraries: libtinfo.so.5 解决…

npm阿里云制品仓库

配置 配置仓库地址,可以再在仓库指南看到 npm config set registryxxxxx#登录,帐户密码可以在仓库指南看到 npm login注意:npm>9的版本npm login目前有问题 verbose web login not supported, trying couch,暂时没试验到解决…