模型树--M5

news/2025/2/11 20:50:11/
模型树推广了回归树的概念,它与回归树的2个重要不同在于:
  1. 叶节点上不是常量,而是一个线性函数模型。
  2. 分割空间的标准不是降低平方误差,而是降低样本标准差。
相比于回归树,模型树的优点在于:回归树的计算量随着维度的增加而迅速增加,但模型树比模型小得多,所以模型树在处理高维(数百)数据时会比较轻松。由于叶节点是采用的是线性函数而非常量,所以预测的精度更高。
M5模型树划分的标准是:将一个节点覆盖的样本的Y值(即目标属性值)的标准差看作误差的度量。计算SDR(standard deviation reduction)

T是到达该节点的实例的集合,|T|表示集合的大小,sd表示标准差,T i 是第i个子树上的实例集合,一般采用的模型树是都是二叉树,所以i的取值只有1和2。
最佳划分s*从候选划分集合S中取得,并且使得SDR最大。如何求得S呢?跟在回归树中的方法一样,按某一个属性对实例进行排序,只要相邻的两例在该属性上不相等,就在它们之间切开。一个属性上最多有n-1种切分方式,n是实例的个数。
树停止生长的条件有2个:
  1. 节点包含的样本数小于一个阈值。
  2. 节点包含样本的Y值标准差与全体样本Y值标准差的比值小于一定阈值。
在叶节点上,对本节点包含的实例利用线性回归算法产生一个多元回归方程,得到线性模型。
剪枝是一个bottom-up的递归过程,利用线性回归方法拟合出每个节点的回归方程,计算出回归函数预测的均方误差:

计算每个节点到其子节点的MSE的减小量:

E R 大于0时该子树保留,否则将该子树转变成一个叶子节点。
剪枝后树叶节点上邻近线性模型之间就会出现尖锋的不连续性,使用平滑算法修改相邻的线性方程,使得对应于不同方程的相邻输入向量的预测输出值变得接近。对于较少训练实例构造的模型,平滑过程尤其重要。

f parent 为叶子上级父结点拟合方程,f child 为叶子结点拟合方程,n 为到达本叶子结点的训练样本数目,k 为一个常数(通常取值15),f new 为合并的方程。若子结点采用新函数后的R MSE 变化小于一定的阈值,则用f new  取代子结点的线性方程,否则不进行平滑处理。


http://www.ppmy.cn/news/328386.html

相关文章

没学过绘画的人怎么开始数码板绘

作者:goei 链接:https://www.zhihu.com/question/24383344/answer/27685293 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 好几年前写的答案,有些东西现在看来讲得不准确&#xff…

美图android手机刷机教程视频,美图M6刷机教程 美图M6线刷救砖教程

一:线刷救砖准备工作: ①下载并解压MTK刷机工具:点击下载→MTK工具 ②下载并安装刷机驱动,驱动在MTK刷机工具里面,请选择相匹配的驱动进行安装。 ③下载并解压从刷机帮上下载的美图 M6线刷包:点击下载→美图…

试着用Eclipse M6

周六的时候,M6还没有发布。周日不上班,何况更重要的是丁俊辉打Hendry,顾不上Eclipse了。 周一一早上班,终于看到M6发布了,一边下载,一边看看New and Noteworthy, 没有什么太多的新东西,值得兴…

M1、M2、M3、M4、M5、M6、M7硅整流二极管、型号参数、如何判断贴片二极管的好坏?

笔者电子信息专业硕士毕业,获得过多次电子设计大赛、大学生智能车、数学建模国奖,现就职于南京某半导体芯片公司,从事硬件研发,电路设计研究。对于学电子的小伙伴,深知入门的不易,特开次博客交流分享经验&a…

微服务框架

流量入口Nginx 在上图中可以看到,Nginx作为整个架构的流量入口,可以理解为一个外部的网关,它承担着请求的路由转发、负载均衡、动静分离等功能。作为一个核心入口点,Nginx肯定要采用多节点部署,同时通过keepalived来实…

智能与计算 - 李航 - 阅读摘要

智能与计算 - 李航 - 阅读摘要 原文阅读于中国计算机学会通讯 / 机器之心 摘要:本文对计算与思考 (或智能) 这个话题进行简单综述与讨论。人工智能的目标是要构建能够“思考”和“行动”的机器。 关键词:脑科学 认知科学 心智计算理论 体验认知理论 …

《人工智能》之《知识表示方法》

教材:《人工智能及其应用》,蔡自兴等,2016m清华大学出版社(第5版) 参考书: 《人工智能》之《知识表示方法》 1 状态空间法(State Space Representation)1.1 问题状态描述1.2 状态…

智能算法综述

1、什么是智能算法 智能计算也有人称之为“软计算”,是们受自然(生物界)规律的启迪,根据其原理,模仿求解问题的算法。从自然界得到启迪,模仿其结构进行发明创造,这就是仿生学。这是我们向自然界…