R语言机器学习与临床预测模型77--机器学习预测常用R语言包

embedded/2024/11/18 8:34:51/

R小盐准备介绍R语言机器学习与预测模型的学习笔记

你想要的R语言学习资料都在这里, 快来收藏关注【科研私家菜】


01 预测模型常用R包

  • 常见回归分析包:
    rpart 包含有分类回归树的方法; earth 包可以实现多元自适应样条回归;
    mgev包含广义加性模型回归; Rweka 包中的MSP函数可用于回归。pls 包中的plsr 函数实
    现偏最小二乘和主成分回归。stats 包中的ppr函数实现投影寻踪分析,同时包括线性回归的
    方法,含有loess函数用于拟合多样式曲面。MASS包含有岭回归函数lm.ridge、阻力回归函
    数lqs、稳健回归函数rlm。Lars 包实现了lasso 回归。Locfit 包可实现局部回归。bigRR包关
    注于高吞吐量岭回归。
  • 集成学习相关包:
    ipred包里面有bagging方法做预测;mboost包里面有boosting方法做预测; randomForest 包为随机森林方法; caretEnsemble 包含创建组合模型的方法; caret 包包含bagging的框架。
  • 高斯过程相关的包:
    tgp包基于贝叶斯树的高斯过程回归; gpr 包包含高斯过程回归函数。
  • 时间序列预测相关包:
    mAr包可用子多元自回归分析; MSBVAR包含有贝叶斯向量自回归模型; timsac 是时间序列分析和控制的包; tseries forecast包用于时间序列预测; tsDyn 包用于多元时间序列预测; fractal 包含有分形时间序列分析方法。
  • 神经网络相关包:
    nnet 包含有神经网络回归函数; RSNNS包提供了各种神经网络的函数;
    AMORE包用于神经网络的建模。
  • 支持向量机相关包:
    svmpath包里的函数可用来选取支持向量机的代价参数C; kermnlab 包含有支持向量机相关函数; e1071 包含有支持向量机的方法。
  • 特征选择相关包:
    varSelRF 包用于特征选择; randomForest 包可用于特征选择; Caret 包的
    gafs函数,用于特征提取。
  • 蒙特卡洛相关包:
    MCMCpack、mc2d 用于二维蒙特卡罗模拟、mcmc包随机数生成与蒙特卡
    洛模拟基本方法; boa. memcplots、coda用于蒙特卡洛模拟诊断; csampling、elrm. MCMCglmm实现基于模拟的回归分析。
  • 状态空间模型相关包:
    MARSS包含有多元自回归状态空间模型相关函数;dse.FKF、KFAS这些包用于卡尔曼滤波。
  • 其他用于预测的包:
    frbs 包实现了许多用于回归和分类、从数据中学习模糊规则系统的标准方法; h2o 包含有深度学习的方法。

02 R语言预测示例

#读入数据
library(forecast)
acf(wineind,lag.max = 100)
#观察曲线簇
len=1993-1980+1
data0=wineind[1:12*len]
range0=range(data0)+c(-100,100)
plot(1:12,1:12,ylim=range0,col='white', xlab="月份", ylab="销量")
for(i in 1:len)
{points(1:12,wineind[(12*(i-1)+1):(12*i)])RecentVal4=NULL
RecentVal6=NULL
RecentVal8=NULL
RecentVal12=NULL
#替换掉太大或太小的值
wineind[wineind<18000]=18000
wineind[wineind>38000]=38000
for(i in (12+1):(length(wineind)-1))
{Month<-c(Month,i%%12+1)DstValue<-c(DstValue, wineind[i+1])RecentVal1<-c(RecentVal1,wineind[i])RecentVal4<-c(RecentVal4,wineind[i-3])RecentVal6<-c(RecentVal6,wineind[i-5])RecentVal8<-c(RecentVal8,wineind[i-7])RecentVal12<-c(RecentVal12,wineind[i-11])
}
preData=data.frame(Month,DstValue,RecentVal1,RecentVal4,RecentVal6,RecentVal8,RecentVal12)
head(preData)
#画出散点矩阵图
plot(preData)
#使用DstValue与RecentVal12拟合线性模型
lm.fit=lm(DstValue~RecentVal12,data=preData)
cook<-cooks.distance(lm.fit)
plot(cook)
abline(h=0.15,lty=2,col='red')
cook[cook>0.15]
preData=preData[-c(123,79),]#分离训练集与测试集
trainData=preData[1:150,]
testData=preData[151:163,]#建立模型
lm.fit<-lm(DstValue~Month+RecentVal1+RecentVal4+RecentVal6+RecentVal8+RecentVal12,data=trainData)
summary(lm.fit)#对Month、RecentVal4、RecentVal8三个变量按5次多项式进行衍生
lm.fit<-lm(DstValue~Month+I(Month^2)+I(Month^3)+I(Month^4)+I(Month^5)+ RecentVal1+RecentVal4+I(RecentVal4^2)+I(RecentVal4^3)+I(RecentVal4^4)+I(RecentVal4^5)+ RecentVal6+RecentVal8+I(RecentVal8^2)+I(RecentVal8^3)+I(RecentVal8^4)+I(RecentVal8^5)+ RecentVal12,data=trainData)
summary(lm.fit)#由于涉及到变量太多,使用逐步回归删除掉影响小的变量
lm.fit<-step(lm.fit)
summary(lm.fit)lm.fit<-lm(formula = DstValue ~ Month + I(Month^4) + I(Month^5) + RecentVal6 + RecentVal8 + I(RecentVal8^2) + I(RecentVal8^3) + I(RecentVal8^4) + I(RecentVal8^5) + RecentVal12, data = trainData)
summary(lm.fit)#对新数据进行预测
testData$pred=predict(lm.fit,testData)
#计算百分误差率
testData$diff=abs(testData$DstValue-testData$pred)/testData$DstValue
testDatasummary(testData)

效果如下:



关注R小盐,关注科研私家菜(VX_GZH: SciPrivate),有问题请联系R小盐。让我们一起来学习 R语言机器学习与临床预测模型



喜欢的朋友记得点赞、收藏、关注哦!!!


http://www.ppmy.cn/embedded/138484.html

相关文章

JavaWeb之AJAX

前言 这一节讲JavaWeb之AJAX 1.概述 以前我们在servlet中得到数据&#xff0c;必须通过域给jsp&#xff0c;然后jsp在响应给浏览器 纯html不能获取servlet返回数据 所以我们用jsp 但是现在我们可以同AJAX给返回数据了 我们可以在sevlet中直接通过AJAX返回给浏览器 html中的J…

【HarmonyOS】应用实现读取剪切板内容(安全控件和自读取)

【HarmonyOS】应用实现读取粘贴板内容(安全控件和自读取) 前言 三方应用 读取系统剪切板是比较常见的功能。可以实现功能入口的快捷激活跳转&#xff0c;以及用户粘贴操作的简化&#xff0c;增强用户的体验感。 但是在用户日渐注重隐私的今天&#xff0c;系统对于剪切板权限的…

01_Spring开胃菜

一、 为什么是Spring? 在正式进入Spring内容前我们先看看我们以往经典的程序设计。 当我们去登录时,会调用后端的Controller,Controller接收到用户的请求后会调用业务层的Service进行登录的业务处理,Service业务处理过程中会调用Dao层向DB获取数进行判断。 接下来我们用代…

软考教材重点内容 信息安全工程师 第 3 章 密码学基本理论

&#xff08;本章相对老版本极大的简化&#xff0c;所有与算法相关的计算全部删除&#xff0c;因此考试需要了解各个常 用算法的基本参数以及考试中可能存在的古典密码算法的计算&#xff0c;典型的例子是 2021 和 2022 年分别考了 DES 算法中的 S 盒计算&#xff0c;RSA 中的已…

c ++零基础可视化——数组

c 零基础可视化 数组 一些知识&#xff1a; 关于给数组赋值&#xff0c;一个函数为memset&#xff0c;其在cplusplus.com中的描述如下&#xff1a; void * memset ( void * ptr, int value, size_t num );Sets the first num bytes of the block of memory pointed by ptr to…

爬虫策略与反爬机制——爬虫常见策略

随着网络爬虫技术的日益发展&#xff0c;反爬机制也变得越来越复杂&#xff0c;网站和服务商不断加强对爬虫行为的监控和限制&#xff0c;开发者需要采取一系列有效的爬虫策略来提高爬虫的效率并规避反爬措施。本章将介绍一些常见的爬虫策略&#xff0c;帮助开发者应对不同情况…

POUF: Prompt-oriented unsupervised fine-tuning for large pre-trained models

Motivation 通过提示,大规模预训练模型变得更具表现力和强大,近年来引起了人们的极大关注。虽然这些大型模型具有zero-shot能力,但一般来说,仍然需要标记数据来使它们适应下游任务。为了克服这一关键限制,我们提出了一个无监督微调框架,直接对模型进行微调或对未标记的目…

python核心语法(二)

第三节 类型转换 0.布尔值转换 使⽤⼀个内置函数bool()。 # 以下值都为True bool(2) bool(-1) bool(255) bool(0.1000001) bool(-99.99888) # 下⾯的值为False bool(0) bool(0.0)对于数值类型&#xff0c;所有的⾮零值转换为True, 只有零值才转换为False.字符串也可以转换为…