pm3包1.4版本发布----一个用于3组倾向性评分的R包

news/2025/1/11 13:57:09/

目前,本人写的第二个R包pm3包的1.4版本已经正式在CRAN上线,用于3组倾向评分匹配,只能3组不能多也不能少。
可以使用以下代码安装

install.packages("pm3")

在这里插入图片描述
什么是倾向性评分匹配?倾向评分匹配(Propensity Score Matching,简称PSM)是一种统计学方法,用于处理观察研究(Observational Study)的数据,在SCI文章中应用非常广泛。在观察研究中,由于种种原因,数据偏差(bias)和混杂变量(confounding variable)较多,倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响,以便对实验组和对照组进行更合理的比较。
为什么需要做倾向评分匹配?
我们知道RCT的证据力度高,是因为对患者进行了严格的筛选。我们的回顾性研究都是过去的数据,很难像RCT一样进行严格的筛选出两组患者基线相近的基础资料,但我们可以通过倾向评分匹配把回归性的数据进行筛选,把基线资料相近的患者进行匹配,得到近似RCT的效果。
应用场景
 1.基线资料不平
 2.开展病例对照研究病阳性例数较少,如罕见病研究
 3.将众多混杂因素变为一个变量:倾向值
以下为一个实例,没进行匹配前两组患者基线资料相差很大,进行倾向评分匹配后,基线资料近似一致了
在这里插入图片描述
1.4版本版本修正了上一个版本的一些错误,上次版本的教程写得不是很满意,这次我从新写一下我们先来看一下pm3函数

pm3 <-function(data,x,y,covs,factor,CALIP)

这里有6个参数,data就是你的数据,x就是你要比较匹配的变量,你可以使用字符也可以使用数字,但是你如果使用数字来表示的话必须是1,2,3,使用0,1,2或者其他的数列都会报错。我们这里是race,y是你要比较的结局变量,covs是协变量的意思,填入你模型模型中的协变量,也就是你要匹配的基线指标,包括连续的和分类的,factor填入变量后会把你数据中的分类变量转成因子,CALIP是卡钳的意思,不填的话默认是0.5.下面我继续以R包自带的早产数据来演示一下,先导入R包和数据

library(pm3)
bc<-prematurity

在这里插入图片描述
这是一个关于早产低体重儿的数据(公众号回复:早产数据,也可以获得该数据),低于2500g被认为是低体重儿。数据解释如下:low 是否是小于2500g早产低体重儿,age 母亲的年龄,lwt 末次月经体重,race 种族,smoke 孕期抽烟,ptl 早产史(计数),ht 有高血压病史,ui 子宫过敏,ftv 早孕时看医生的次数,bwt 新生儿体重数值。

假设我们研究的是有不同种族(race)对生出低体重儿(low)的影响。需要对3个种族进行基线资料倾向评分匹配

现在我们不需要像既往一样进行一大堆复杂操作,直接一句话代码,就搞定了

g<-pm3(data=bc,x="race",y="low",covs=c("age","lwt","ptl"),factor=c("ui","low"))

在上一个版本中,factor变量最少要取2个,现在没有限制了,取一个也可以生成数据。重要的事说两遍,x就是你要比较匹配的变量,你可以使用字符也可以使用数字,但是你如果使用数字来表示的话必须是1,2,3,使用0,1,2或者其他的数列都会报错。

g<-pm3(data=bc,x="race",y="low",covs=c("age","lwt","ptl"),factor=c("ui"))

在这里插入图片描述
我们把mbc提取出来

mbc<-g[["mbc"]]

进行匹配,这里就过一遍代码了,详细的可以看上一篇

library(tableone)
allVars <-c("age", "lwt", "ptl","ht")
fvars<-c("ht")
tab2 <- CreateTableOne(vars = allVars, strata = "race" ,
data = bc, factorVars=fvars,addOverall = TRUE )
print(tab2,smd = TRUE)
tab1 <- CreateTableOne(vars = allVars, strata = "race" ,
data = mbc, factorVars=fvars,addOverall = TRUE )
print(tab1,smd = TRUE)

在这里插入图片描述
在上一个版本中,有粉丝遇到过错误
Error in if ((absDist12 + absDist13) < mindis) { : missing value where TRUE/FALSE needed
在本次R包也进行了修正,消除了错误,这是使用粉丝数据进行的匹配
在这里插入图片描述
我们可以看到,匹配后效果很好,大部分变量基本上都P大于0.05了。由于pm3包使用的是for循环进行匹配,速度还是有点慢,我试了一下,数据量在1万的数据大概需要1分钟左右,接下来想使用apply函数来改写它,让它速度更快点,再来就是看看优化一下代码,开发1:2:2的匹配功能。


http://www.ppmy.cn/news/32597.html

相关文章

Python并发与并行

python的多线程因为GIL锁的原因是一个伪多线程 python2:100字节码或I/O阻塞进行切换python3&#xff1a;I/O阻塞进行切换&#xff0c;移除了100字节码切换 1、并发与并行 并行&#xff1a;多个程序同时运行 并发&#xff1a;伪并行&#xff0c;看起来是同时并行&#xff0c;…

SpringMVC拦截器

SpringMVC拦截器 1.什么是拦截器 SpringMVC的处理器拦截器类似于Servlet开发中的过滤器Filter,用于对处理器进行预处理和后处理。开发者可以自己定义一些拦截器来实现特定的功能。 **过滤器与拦截器的区别&#xff1a;**拦截器是AOP思想的具体应用。 过滤器 servlet规范中…

嵌入式软件开发之Linux下C编程

目录 前沿 Hello World&#xff01; 编写代码 编译代码 GCC编译器 gcc 命令 编译错误警告 编译流程 Makefile 基础 何为 Makefile Makefile 的引入 前沿 在 Windows 下我们可以使用各种各样的 IDE 进行编程&#xff0c;比如强大的 Visual Studio。但是在Ubuntu 下如何进…

【Kubernetes】第二十八篇 - 实现自动构建部署

一&#xff0c;前言 上一篇&#xff0c;介绍了 Deployment、Service 的创建&#xff0c;完成了前端项目的构建部署&#xff1b; 希望实现&#xff1a;推送代码 -> 自动构建部署-> k8s 滚动更新&#xff1b; 本篇&#xff0c;实现自动构建部署 二&#xff0c;推送触发构…

【C++学习】类和对象(中)一招带你彻底了解六大默认成员函数

前言&#xff1a;在之前&#xff0c;我们对类和对象的上篇进行了讲解&#xff0c;今天我们我将给大家带来的是类和对象中篇的学习&#xff0c;继续深入探讨【C】中类和对象的相关知识&#xff01;&#xff01;&#xff01; 目录 1. 类的6个默认成员函数 2. 构造函数 2.1概念介…

yolov8命令行运行参数详解

序言 整理来自yolov8官方文档常用的一些命令行参数&#xff0c;官方文档YOLOv8 Docs yolov8命令行的统一运行格式为&#xff1a; yolo TASK MODE ARGS其中主要是三部分传参&#xff1a; TASK(可选) 是[detect、segment、classification]中的一个。如果没有显式传递&#xf…

预防ddos攻击选择互联网服务提供商还是专业的ddos防护服务商

随着越来越多的企业进行互联网转型&#xff0c;DDoS (分布式拒绝服务) 攻击也活跃许多。但是大部分企业都依靠他们的互联网服务提供商 (ISP) 来缓解 DDoS 攻击&#xff0c;因为这项服务通常作为 ISP 现有带宽产品的相对低成本的附加服务。黑客非常了解这一点&#xff0c;因此他…

SpringBoot项目切面编程

SpringBoot项目切面编程什么是切面专业术语解释&#xff1a;通俗解释使用Aspect进行切面编程注解说明使用过程Demo什么是切面 专业术语解释&#xff1a; 在软件业&#xff0c;AOP为Aspect Oriented Programming的缩写&#xff0c;意为&#xff1a;面向切面编程&#xff0c;通…