结合了传统因果推断与机器学习的因果机器学习是目前AI+领域的前沿研究方向,其核心优势在于将因果逻辑融入数据驱动模型,从根本上解决了传统方法的缺陷。因此,它也是突破传统机器学习瓶颈的关键方向,不仅当下热度高,在未来几年仍会是研究热点。
今年,我们关于因果机器学习的创新可围绕动态建模、高维数据处理、无监督学习与跨领域应用这些方面展开,比如结合深度学习与稀疏因果图,开发轻量化混杂控制方法...既有理论深度又有实际价值,故事编好发高区问题不大。
当然,还是建议大家多关注顶会顶刊中相关的最新工作,结合一些具体领域(比如医疗)来展开。我这边整理好了12篇因果机器学习最新论文,大家需要参考的可直接领取。
全部论文+开源代码需要的同学看文末
Inferring heterogeneous treatment effects of crashes on highway traffic: A doubly robust causal machine learning approach
方法:本文提出了一种新颖的因果机器学习框架,通过Doubly Robust Learning方法估计交通事故对高速公路车速的异质性因果效应,解决了因果效应估计中的选择偏差和变量选择问题。
创新点:
-
提出了一个新的因果机器学习框架,用于估计不同类型交通事故对高速公路速度的异质因果效应。
-
基于因果图理论,提出了条件Shapley值指数(CSVI),用于筛选不利变量,从而提高因果效应估计的精度和可靠性。
-
为应对缺乏反事实数据的问题,设计了一种匹配算法以选择“反事实结果”,用于计算误差指标。
Causal machine learning for predicting treatment outcomes
方法:论文探讨了因果机器学习在个性化医疗中的潜力,通过从真实世界数据中估计治疗效果,弥补传统随机对照试验的不足,其方法论上的创新为个性化治疗决策提供了重要的理论框架和实践路径。
创新点:
-
因果机器学习(Causal ML)提供了一种灵活的数据驱动方法,用于估计个体化治疗效果。
-
因果ML能够有效捕捉复杂疾病动态和人类病理生理及药理学中的非线性关系。
Machine learning in causal inference for epidemiology
方法:文章讨论了因果推断中机器学习的应用,特别是如何将机器学习技术与传统的因果推断方法相结合,以解决流行病学研究中的因果效应估计问题,基于监督学习和双重稳健估计等理论框架,采用训练、验证及测试阶段的ML模型开发和评估方法。
创新点:
-
开发了一种TMLE的扩展形式,称为TMLE-VIM,用于降维和变量重要性测量。
-
在双重机器学习(DML)框架中,作者引入了样本分割与交叉拟合技术。
Nature versus nurture in galaxy formation: the effect of environment on star formation with causal machine learning
方法:论文应用因果机器学习模型研究星系形成和演化过程中自然(内部过程)与养育(外部过程)的作用,通过构建复杂的因果模型和使用流行病学的先进方法,解决了长期以来的自然和养育角色分离问题,为理解星系演化提供了一个新的框架。
创新点:
-
通过构建复杂的因果模型来探讨星系形成和演化中的“自然”与“养育”之间的关系。
-
通过引入基于逆概率加权(IPW)和边缘结构模型(MSM)的技术,作者成功地在高维数据中消除了混杂偏差,准确估计了环境对星系形成率(SFR)的因果效应。
关注下方《学姐带你玩AI》🚀🚀🚀
回复“因果机器”获取全部方案+开源代码
码字不易,欢迎大家点赞评论收藏