推文作者:Guo
编者按
2022年的 INFORMS Pierskalla Award 授予在运筹学在疾病筛查方面的应用研究, 本期我们重点推荐四篇关于运筹学与疾病筛查的相关文章,进一步了解这一领域。
(一)
Efficient and targeted COVID-19 border testing via reinforcement learning
https://www.nature.com/articles/s41586-021-04014-z#change-history
Method:
在新冠疫情初期,许多国家限制了非必要的旅行,以缓解疫情传播,但这些限制使得经济损失惨重。随着疫情的改善,各国试图部分取消这些限制,采用了各自的边境筛查协议,但目前还不够完善。
本文开发强化学习系统EVA用于游客新冠肺炎筛查,目标是识别无症状、受感染的旅行者,为管理者制定相关政策提供信息。具体流程如下:
-
收集相关数据:所有游客填写抵达前24小时的位置、国籍、人口统计学特征。
-
估计游客的患病率: 首先,使用LASSO回归根据游客的人口统计特征(国籍、年龄和性别等)自适应地提取一组离散的、具有可解释性的类型。随后使用经验贝叶斯方法来估计每种类型的每日患病率。
-
分配检测资源: 利用这些患病率估计结果,仅根据旅行者的类型针对一部分旅行者进行PCR检测,在这个过程中需平衡利用(Exploitation)和探索(Exploration)两个目标。
-
灰色名单建议: 建议将特别危险的国家列入灰色名单。
-
闭环: 测试结果将在24-48小时内被记录,并用于更新步骤2中的患病率估计。
Highlights:
-
本研究与希腊政府合作,EVA系统于2020年8月6日至11月1日部署在希腊的所有40个入境点,包括机场、陆路口岸和海港,取得了较好的实际应用效果。
-
根据隐私保护的数据最小化原则,本研究确定通过游客的国籍、年龄、性别进行分类,而不包括如职业等其他潜在特征。
-
为了使得希腊各部门充分信任系统,本研究优先考虑系统的可解释性,选择经验贝叶斯等方法。
-
由于系统需要大量的财政和技术投资,并需要灵活应对外界变化,本研究以模块化的方式设计了EVA,将分类、估计和分配三个模块进行分离
Summary of numerical results:
EVA识别的无症状感染旅行者的数量是随机检测的1.85倍,在高峰旅行期间高达2-4倍,是仅使用流行病学指标的检测的1.25-1.45倍。
Why recommends?
旅游业是希腊的支柱产业,占国内生产总值20%以上,再加上希腊没有对所有游客进行检测的能力,故而疫情对希腊旅游业造成了巨大打击。故而当南加州大学马歇尔商学院的 Kimon Drakopoulos教授给希腊总理发送邮件询问他们是否需要额外的建议,他在数小时内就收到了 Kyriakos Mitsotakis 总理的答复。本研究与希腊政府合作,于2020 年 8 月至 11 月期间启动了一个由多国科学家小组开发的系统,研究成果于2021年9月发表于Nature,有较大的知名度和影响力。
(二)
Novel Pooling Strategies for Genetic Testing, with Application to Newborn Screening
https://pubsonline.informs.org/doi/full/10.1287/mnsc.2021.4289
Method:
本研究关注新生儿筛查(Newborn screening, NBS)问题,需在有限的资源下,检测危及生命的遗传疾病,尽可能准确地将新生儿分为阴性或阳性。
本研究提出了多P-DNA方法来显著减少所需的DNA检测量,使用多个面板,每个面板都有自己的池大小,将来自多个样本合并到一个测试池中进行一次DNA测试,如果有一个面板检测呈阳性,则对每个新生儿进行单独检测,如果每个面板的检测结果都为阴性,那么新生儿被归类为阴性。
-
目标函数:最小化筛查中出现假阴性(阳性新生儿被误诊为阴性,耽误治疗)的可能;此外,对假阳性进行不必要的检测会增加检测成本,检测过程受到检测成本的限制。
-
约束条件: 检测预算约束、面板大小约束、面板数量约束、测试池大小约束等。
-
求解方法: 由于该模型是NP难的,作者介绍了最优解的关键结构性质,以有效的方式生成一系列最优解及其相应的预算,并且可以构建一个有效的近似过程,为任何特定的预算生成一个近似最优解。
Highlights:
针对目前新生儿筛查中普遍出现的假阴性问题和成本过高问题,提出了一个新的筛查方法P-DNA,显著减少了所需的DNA检测量。
基于提出的模型,给出了相关的模型性质和生成最优解的方法。
Summary of numerical results
基于纽约市的数据进行了案例研究,将P-DNA方法与IRT/DNA、IRT/P-DNA方法进行比较,结果表明P-DNA可以大大提高新生儿筛查的效率和准确性。
Why recommends?
本研究对新生儿筛查问题进行了研究,获得了2021年Pierskalla Award的Runner-up奖,并于2022年发表于MS。
(三)
Optimal genetic screening for cystic fibrosis
https://pubsonline.informs.org/doi/abs/10.1287/opre.2021.2134
Method:
囊性纤维化(CF)是一种危及生命的遗传性疾病。CF阳性新生儿的早期治疗可以延长寿命,提高生活质量,减少医疗支出。
由于基因检测在CF筛查中的重要性和筛查过程的复杂性,本研究重点关注新生儿筛查过程的基因组成部分,并研究一层和二层基因检测过程。对于这两个过程,突变面板(Mutation Panel, MP)的组成对分类准确性和筛查成本有重大影响,因此,本文主要研究突变体选择问题(Mutation variant selection problem, MSP)。
本文基于MSP问题,建立了确定性优化模型和鲁棒优化模型,决策变量为分配在每个面板上的变体。
-
目标函数:确定使得假阴性率最小的最佳突变面板MP,即确定最优的一组引起CF的变体来进行搜索。
-
约束条件:预算约束、技术约束(面板中允许的最大变体数量)。
-
求解方法:首先建立了确定性优化模型,由于引起CF变异的流行率存在不确定性,因此随后建立了鲁棒优化模型。最后根据模型性质提出了高效率精确算法,并得到了最优突变面板的一些结构特性。
Highlights:
此前大多数研究CF筛查的文献都集中在医学领域,主要是基于历史数据集,对现有的筛查过程进行描述性分析,来确定哪个过程在给定的数据集上表现最好。这些方法有很多局限,比如有限的数据不能对结果提供高水平的置信度,并且不能保证得到最优解。本研究提出了新的决策问题——突变体选择问题(MSP),并在变异率不确定的情况下,为MSP建立了确定性和鲁棒性优化模型,这也是优化模型在CF筛查领域的首次应用,并基于该模型提出了算法和启示。
Summary of numerical results
本研究的模型在不引起成本增加的情况下提高了筛查效果。与纽约新生儿筛查的现实情况相比,确定性和鲁棒性模型使假阴性率分别降低了5.7%和17.0%。
与对估计误差敏感的确定性面板相比,鲁棒面板将假阴性率平均降低7.3%,最坏情况下的假阴性率平均降低了3.5%。
Why recommends?
本文是优化模型在CF筛查领域的首次应用,于2022年发表于OR。
(四)
Robust post-donation blood screening under prevalence rate uncertainty
https://pubsonline.informs.org/doi/abs/10.1287/opre.2017.1658
Method:
血液中心需在预算有限的情况下,使用鲁棒优化方法制定一个稳健的献血后血液筛查计划,最大限度地降低感染性献血流入到血液供应中的风险。
-
优化目标:决策变量为分配给各感染病的预算金额。
目标1:最小化期望风险(Expected risk minimization, ERM)
目标2:最大遗憾最小化(Maximum regret minimization,RMM),即在所有可能的感染率的情况下,最小化当前预算风险和最小预算风险的差,
-
约束条件:预算约束。
-
求解方法:使用鲁棒优化方法进行建模,探究了两个目标下分别得到的最优解的结构性质,开发了高效的精确求解算法,并对两个解进行对比,以RMM为目标的最优解可以显著降低最大风险。
Highlights:
由于献血人群的感染率非常不确定(易受到气候、传播媒介的影响),决策者只拥有部分信息,故本研究的目的是确定一种稳健的献血后血液筛查方案,在传染病的所有可能的流行率下实现低风险。而此前的类似研究是基于感染率已知的假设来进行研究的,决策者拥有完美信息。
Summary of numerical results:
1、与美国食品药品监督管理局的方案相比,在相同预算下,通过ERM和RMM模型得到的最佳解决方案更好地根据流行率分配检测的预算,显著降低了预期风险。
2、ERM模型得到的分配方案会使得高流行率的传染病的情况有更高的风险,RMM模型得到的分配方案会增加高流行率的传染病的检测预算以降低其风险,但会增加低流行率传染病的风险。
3、基于点流行率估计的ERM模型可能会导致次优测试方案,RMM模型可以显著降低最大风险。
Why recommends?
本研究获得了2015年的Pierskalla Award的Finalist奖,于2018年发表于OR。