基于机器学习的结构MRI分析：预测轻度认知障碍向阿尔茨海默病的转化

摘要

阿尔茨海默病是一种致残性神经退行性疾病，目前尚无有效的治疗方法。预测阿尔茨海默病的诊断对患者的预后至关重要，但目前的阿尔茨海默病生物标志物检测方法具有侵入性、耗时且昂贵。因此，开发基于MRI的计算方法用于阿尔茨海默病的早期诊断，对于缩小预测认知衰退的表型指标范围具有重要意义。遗忘型轻度认知障碍(aMCI)与阿尔茨海默病(AD)的较高风险相关，本研究旨在应用不同的机器学习算法，识别基于MRI的量化规则，以预测aMCI向阿尔茨海默病的可能转化。在基线时，收集了104名aMCI患者的T1加权脑图像，并处理获得146个脑灰质区域[感兴趣区域(ROIs)]的体积测量值。一年后，根据认知表现将患者分为转化组(aMCI-c=32)和非转化组(即临床和神经心理稳定者，aMCI-s=72)。采用随机森林(RF)进行特征选择，并将识别出的7个ROIs体积数据用于支持向量机(SVM)和决策树(DT)分类算法。SVM和DT在区分aMCI-c和aMCI-s方面的平均准确率均达到86%。DT发现右侧内嗅皮层(EC-r)的关键阈值体积是区分aMCI-c/aMCI-s的首要特征。几乎所有aMCI-c患者的EC-r体积＜1286mm3，而超过一半的aMCI-s患者的EC-r体积高于该阈值。其他用于区分aMCI-c/aMCI-s的关键区域包括左侧外枕叶(LOC-l)、颞中回和颞极。本研究进一步证实了先前的研究证据，表明EC-r和LOC-l的形态测量最能预测aMCI向阿尔茨海默病的转化。在将本研究结果视为广泛适用的预测框架之前，还需要进一步的研究。总的来说，在这项研究中，通过MRI获得的特定脑区体积阈值可以作为早期识别阿尔茨海默病的依据，从而推动MRI作为一种有用的非侵入性痴呆预后工具的应用。

图形摘要

引言

阿尔茨海默病(AD)是一种致残性神经退行性疾病，也是全球最常见的痴呆类型。尽管经过数十年的科学研究，阿尔茨海默病仍然缺乏有效的治疗方法，而早期检测对于患者的临床管理和个性化治疗至关重要。事实上，阿尔茨海默病的及时诊断和准确预后可能促使或鼓励在临床前阶段采取更精细的生活方式调整、神经认知增强和非药物干预措施，以减缓认知衰退。轻度认知障碍(MCI)是介于正常衰老与阿尔茨海默病之间的中间阶段，其特征是个体相对于其年龄和教育水平出现异常的认知衰退，但日常活动功能相对保留。在MCI中，尤其是遗忘型亚型(aMCI)中，检测阿尔茨海默病的生物标志物非常重要，因为aMCI的年转化率为8%至15%，五年内转化率约为50%。然而，尽管有研究表明，通过建模与阿尔茨海默病病理相关的血浆生物标志物组合可以实现对疾病发生的精确预测，但目前MCI中阿尔茨海默病生物标志物的识别具有侵入性、耗时且昂贵，限制了其在大规模筛查和初级保健环境中的应用。

MRI是一种非侵入性的工具，具有安全、快速且相对经济的特点。由于阿尔茨海默病的脑部变化甚至在临床症状出现之前就已发生，因此可以在MCI中使用MRI技术获取脑部形态特征，并研究疾病进展的结构生物标志物。具体而言，已有研究表明，颞叶皮层(尤其是海马区)的结构变化可能是阿尔茨海默病患者神经退行性损伤和疾病进展的潜在指标。

大量神经影像研究已经开发了统计范式和机器学习(ML)算法，以在神经病学领域生成更精细的诊断和预后模型。机器学习提供了一种系统化的方法，通过学习复杂的大脑细微变化模式，开发出复杂、自动化和客观的分类框架，用于分析高维数据。具体而言，机器学习范式包括训练一种算法，从给定的数据集(例如脑体积测量值)中提取共同特征，以根据特定诊断对受试者进行分类。随后，训练好的算法可用于预测和分类诊断未知的不同个体。这一研究领域目前正在快速发展，最近的一项综述表明，机器学习算法能够以极高的准确率对阿尔茨海默病、轻度认知障碍(MCI)患者和健康参与者[健康对照组(HC)]的MRI图像进行分类。其中一些算法还能够在规定的时间内区分出会转化为阿尔茨海默病的MCI患者(MCI-c)和不会转化的MCI患者(稳定型MCI，MCI-s)。然而，这些研究存在较高的方法学异质性，例如研究中包含的样本、预处理技术、神经影像数据类型以及分类和验证方法。关于样本，大多数研究使用来自阿尔茨海默病神经影像倡议(ADNI)数据库的公开数据，这为获得大规模实验样本提供了可能性。然而，这些图像在MRI场强(即1.5T和3T)和图像参数方面存在高度变异性。此外，为了在临床上有用并确保数据多样性以促进泛化，防止潜在偏差，这些机器学习模型不仅需要在大型样本中进行测试，还需要在更多变和多样化的临床人群中进行验证。在用于分类患者并检测MCI向阿尔茨海默病可能进展的机器学习方法中，最常用的是基于支持向量机(SVM)的方法。这是一种监督学习算法，已在神经影像应用中证明了其效用，特别是在未来临床结果的分类方面。其他常用的分类器包括随机森林(RF)和神经网络，后者通常依赖于卷积神经网络进行图像分类任务。

这些计算模型识别出的用于区分阿尔茨海默病患者与MCI或HC的关键皮层区域主要位于颞叶、顶叶和额叶。其中，海马体、杏仁核、内嗅皮层、楔前叶、扣带回以及内侧额叶的喙部和尾部区域是受试者分类中最相关的区域。然而，以往的研究仅报告了模型准确性、敏感性、特异性或表达二元分类器整体性能的单个标量值[即受试者工作特征曲线下面积(ROC-AUC)]。这些指标有助于评估算法的分类性能，但难以用于临床目的。据所知，先前的研究尚未展示模型用于将受试者分类为aMCI-c或aMCI-s的具体标准，例如根据萎缩率来区分这两组患者的潜在临界阈值。

通过依次应用不同的机器学习算法，本研究旨在识别多个皮层和皮层下脑灰质体积的临界值，这些值易于获取并应用于临床实践，以区分在1年内会转化为阿尔茨海默病的aMCI患者(aMCI-c)和不会转化的aMCI患者(aMCI-s)。

材料与方法

研究样本及临床评估

在IRCCS圣卢西亚基金会记忆门诊服务中，本研究最初评估了130例报告认知能力下降的aMCI患者。为了将这些变化视为诊断证据，必须由可靠的照护者(定义为每周与患者联系并至少有一次亲自探访的人)确认。在基线时，所有参与者均使用临床痴呆评定量表(CDR)和日常生活能力量表(IADL)、智力衰退成套测验(MDB)以及其他标准化认知测试进行评估。具体而言，患者接受了以下测试：一般认知功能[简易精神状态检查(MMSE)]和不同认知领域的测试，包括：(i)言语记忆(MDB Rey 15词即时回忆和延迟回忆)；(ii)逻辑推理(MDB Raven渐进矩阵47)；(iii)语言(MDB语义和语音词语流畅性以及MDB句子构建)；(iv)简单构建性实践(MDB复制图画和MDB带地标的复制图画)；(v)长期视觉记忆(Rey-Osterrieth图延迟回忆)；(vi)复杂构建性实践(Rey-Osterrieth图形复制)以及(vii)执行能力，即注意转换和控制(连线测试A-B和Stroop测试)。此外，还收集了患者关于认知衰退起始年龄、病程以及高血压、高胆固醇血症和糖尿病等与衰老相关疾病的治疗信息。

具体的纳入标准如下：(i)年龄在55至90岁之间，(ii)视力和听力足以完成测试程序，(iii)遵守评估程序，以及(iv)符合Petersen指南和2003年MCI关键研讨会提出的以下临床标准的aMCI(单领域或多领域)诊断证据：(i)与年龄相关的记忆功能异常，(ii)日常生活自主性保留(≥5分)，(iii)无痴呆(MMSE评分＞20，CDR≤0.5)，以及(iv)适合进行MRI检查。

排除标准如下：(i)重大疾病，(ii)原发性精神或神经系统疾病共病，(iii)酒精或药物滥用史，以及(iv)MRI显示局灶性实质异常或肿瘤。

一年后，每位患者在随访中接受评估，并采用相同的诊断程序以确认基线aMCI诊断或根据临床标准证实aMCI向阿尔茨海默病的转化状态。根据美国国立精神病、语言交流障碍和卒中研究所/阿尔茨海默病及相关疾病协会(NINCDS-ADRDA)标准，对CDR评分＞0.5且MMSE评分≤20或在两个或更多领域(包括记忆)的神经心理表现低于参考人群外部公差限的患者，被诊断为可能患有阿尔茨海默病。

根据患者在1年随访临床评估中是否符合可能的阿尔茨海默病标准，将其分别标记为aMCI-c或aMCI-s。选择1年的间隔是因为这段时间足够长，能够捕捉到缓慢且逐渐发展的结构变化，同时也适用于预后目的。

在初始样本中，有26名患者因在1年随访前退出(n=18)、有严重的MRI运动伪影(n=5)或严重的白质病变证据(n=3)而被排除在研究之外。最终样本包括104名aMCI患者，其中32名为aMCI-c，72名为aMCI-s。本研究已获得当地伦理委员会的批准。在说明研究性质和目的后，患者及其知情人均签署了书面知情同意书。

MRI采集与处理

所有参与者在基线时均接受了相同的成像协议，使用3T Allegra MR成像仪(Siemens, Erlangen, Germany)和标准正交头线圈进行采集。该协议包括3D全脑高分辨率T1加权(T1-w)、T2加权(T2-w)和液体衰减反转恢复(FLAIR)图像。所有平面序列均在前连合-后连合(AC-PC)线平面上获取。在头线圈中对受试者进行中心定位，并使用垫子和医用胶布固定其头部以减少运动。全脑T1-w图像在矢状面上使用改进的驱动平衡傅里叶变换(回波时间=2.4ms，重复时间=7.92ms，翻转角度=15°，体素大小=1×1×1mm)获取。T2-w和FLAIR序列用于脑部病理筛查。

T1-w图像用于获取感兴趣皮层和皮层下区域(ROIs)的体积。为了优化信噪比，首先使用经过验证的自适应非局部均值去噪软件对图像进行空间变化的噪声水平和强度不均匀性校正。然后，使用FreeSurfer v.7.1.1中的recon-all标准流程对去噪后的图像进行处理，根据Desikan-Killiany图谱生成68个双侧皮层区域和14个双侧深部灰质结构(如海马体、丘脑、杏仁核、壳核、尾状核、伏隔核和苍白球)。为了避免排除未正确分割的区域(即避免数据缺失)，从recon-all步骤输出的皮层/皮层下ROIs被逐一目视检查，并根据区域填充/清空进行手动校正，以防软件低估或高估。几乎所有参与者的手动校正均由一名接受过神经影像培训且对研究目的不知情的博士生完成。然后使用FreeSurfer的mri_segstats工具从校正后的图像中提取皮层/皮层下体积。

此外，将FreeSurfer分割模块应用于校正后的T1-w图像，以获取海马亚区、杏仁核和丘脑亚核的体积。共提取了146个脑体积(特征)，包括68个皮层、8个皮层下、38个海马、18个杏仁核和14个丘脑测量值。最后，从FreeSurfer分割程序中提取总颅内体积，并用于校正区域体积以消除全脑大小变化的影响。标准化的区域体积随后乘以107，以恢复其自然数值范围。完整的MRI处理流程如图1所示。

图1.T1-w图像处理。

统计分析

采用t检验或χ2检验比较aMCI-c和aMCI-s在基线人口统计学(年龄、性别和教育水平)和临床特征(认知衰退起始年龄、病程和药物治疗)上的差异。使用SPSS 25.0(IBM, Armonk, NY, USA)进行统计分析，统计显著性阈值为P＜0.05。

机器学习过程

为实现研究目标，本研究依次使用了三种不同的scikit-learn机器学习算法(基于Python 3.8实现)，其中80%的数据集用于训练算法，剩余部分用于测试。具体而言，随机森林(RF)、支持向量机(SVM)和决策树(DT)模型分别用于特征选择、特征验证和分类规则检测。RF通过在数据集的不同子样本上拟合多个树分类器，并使用平均法提高预测准确性并控制过拟合。SVM是一种强大的监督机器学习模型，适用于在小而复杂的数据集上解决二分类问题。DT是一种监督学习算法，使用分层树结构进行分类，提供易于理解的模型。其结构包括根节点、分支、内部节点和叶节点。树中的每个节点测试某个属性的条件，从该节点下降的每个分支对应于该属性条件的可能值之一(即真/假)。

对于每种机器学习算法，计算了混淆矩阵、模型精度(精度=真阳性/预测阳性)、召回率(召回率=真阳性/实际阳性)和f1分数[f1=2×(精度×召回率/精度+召回率)]，以评估模型的准确性。对于SVM和DT，通过计算ROC-AUC和交叉验证的ROC-AUC进一步评估模型的敏感性和特异性。最后，使用k折法(将数据集分为k个子集并训练/测试模型k次)作为模型交叉验证程序，k=100(图2和图3)。

图2.特征缩减。

图3.决策树分类器。

特征选择

为了防止过拟合、降低模型复杂度并避免特征之间的多重共线性或噪声信息，使用随机森林(RF)算法进行特征选择。具体而言，通过RF算法来选择10个最具判别性的特征进行分类。根据nfeatures=√ncases规则选择10个特征的阈值进行相关测量。将RF分类器设置为100个估计器，分类标准为“熵”，树的最大深度为3。该过程递归重复，直到15个模型的总准确率＞80%，并且15个模型中至少有50%的特征被选中。

为了探讨海马亚区、丘脑和杏仁核亚核或其整体结构在诊断分类中的参与情况，本研究依次使用了两个不同的数据集进行特征选择。具体而言，首先使用最详细和分区的数据集进行特征选择过程，该数据集包括双侧海马、杏仁核和丘脑的各个亚区/亚核的体积。因此，双侧丘脑、杏仁核和海马的总体体积被排除在第一个数据集之外，以避免冗余特征的存在。如果在RF分类过程中，杏仁核和丘脑的亚核均未出现在10个最具判别性的特征中，则它们依次合并为整体结构测量值。将海马亚区合并为头部、体部、尾部和裂部亚区，并作为整体结构体积。最终数据集包含104个脑特征，这些特征是亚区/亚核合并过程的结果，并用于重新运行如前所述的选择过程。

支持向量机(SVM)模型

使用支持向量机(SVM)模型进一步评估所选脑特征在诊断分类任务中的适用性和准确性。为了提高SVM的性能，使用Python的Grid Search工具对多个超参数进行调优。具体而言，该工具通过使用10折交叉验证数据集划分，找到SVM算法中正则化参数(C)、核函数类型(kernel)、核函数度(degree)和核系数(gamma)的最佳组合。

决策树模型

为了超越机器学习模型分类准确性的统计结果，并找到作为分类规则的脑临界体积阈值以预测aMCI-c或aMCI-s患者在随访时的状态，使用所选特征实施决策树(DT)模型。使用“熵”标准和3作为树的最大深度运行DT分类器。

结果

样本特征

在基线人口统计学(年龄、性别和教育水平)和临床特征(认知衰退起始年龄、病程、药物治疗和IADL评分)方面，aMCI-c和aMCI-s组之间未发现显著差异，但CDR评分除外(表1)。在随访评估中，两组在CDR和IADL评分以及认知表现(MMSE评分和受损领域数量)方面存在显著差异。

表1.aMCI-c组和aMCI-s组的人口统计学信息和临床特征。

特征选择

在最终数据库的104个ROIs中，特征选择程序选出了7个ROIs，分别为左侧海马裂(在15个模型中有8个模型将其作为判别特征—8/15)、左侧外枕叶(9/15)、左侧颞中回(9/15)、右侧和左侧颞极(分别为9/15和12/15)以及右侧和左侧内嗅皮层(分别为14/15和15/15；图2)。

支持向量机模型

通过Grid Search进行的超参数调优显示，SVM通过结合C=1000、degree=3、gamma=0.03和kernel=多项式时，在10折交叉验证数据集划分中取得了最佳结果。使用这些参数和选定的7个ROIs，SVM模型对aMCI-c和aMCI-s的分类在训练数据集上的总准确率为90%，在测试数据集上的总准确率为86%，表明过拟合风险较低。模型对aMCI-s的精度为93%，对aMCI-c的精度为71%；对aMCI-s的召回率为87%，对aMCI-c的召回率为83%。因此，f1分数(即真阳性与总预测阳性的比率与正确预测阳性占所有实际阳性的比例之间的调和平均值，用于平衡精度和召回率)对aMCI-s为90%，对aMCI-c为77%。计算得出的ROC-AUC为85%，而交叉验证的ROC-AUC为80%。最后，k折交叉验证程序显示平均分层交叉验证准确率为78%(图2)。

决策树模型

决策树(DT)模型的准确率、敏感性和特异性与SVM模型几乎相同。具体而言，该模型对aMCI-c和aMCI-s的分类在训练数据集上的总准确率为81%，在测试数据集上的总准确率为86%，表明过拟合风险较低。模型对aMCI-s分类的精度为93%，对aMCI-c分类的精度为71%；对aMCI-s的召回率为87%，对aMCI-c的召回率为83%。因此，f1分数在aMCI-s中为90%，在aMCI-c中为77%。计算得到的ROC-AUC为85%，而交叉验证的ROC-AUC为69%。最后，k折交叉验证程序显示平均分层交叉验证准确率为79%。

右侧内嗅皮层(EC-r)的体积是首个能够对aMCI-c或aMCI-s患者进行二分类的特征，因为几乎所有aMCI-c患者(26例中有25例)的EC-r体积低于阈值1286mm3(见图3)。考虑到训练数据集中包含的83例患者，模型未能识别出能够完美分类两组的特定规则，以形成一个仅包含26例aMCI-c患者的类别和一个仅包含57例aMCI-s患者的类别(即两个完全同质的类别，类别熵=0)。事实上，aMCI-c患者的最同质分类包括6例患者，这些患者的EC-r体积低于阈值，且左侧外枕叶皮层(LOC-l)体积小于阈值8350 mm³。其余未根据EC-r和LOC-l分类的aMCI-c患者，则通过左侧颞极和左侧颞中回萎缩的阈值进行分类，但类别熵较高。

约一半的aMCI-s患者的EC-r体积高于1286mm3且LOC-l＞6210mm3，这代表了最同质的aMCI-s组(类别熵=0)，包含57例患者中的29例。大多数不符合EC-r体积大于1286mm3标准的aMCI-s患者还显示出左侧颞极体积较小，这可能表明EC-r萎缩在该aMCI-s亚组中更为广泛，因此还涉及其他皮层区域。

结论

本研究旨在通过机器学习方法，识别在1年内将稳定型遗忘性轻度认知障碍(aMCI-s)患者与可能转化为阿尔茨海默病(aMCI-c)患者区分开的临界脑区体积阈值，特别是右侧内嗅皮层(EC-r)和左侧外枕叶(LOC-l)的体积。研究发现，EC-r体积低于1286mm3的患者中有99%会转化为阿尔茨海默病，而高于该阈值的患者则表现出临床稳定性。此外，LOC-l体积低于8350mm³的aMCI-c患者表现出高度一致性，表明LOC-l在预测阿尔茨海默病转化中也具有重要作用。这表明，EC-r和LOC-l的体积变化是预测aMCI向阿尔茨海默病转化的关键生物标志物。EC-r作为皮层-海马网络的关键节点，在记忆形成和检索中起重要作用，其早期退行性变化与阿尔茨海默病的病理过程密切相关。LOC-l则参与视觉通路和默认模式网络，其形态变化也与阿尔茨海默病的神经退行性过程相关。总的来说，本研究通过机器学习方法识别了EC-r和LOC-l的临界体积阈值，为aMCI向阿尔茨海默病转化的早期预测提供了非侵入性、易于临床应用的生物标志物。这不仅强化了EC-r和LOC-l在阿尔茨海默病预测中的重要性，还表明MRI可以作为一种有效的工具，用于阿尔茨海默病进展的早期诊断和干预。

参考文献：Daniela Vecchio, Federica Piras, Federica Natalizi, Nerisa Banaj, Clelia Pellicano, Fabrizio Piras, Evaluating conversion from mild cognitive impairment to Alzheimer’s disease with structural MRI: a machine learning study, Brain Communications, Volume 7, Issue 1, 2025, fcaf027, https://doi.org/10.1093/braincomms/fcaf027

小伙伴们关注茗创科技，将第一时间收到精彩内容推送哦～