核磁机器学习 | 机器学习和深度学习算法在fMRI中的应用

server/2025/1/14 0:53:00/

摘要

功能磁共振成像(fMRI)是目前应用最广泛的脑图像动态分析技术之一,通常结合多种算法来分析复杂的动态数据。近年来,机器学习深度学习算法在分析fMRI数据方面的应用呈指数级增长。然而,由于文献中存在大量算法,选择合适的机器学习深度学习算法来分析fMRI数据对每个研究者来说都是一项巨大的挑战。每个研究人员都需要花费大量的时间来了解目前用于fMRI数据分析的各种方法和算法。本文系统地回顾了使用机器学习深度学习算法分析fMRI数据的当前研究进展。主要目标是:(a)分析机器学习深度学习在fMRI中的研究趋势;(b)总结机器学习算法深度学习在fMRI中的应用;(c)帮助基于fMRI的新研究者将其新发现与现有的fMRI研究领域相融合。本文从fMRI的类型、精神疾病、机器学习深度学习算法的使用等方面对fMRI研究进行了分类,为fMRI研究提供了性能最佳的机器学习深度学习算法,并且能够为未来从事fMRI研究的研究人员提供相应的指导。

理论背景

功能磁共振成像(fMRI)

功能磁共振成像(fMRI)是一种通过检测低频血氧水平依赖(BOLD)信号来测量大脑活动的技术。fMRI通过映射大脑中与能量使用相关的神经元活动来观察血液流动的变化。fMRI方法的一个主要优点是通过监测大脑中神经元活动相关区域的血流增加,来反映和研究大脑的活动状态。BOLD技术是执行大脑功能映射最常用的方法。BOLD信号是一种复合信号,反映了区域性大脑血流变化及其氧合和血液体积的变化。这些信号的强度间接地衡量了神经元的活动。fMRI实验的基本原理是:血流增加和能量消耗增大与神经元活动的增加密切相关。统计图用于表征大脑功能,通常反映了不同脑区的活动情况。这些图中信号的激活程度可以通过颜色编码的强度来表示,颜色深浅反映了特定脑区的活动强度。fMRI技术不仅用于检测由特定任务引起的BOLD反应,还包括静息态fMRI测量,用于研究大脑在没有外部刺激时的活动模式和区域间的功能连接。fMRI与近红外光谱(NIRS)和脑电图(EEG)等其他技术结合使用,也能有效地监测大脑神经活动。fMRI技术极大地推动了认知神经科学的发展,其主要用途在于帮助我们了解和研究大脑中与认知状态(例如记忆、再认等)相关的神经机制。目前,借助实时fMRI技术,我们可以进一步观察和分析大脑的激活状态。此外,fMRI技术不仅在传统的认知神经科学领域有着广泛的应用,而且还在神经营销和成瘾行为等研究领域中发挥着重要作用。

机器学习(ML)

机器学习是人工智能的一个重要分支,通过让计算机程序从现实世界的知识中学习,而无需进行明确的编程,并能基于所获得的知识改进后续的任务表现。从逻辑上讲,机器学习由三个参数来定义:经验(E)、任务(T)和性能(P),具体定义如下:对于任何任务T,如果计算机程序在任务T中的表现(P)随着经验E的积累而提高,那么该程序就会通过经验E来学习。机器学习的核心思想是在通过数据训练并应用合适的算法后,机器能够从中学习并自动改进。目前有大量关于机器学习算法应用的文献。这些算法根据学习过程分为四种类型:监督学习、无监督学习、强化学习和半监督学习。

‌监督学习的核心在于利用一组已知类别的样本(即训练数据)来调整分类器的参数,使其达到所要求的性能。无监督学习算法使用的是没有标签的真实数据,它们通过分析数据本身的结构或模式来进行学习,而不依赖于传统的标注过的训练数据集。无监督算法以其能够发现数据中的隐藏模式而著称。半监督学习算法处理的数据集包含部分缺失信息或部分未标注数据,算法的任务是仅依赖这些不完全的训练数据来进行学习,并尽可能利用已有的数据来推测或补充缺失的部分。强化学习算法通过外部环境或某种思维实体提供的反馈来获得或学习知识。

深度学习(DL)

深度学习是一种机器学习技术,它采用类似人工神经网络的方式,通过多层次的网络结构和复杂的算法来进行学习。换句话说,深度学习算法的学习方式与我们大脑的工作方式相似。深度学习允许各种计算模型通过处理层来学习数据表征。深度学习算法遵循神经系统的工作方式,其中神经元相互连接,负责传递信息。深度学习中的模型遵循分层结构,简单的深度学习模型通常包含三层。在这种分层模型中,每一层都接受来自前一层的信息,然后将其输出作为下一层的输入。深度学习算法的性能曲线相较于机器学习模型要高一些,因为机器学习模型在达到饱和点后性能不再提升,如图1所示。

图1.深度学习与传统学习算法的性能比较。

深度学习的最大优点在于,在训练深度网络模型之前不需要使用特征工程。输入数据直接传递给深度网络,而且模型在准确度方面表现良好。这消除了机器学习模型中的特征选择阶段,该阶段需要手动选择最佳特征以获得最佳结果。

实现深度学习算法的最流行深度架构包括多层感知器(MLP)、卷积神经网络(CNN)和循环神经网络(RNN)。本文将介绍每种深度架构的主要特点并结合不同数据类型对这些架构进行解释。

基于多层感知器(MLP)的深度架构可能包含多个层,但最少需要使用三个层:输入层、隐藏层和输出层。在MLP中,任意一层的神经元与上一层的所有神经元相连接,同时也与下一层的神经元相连接,如图2所示。MLP架构非常适合处理结构化类型的数据。

图2.深度学习多层感知器架构。

卷积神经网络(CNN)是一种主要用于图像识别和分类的神经网络。在CNN模型中,输入图像会经过多个卷积层、池化层、滤波器和全连接层。卷积层是提取给定图像特征的第一层,并始终通过在小方块区域中学习图像特征来保持像素之间的关系。在CNN中,池化层通常用来减少大图像中的参数数量。经过一系列卷积层和池化层后,CNN会将最后一个神经层展平,并通过全连接的方式与输出层相连,如图3所示。

图3.卷积神经网络架构。

循环神经网络(RNN)是一种利用内部记忆状态来处理各种事件序列的神经网络。RNN主要用于语音识别和文本生成等。RNN通过“状态”机制(类似于记忆)保持对过去信息的记忆,帮助捕捉过去发生的重要信息,并基于这些信息预测接下来将要发生的内容。在RNN中,如果输入数据是时间序列的形式,那么通常会利用时间间隔为t−5、t−4……t−1的特征来预测时间间隔t的值,如图4所示。

图4.循环神经网络架构。

系统综述

本文回顾了结合fMRI技术和机器学习/深度学习方法的研究。文献的纳入/排除遵循三个步骤。第一步,从最流行的科学数据库(如Science Direct、Scopus、Web of Science和IEEE Xplore)中收集所有与fMRI相关的文献。逐一分析这些文献,并根据表1所示的第一排除标准排除了不符合要求的论文。第二步,基于第一步筛选出的文献,进一步阅读其摘要,并根据表1所示的第二排除标准排除调查类论文。第三步,对剩余的文献进行方法和工作流程的检查,然后根据第三排除标准,排除那些未涉及fMRI方法和实验研究的论文和研究。排除标准(COE)如表1所示。

表1.文献排除标准及最终纳入分析的数量。

在应用所有排除标准后,360篇文献中最终保留241篇,具体的PRISMA流程图如图5所示。对保留的研究进行深入分析,并从多个角度(如fMRI类型及其常用方法、精神疾病、机器学习算法深度学习算法)对这些研究进行分类和讨论。

图5.PRISMA流程图。

系统综述结果

功能磁共振成像(fMRI)

fMRI技术可以分为静息态fMRI和任务态fMRI。静息态fMRI用于评估大脑在静息状态下(即大脑未执行任何外部任务时的状态)各区域之间的相互作用。静息态fMRI数据处理的常用方法包括种子点功能连接(SBFC)、区域同质性(ReHo)、低频振幅(ALFF)、主成分分析(PCA)和独立成分分析(ICA)。任务态fMRI用于评估和分析在执行某些认知任务时,大脑神经功能的时间序列变化。然后,构建一个地图来表示在任务执行过程中与任务相关的体素激活情况。任务态fMRI数据处理的常用方法包括一般线性模型(GLM)、心理生理交互(PPI)、动态因果模型(DCM)、多变量模式分析(MVPA)和结构方程模型(SEM)。fMRI方法的分类如图6所示。

图6.fMRI方法分类。

静息态fMRI分类结果

包含图6所示方法的静息态fMRI相关研究数量如表2所示。通过分析发现,这些方法都有其相应的优点和缺点。从选定的静息态fMRI研究来看,这些研究使用了各种方法来表征患者的大脑静息态网络。这些方法通常互为补充,需要结合使用,以更全面地分析和表征静息态大脑活动。从研究数量来看,ReHo是静息态fMRI研究中最常用的方法,这可能是因为该方法能够有效地评估时间序列中不同体素(及其邻近体素)之间的相似性,从而为理解大脑功能提供有价值的信息。静息态fMRI结果如图7所示。

表2.基于静息态fMRI方法的研究分类。

图7.基于静息态fMRI方法的研究数量。

任务态fMRI分类结果

包含图6所示方法的任务态fMRI相关研究数量如表3所示,其中也列出了这些相应方法的优缺点。从选定的任务态fMRI研究中可以得出结论,任务态fMRI方法被认为是基于外部刺激识别ROI或体素的基准方法。然而,这些研究还揭示了在面对视觉刺激时,大脑不仅仅依赖于局部区域的激活,而且依赖于多个脑网络的协同参与过程。由于任务态fMRI数据的分析需要大量的时间和成本投入,因此全面识别和分析这些大规模功能网络是非常具有挑战性的。这些问题在处理任务态fMRI数据集时仍有待解决。从研究数量来看,MVPA是任务态fMRI研究中最常用的方法,这可能是因为该方法能够通过比较和分析大脑活动的分布模式来检测不同条件之间的差异,相较于单变量分析具有更高的敏感性。任务态fMRI结果如图8所示。

表3.基于任务态fMRI方法的研究分类。

图8.基于任务态fMRI方法的研究数量。

基于精神疾病的fMRI研究分类

使用fMRI评估不同精神疾病的研究数量如表4所示。本文根据fMRI方法的使用情况以及精神疾病的类型和功能连接进行了分类。fMRI技术和方法在众多常见精神疾病中的应用包括大脑衰老、阿尔茨海默病、自闭症谱系障碍、注意力缺陷多动障碍、双相情感障碍、抑郁症、癫痫、轻度认知障碍、强迫症、帕金森病、疼痛障碍、社交焦虑症和精神分裂症。

表4.基于常见精神疾病的fMRI研究分类。

机器学习算法

应用于fMRI数据分析的机器学习算法包括监督学习、无监督学习、半监督学习和强化学习。将使用fMRI方法与常见机器学习算法结合的研究数量进行分类,并且分析了每种机器学习算法与fMRI结合时的优缺点。在基于机器学习算法进行分类时,有一些研究对核心机器学习算法做了一些改动。为了避免复杂化,本文在进行分类时将这些研究归为同一类别。与此同时,一些研究使用了组合算法与fMRI方法结合,本文将这些研究归入“集成”类别。在机器学习领域,集成方法包括随机森林、装袋法(bagging)和提升法(boosting),但在这里本文不考虑这些方法之间的区别。基于机器学习算法对fMRI研究进行分类的结果如表5所示。在fMRI研究中,支持向量机(SVM)是最常见的机器学习算法,其次是集成方法。支持向量机(SVM)在fMRI研究中使用更为广泛的可能原因是它即使在噪声较大的数据集中也能保持较高的分类准确性。另一个原因是,支持向量机分类器在面对数据维度较高、训练阶段样本数较少的情况下,仍能更好地进行泛化。基于机器学习算法的fMRI研究如图9所示。

表5.基于机器学习算法的fMRI研究分类。

图9.基于机器学习算法的fMRI研究数量。

图9表明,尽管K均值和神经网络是比较流行的机器学习算法,但在fMRI研究中相关的研究数量最少,但同时也为研究人员在未来结合fMRI方法进一步研究这些算法提供了机会。

机器学习算法的最佳性能研究

本节总结了在fMRI研究中使用各类机器学习算法的最佳性能。在这些研究中,机器学习算法的性能是基于准确性来评估的。分类结果如表6所示。表6列出了几种疾病(如精神分裂症、双相障碍、阿尔茨海默病、重度抑郁症、自闭症谱系障碍)与健康对照组,以及双相障碍与重度抑郁症之间的机器学习研究对比,包括每个研究的最高准确率、样本量和所使用的方法。从表6可以看出,Qureshi等人(2017)使用极限学习机达到的最高准确率为99.3%。其他获得最高准确率的研究大多使用留一交叉验证法的支持向量机分类器。

表6.具有最高准确性的机器学习研究,其中包括受试者信息和所使用的方法。

深度学习算法

常用于fMRI研究的深度学习架构包括卷积神经网络(CNN)、深度信念网络(DBN)、深度贝叶斯网络(DBaN)、深度自编码器(DAE)、深度玻尔兹曼机(DBM)、基于深度加权子类的稀疏多任务学习(DW-S2 MTL)、深度多层感知器(DMP)和堆叠自编码器(SAE)。本文将使用fMRI方法的研究按照常见深度学习架构进行分组,获得的结果如表7所示。fMRI研究中最常用的深度学习架构是卷积神经网络(CNN),其次是堆叠自编码器(SAE)。CNN在fMRI中应用最广泛的可能原因是其能够自动提取fMRI数据处理所需的特征。所有与fMRI方法结合使用的深度学习架构结果如图10所示。

表7.基于深度学习架构的fMRI研究分类。

图10.基于深度学习架构的fMRI研究数量。

深度学习算法的最佳性能研究

本节总结了在fMRI研究中使用各类深度学习算法的性能。在这些研究中,深度学习算法的性能是基于区分健康对照组与患者组的准确性来进行评估的。大多数关于深度学习架构的研究是在阿尔茨海默病神经影像学计划(ADNI)数据集上进行的,且这些研究的重点是阿尔茨海默病及其相关的轻度认知障碍阶段。表8展示了在区分健康对照组与阿尔茨海默病患者方面,使用深度学习方法取得最高准确率的研究。从表8可以看出,Basaia(2019)使用卷积神经网络(CNN)时,最高准确率达到99.2%。表8显示,准确率最高的深度学习架构有卷积神经网络(CNN)、堆叠自编码器(SAE)、基于深度加权子类的稀疏多任务学习(DW-S2 MTL)、深度玻尔兹曼机(DBM)、基于CNN的稀疏自编码器、深度多层感知器(DMP)以及基于CNN的多元稀疏回归。

表8.在区分健康对照组和阿尔茨海默病患者时,使用深度学习方法取得最高准确率的研究。

表9列出了在区分健康对照组与轻度认知障碍组方面,使用深度学习方法取得最高准确率的研究。从表9可以看出,Hosseini-Asl等人(2016)使用卷积神经网络(CNN)时,最高准确率达到92.1%。表9显示,具有最高准确率的深度学习架构包括CNN、深度多层感知器(DMP)、堆叠自编码器(SAE)、深度玻尔兹曼机(DBM)、基于深度加权子类的稀疏多任务学习(DW-S2 MTL)、基于CNN的多元稀疏回归以及基于深度自编码器的多元稀疏回归。

表9.在区分健康对照组与轻度认知障碍组时,使用深度学习方法取得最高准确率的研究。

表10展示了在区分阿尔茨海默病与轻度认知障碍组方面,使用深度学习方法取得最高准确率的研究。从表10可以看出,Chen等人(2016)使用堆叠自编码器时,获得的最高准确率为95%。表10显示,具有最高准确率的深度学习架构包括堆叠自编码器(SAE)、卷积神经网络(CNN)和深度多层感知器(DMP)。

表10.在区分阿尔茨海默病与轻度认知障碍组时,使用深度学习方法取得最高准确率的研究。

结论

本文系统地综述了与fMRI相关的研究,以及各种机器学习深度学习算法在精神疾病分析中的应用。本文试图提供一种有序的方式来帮助了解这些算法在fMRI研究与发展中的应用趋势及其优缺点。研究结果表明,在fMRI机器学习算法研究中,支持向量机(SVM)是最常用的方法,其次是集成方法;而在fMRI深度学习算法研究中,卷积神经网络(CNN)最常用,其次是堆叠自编码器。本文预计未来fMRI研究将会更多地使用深度学习方法,因为深度学习能够自动提取fMRI数据处理所需的特征,从而有效地应对处理fMRI数据时面临的高维挑战,即单个样本中可能包含成千上万的特征。此外,机器学习深度学习算法也可以用于分析其他类型的精神疾病,特别是那些具有高空间和时间分辨率的数据,这些算法能够更好地捕捉和分析精神疾病相关的复杂模式和细节。

参考文献:Rashid M, Singh H, Goyal V. The use of machine learning and deep learning algorithms in functional magnetic resonance imaging—A systematic review. Expert Systems. 2020; 37:e12644. https://doi.org/10.1111/exsy.12644

小伙伴们关注茗创科技,将第一时间收到精彩内容推送哦~


http://www.ppmy.cn/server/158136.html

相关文章

C语言初阶习题【23】输出数组的前5项之和

1. 题目描述 求Snaaaaaaaaaaaaaaa的前5项之和,其中a是一个数字, 例如:222222222222222 2.思路 分析下,222222222222222,怎么把它每一项算出来 2 210222 22102222 2221022222 我们的多项式就是a a*102,…

云端 IPv4 VRRP+MSTP多备份组配置实验

SW3和SW4作为核心交换机,SW1和SW2分别有两条链路可做冗余链路连接到核心交换机上。 1、把SW3和SW4配置vrrp虚拟路由器冗余协议,把两台路由器虚拟成一台路由器 2、创建两个备份组,备份组一的虚拟ip做pc6的网关,备份组二的虚拟ip做…

mysql,PostgreSQL,Oracle数据库sql的细微差异(2) [whith as; group by; 日期引用]

sql示例(MySQL) WITHtemp1 AS (SELECT name AS resultsFROM Users uJOIN MovieRating m ON u.user_id m.user_idGROUP BY m.user_idORDER BY COUNT(*) DESC,left(name,1)LIMIT 1),temp2 AS (SELECT title AS resultsFROM Movies mJOIN MovieRating r ON m.movie_id r.movie_…

【Linux】【进程】进程和线程

【Linux】【进程】进程和线程 在Linux操作系统中 内核对进程和线程均是通过task_struct结构体(也就是所谓的pcb)来管理的 task_struct(存储在内核空间由内核直接控制和管理 用户空间无法直接访问 通过双向链表管理) 结构体里面有…

H2数据库在单元测试中的应用

H2数据库特征 用比较简洁的话来介绍h2数据库,就是一款轻量级的内存数据库,支持标准的SQL语法和JDBC API,工业领域中,一般会使用h2来进行单元测试。 这里贴一下h2数据库的主要特征 Very fast database engineOpen sourceWritten…

android分区和root

线刷包内容: 线刷包是一个完整的android镜像,不但包括android、linux和用户数据,还包括recovery等。当然此图中没有recovery,但是我们可以自己刷入一个。 主要分区 system.img 系统分区,包括linux下主要的二进制程序。 boot.img…

如何在Ubuntu上安装和配置Git

版本控制系统(VCS)是软件开发过程中不可或缺的工具之一,它帮助开发者跟踪代码变更、协作开发以及管理不同版本的项目。Git作为当前最流行的分布式版本控制系统,因其高效性和灵活性而广受青睐。本文将指导你如何在Ubuntu操作系统上…

调用Kimi的API接口使用,对话,json化,产品化

背景 Kimi出来一年多了,其输出内容的质量和效果在早期的模型里面来说还是不错的,虽然现在有一些更好的效果的模型和它不分上下,但是kimi的搜索能力,长文本的总结能力,还有其产品化的丰富程度,我觉得是别的…