用于分类肌萎缩侧索硬化症(ALS)患者静息态功能性磁共振成像(fMRI)数据的可解释机器学习算法
《Neural Networks》:Explainable machine learning algorithm for classifying resting-state functional MRI in amyotrophic lateral sclerosis
【字体:
大
中
小
】
时间:2025年11月22日
来源:Neural Networks 6.3
编辑推荐:
本研究利用可解释的机器学习流程,通过3D卷积神经网络结合独立成分分析预处理,对30名ALS患者和30名健康对照者的静息态fMRI数据进行分类,准确率达78.3%-83.3%,并借助注意力图和Grad-CAM++可视化技术,揭示了运动和视觉网络区域对分类的贡献,为神经退行性疾病诊断提供新方法。
本研究聚焦于一种名为肌萎缩侧索硬化症(ALS)的致命性神经退行性疾病,探索利用可解释的机器学习方法,结合静息态功能磁共振成像(rs-fMRI)数据,以区分ALS患者与健康对照组(HC)。ALS是一种影响多个大脑系统的疾病,主要特征是上运动神经元(UMN)和下运动神经元的退化,导致肌肉逐渐无力,最终影响患者的行动能力,预后较差。尽管传统的神经影像学方法在检测UMN损伤方面具有重要价值,但这些方法尚未被纳入临床诊断标准。此外,可视化并准确识别UMN损伤仍然是一个重大挑战。然而,越来越多的证据表明,ALS不仅仅影响运动系统,还涉及认知和行为等非运动系统。这一发现促使研究者探索更全面的神经影像学标志物,以提高ALS的诊断准确率和对病情变化的监测能力。
rs-fMRI作为一种无创性技术,能够捕捉大脑在静息状态下的内在活动模式,其原理基于血液氧合水平依赖(BOLD)信号的变化。这种技术的优势在于无需受试者执行特定任务,因此可以提供一种相对客观的评估方法。rs-fMRI已被广泛应用于神经科学领域,用于研究大脑功能网络的动态变化。然而,rs-fMRI数据具有四维(4D)的特性,包含大量时间序列的脑图像,这种数据的高维度和复杂性使得手动分析变得困难。因此,研究者开始寻求自动化的方法,以处理和分析这些数据,从而提取出有意义的特征,用于疾病的分类和预测。
传统的机器学习方法在处理高维数据时存在一定的局限性,尤其是在解释模型决策过程方面。近年来,深度学习技术,特别是卷积神经网络(CNN),在图像分类任务中取得了显著的成果。CNN能够自动从数据中学习特征,并在多种应用场景中表现出色。然而,CNN模型通常被视为“黑箱”,其决策过程缺乏透明性,这在医学影像分析中可能是一个障碍,因为医生和研究人员需要了解模型是如何得出结论的,以便更好地应用于临床实践。
为了解决这一问题,本研究提出了一种结合可解释性技术的机器学习管道,旨在利用rs-fMRI数据,对ALS患者和健康对照组进行分类,同时提供模型决策的解释。该管道由三个主要部分组成:(1)使用独立成分分析(ICA)对rs-fMRI数据进行预处理,随后通过双回归(dual regression)降低数据维度并生成个体化的功能网络图;(2)训练一个三维卷积神经网络(3D-CNN),以对每个个体的rs-fMRI图像进行分类,判断其是否为ALS患者或健康对照;(3)应用显著性图(saliency map)和Grad-CAM++等技术,对模型的分类决策进行可视化,以揭示其关注的关键脑区。
ICA是一种数据驱动的分析方法,可以将rs-fMRI数据分解为多个独立的成分,每个成分代表一个特定的功能网络。通过ICA,研究者能够分离出噪声,提取出具有代表性的信号,从而减少数据的复杂性,提高分析的效率。随后,双回归方法被用于进一步降低数据维度,并生成个体化的功能网络图,这有助于更精确地识别与ALS相关的脑区变化。
在模型训练阶段,研究者采用3D-CNN对提取出的个体化功能网络图进行分类。3D-CNN在处理三维数据时表现出色,能够有效捕捉空间和时间上的特征。通过训练该模型,研究者成功地将rs-fMRI数据分为ALS患者和健康对照组,并取得了较高的分类准确率。其中,使用感觉运动网络(SMN)图进行分类的准确率为78.3%,而使用视觉网络(VN)图的准确率则达到了83.3%。这一结果表明,这些功能网络在区分ALS患者和健康对照组方面具有重要的价值。
为了进一步提高模型的可解释性,研究者引入了显著性图和Grad-CAM++技术。这些技术能够可视化模型在分类过程中关注的特定脑区,从而揭示其决策依据。结果显示,模型关注的脑区与双回归分析中发现的组间差异区域高度一致。这一发现不仅增强了模型的可信度,也为未来的研究提供了新的方向,即通过识别这些关键脑区,深入了解ALS的病理机制。
本研究的意义在于,它不仅开发了一种新的机器学习方法,还强调了可解释性在医学影像分析中的重要性。随着人工智能技术在医学领域的广泛应用,如何确保模型的决策过程透明、可理解,成为了一个重要的研究课题。本研究提出的管道,通过结合ICA、双回归和3D-CNN等技术,不仅提高了rs-fMRI数据的分类准确率,还提供了模型决策的可视化证据,使研究人员和临床医生能够更好地理解模型的判断依据。
此外,本研究的结果也为未来的临床应用提供了可能性。由于rs-fMRI能够提供关于大脑功能网络的详细信息,它在疾病的早期诊断和病情监测中具有潜在的应用价值。然而,目前rs-fMRI在临床实践中的应用仍受到数据复杂性和分析方法的限制。本研究提出的可解释机器学习模型,有望克服这些障碍,使rs-fMRI成为一种实用的生物标志物,用于ALS的诊断和治疗监测。
在方法的实施过程中,研究者对参与者进行了严格的筛选。根据修订后的El Escorial标准,30名ALS患者(包括9名确定性ALS、14名可能性ALS和7名可能性ALS)以及30名健康对照组被纳入研究。此外,研究者还排除了5名因运动伪影而影响数据质量的患者。通过这样的筛选过程,研究者确保了数据的可靠性和代表性。在统计分析中,研究者发现ALS患者与健康对照组在年龄和性别方面没有显著差异,这表明研究结果可能不受这些因素的影响。
在讨论部分,研究者强调了本研究的创新之处。他们指出,传统的rs-fMRI分析方法往往难以准确捕捉与疾病相关的特征,而本研究通过结合ICA和双回归技术,成功地提取了关键的功能网络图,从而提高了分类的准确性。同时,通过应用显著性图和Grad-CAM++,研究者不仅能够展示模型的决策依据,还能够验证这些依据是否与已知的疾病相关区域一致。这种可解释性对于医学研究和临床实践来说至关重要,因为它有助于建立模型与实际病理之间的联系,从而提高其在实际应用中的可信度和接受度。
本研究的结果也表明,3D-CNN在处理rs-fMRI数据时具有较高的分类能力,特别是在感觉运动网络和视觉网络方面。这些网络的变化可能反映了ALS在不同脑区的病理进展,为疾病的机制研究提供了新的视角。此外,研究者还指出,尽管深度学习在医学影像分析中展现出巨大潜力,但其在rs-fMRI数据上的应用仍处于初步阶段。因此,本研究不仅为未来的研究提供了方法上的参考,也为实际应用奠定了基础。
综上所述,本研究通过开发一种可解释的机器学习管道,成功地利用rs-fMRI数据对ALS患者和健康对照组进行了分类。该管道结合了ICA、双回归和3D-CNN等技术,提高了数据处理的效率和分类的准确性,同时通过显著性图和Grad-CAM++技术增强了模型的可解释性。这些成果不仅有助于理解ALS的病理机制,还为未来的临床应用提供了重要的技术支持。随着人工智能技术的不断发展,可解释的机器学习方法将在医学领域发挥越来越重要的作用,为疾病的诊断、治疗和监测提供更加精准和可靠的工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号