基于异常检测与跨模态表征学习的阿尔茨海默病多模态诊断新方法
《IEEE Transactions on Neural Systems and Rehabilitation Engineering》:Outlier detection and cross-modal representation learning for multimodal Alzheimer’s disease diagnosis
【字体:
大
中
小
】
时间:2025年11月25日
来源:IEEE Transactions on Neural Systems and Rehabilitation Engineering 5.2
编辑推荐:
本文针对阿尔茨海默病(AD)早期诊断中存在的异常样本干扰和跨模态信息利用不足两大挑战,提出了一种融合异常检测与跨模态表征学习的ODCML模型。该研究通过马氏距离构建异常检测向量降低异常样本权重,采用多潜在空间映射和自适应图融合技术挖掘模态间互补信息。实验表明该方法在ADNI数据集上显著提升AD/NC、NC/LMCI、EMCI/LMCI分类任务的准确率达92.75%/75.81%/78.98%,为AD早期诊断提供了更鲁棒、精准的解决方案。
随着全球人口老龄化进程加速,阿尔茨海默病(Alzheimer's Disease, AD)已成为严重威胁老年人健康的神经退行性疾病。患者脑部神经细胞逐渐死亡,导致脑组织流失,临床表现为记忆功能障碍、认知推理能力下降等症状。值得注意的是,轻度认知障碍(Mild Cognitive Impairment, MCI)作为AD的重要前驱阶段,患者虽未达到痴呆诊断标准,但已有明显认知能力减退。研究显示,相当比例的MCI患者会在数年内发展为AD,因此早期识别MCI对于延缓疾病进展具有关键意义。
目前,基于多模态神经影像数据(如磁共振成像MRI、正电子发射断层扫描PET)的机器学习方法已在AD研究中取得显著进展。然而现有方法面临两大核心挑战:一是缺乏有效的异常样本处理机制,医学影像数据中因扫描参数差异、个体生理变异等因素产生的异常值会扭曲模型学习过程;二是未能充分挖掘多模态数据间的互补性结构信息,导致模型判别力不足。这些局限性制约了AD早期诊断的准确性与鲁棒性。
为解决这些问题,西南交通大学徐立强等研究人员在《IEEE Transactions on Neural Systems and Rehabilitation Engineering》发表论文,提出了一种异常检测与跨模态表征学习(ODCML)模型。该研究通过引入多潜在空间映射和自适应图融合技术,充分挖掘多模态结构关系;同时基于马氏距离(Mahalanobis Distance)构建异常检测向量,自适应降低异常样本的学习权重。通过交替优化算法确保模型收敛,最终在ADNI数据集上验证了方法的优越性。
本研究采用的核心技术方法包括:1)基于图融合的跨模态表征学习框架,通过多潜在空间映射分离提取各模态关键特征;2)马氏距离驱动的异常检测机制,利用特征协方差矩阵消除量纲影响;3)?2,1-范数约束的特征选择策略,提升模型稀疏性与可解释性;4)支持向量机(SVM)分类器实现AD/NC、NC/LMCI、EMCI/LMCI等二元分类任务。实验数据来自ADNI公共数据库,包含174例正常对照(NC)、145例AD、171例晚期MCI(LMCI)和214例早期MCI(EMCI)样本,所有样本均包含MRI和PET双模态数据。
ODCML模型通过交替优化算法求解目标函数。在更新投影矩阵Wv时,采用平滑近似框架处理?2,1-范数非光滑问题;统一相似度矩阵Z通过闭式解更新,确保非负性;潜在空间矩阵H和Fv通过矩阵求导获得解析解。理论证明显示目标函数值随迭代次数增加单调递减,约40次迭代后收敛。
对比单模态(MRI或PET)与多模态(MRI+PET)实验结果发现,多模态数据在各项指标上均显著优于单模态。在AD vs. NC任务中,多模态准确率(ACC)达92.75%,较单模态提升约3-5个百分点。这表明MRI提供的脑结构信息与PET反映的代谢功能信息具有互补性,联合使用能更全面捕捉病理特征。
通过消融实验验证异常检测向量的作用。移除该模块的ODCML-M模型在NC vs. LMCI任务中ACC下降至72.15%,证明马氏距离能有效识别并抑制异常样本干扰。异常检测向量通过加权融合各模态异常评分,克服单模态检测的局限性。
对比ODCML-B(移除跨模态学习)发现,该变体在EMCI vs. LMCI任务中ACC降至70.32%,显著低于完整模型(78.98%)。双阶段潜在空间学习策略(先模态专属映射后统一融合)有效避免单次映射的信息损失,自适应图融合技术则增强了模态间结构一致性。
关键参数实验表明:近邻数k最优值为35,过小会导致图结构信息不足,过大会引入噪声;正则化参数λ1、λ3、λ5、λ6在[10-5,10-4]区间性能最优,平衡了特征选择强度与模型复杂度。
模型筛选出的关键脑区与医学认知高度吻合。在NC vs. MCI任务中,杏仁核(Amygdala)、海马体(Hippocampus)和丘脑(Thalamus)等记忆相关脑区被显著选择;补充运动区(SMA)、楔叶(Cuneus)和岛叶(Insula)作为默认模式网络(DMN)组成部分,其异常活动已被证实与MCI相关。右侧直回(Rectus Gyrus)和额下回(Inferior Frontal Gyrus)的入选印证了情绪调节与高级认知功能在AD演进中的作用。
通过凸优化理论证明算法收敛性,实验显示目标函数值在AD vs. NC任务中经40次迭代趋于稳定,LMCI相关任务需45次迭代。收敛曲线符合平滑近似框架的理论预期。
本研究通过系统性地整合异常检测与跨模态学习机制,为AD早期诊断提供了新思路。ODCML模型在ADNI数据集上的卓越表现证实了其临床应用的潜力:一方面,马氏距离驱动的异常权重分配增强了模型对医疗数据固有噪声的鲁棒性;另一方面,双阶段潜在空间学习与图融合技术充分挖掘了多模态数据的互补价值。该方法不仅显著提升了MCI识别准确率(较基线方法提升超15%),其筛选的关键脑区特征还与神经病理学机制相互印证,增强了模型的可解释性。未来工作可拓展至脑脊液检测、遗传数据等多模态信息融合,进一步推动精准医疗在神经退行性疾病领域的应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号