基于可解释人工智能(XAI)的自闭症诊断与家庭支持新框架——TabPFNMix与SHAP的融合应用
《Scientific Reports》:Bridging the gap: explainable ai for autism diagnosis and parental support with TabPFNMix and SHAP
【字体:
大
中
小
】
时间:2025年11月20日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对自闭症谱系障碍(ASD)诊断准确率低、模型可解释性差以及家长支持信息不足等问题,开发了一种结合TabPFNMix回归器和SHAP(Shapley Additive Explanations)的可解释人工智能(XAI)框架。研究利用公开基准数据集进行验证,结果显示该框架诊断准确率达到91.5%,显著优于XGBoost(87.3%)等传统模型,并成功识别出社会反应评分、重复行为量表等关键诊断因素,为临床诊断和家长参与提供了透明、可靠的决策支持。
在全球范围内,自闭症谱系障碍(Autism Spectrum Disorder, ASD)影响着越来越多的个体,成为一种复杂的神经发育状况。尽管已有大量研究,但ASD的根本成因仍不明确,遗传倾向、父母病史和环境因素被识别为潜在风险因素。由于症状表现高度异质且常与其他神经发育障碍重叠,ASD的诊断始终充满挑战。早期且准确的诊断对于及时干预至关重要,能显著改善患者的发育结果并为其家庭提供有效支持。然而,传统诊断方法多依赖行为观察和临床判断,存在主观性强、耗时久、可及性差等问题,尤其在医疗资源匮乏地区更为突出。近年来,人工智能(AI)虽在医疗领域展现出变革潜力,但其“黑箱”特性使得临床医生和家长难以理解和信任模型的决策过程,这严重阻碍了AI在ASD诊断中的实际应用。
为解决上述问题,Shimei Jiang在《Scientific Reports》上发表了一项研究,提出了一种新颖的AI框架,该框架融合了可解释AI(Explainable AI, XAI)技术,旨在提升ASD诊断的准确性,并为医疗专业人士和照料者提供可理解的决策依据。该研究的核心在于利用专为结构化医疗数据优化的TabPFNMix回归器(一种先进的分类模型),并结合SHAP(Shapley Additive Explanations)来解释模型的预测结果,从而在保证高精度的同时,确保模型的透明度和可解释性。
研究人员开展了一项系统的验证研究。他们采用了一个公开的ASD基准数据集(包含120余个样本,每个样本具有115个特征,包括人口统计学、行为学和医学特征)。数据集经过预处理,包括使用k近邻(k-NN)算法填补缺失值、数值特征标准化以及分类变量独热编码。研究将数据划分为训练集(70%)、验证集(15%)和测试集(15%)。核心模型TabPFNMix是一种专为表格数据设计的混合机器学习模型,它结合了树模型和神经网络的优势,使用二元交叉熵损失函数进行训练。为评估模型性能,研究采用了准确率、精确率、召回率、F1分数和AUC-ROC曲线下面积等指标,并与随机森林(Random Forest)、XGBoost、支持向量机(SVM)和深度神经网络(DNNs)等基线模型进行了比较。此外,还通过消融实验分析了特征选择和预处理步骤的重要性,并利用SHAP进行特征重要性分析,以识别影响ASD诊断的关键因素。
研究结果显示,所提出的TabPFNMix框架在ASD诊断任务上表现卓越。
基线模型比较:TabPFNMix在各项评估指标上均显著优于基线模型。其准确率达到91.5%,比次优的XGBoost模型高出4.2个百分点。同时,它在召回率(92.7%)、精确率(90.2%)、F1分数(91.4%)和AUC-ROC(94.3%)上也取得了最高值,表明其不仅诊断准确率高,而且能有效减少假阴性(漏诊)和假阳性(误诊),具备良好的鲁棒性。
消融研究:研究通过系统性地修改或移除模型的关键组件,深入分析了各因素对性能的影响。实验表明,完整的特征集和预处理步骤(特别是缺失值填补和标准化)对维持模型高性能至关重要。当移除缺失值填补时,模型准确率下降至84.8%;移除特征标准化时,准确率降至86.4%。而使用随机特征选择或仅保留前10个特征也会导致性能下降,但幅度小于完全移除预处理步骤。这证实了精心设计的特征工程和数据预处理是TabPFNMix模型取得成功的基础。
SHAP特征重要性分析:利用SHAP进行的可解释性分析揭示了影响ASD诊断的最关键特征。社会反应评分(Social responsiveness score)、重复行为量表(Repetitive behavior scale)和父母生育年龄(Parental age at birth)被识别为最具影响力的因素,其SHAP值(平均绝对SHAP值分别为0.415, 0.392, 0.358)远高于其他特征。这一发现与现有医学文献高度一致,增强了模型预测结果的可靠性。SHAP依赖图还进一步揭示了特征间的交互作用,例如父母神经发育障碍史与遗传易感性之间的联合效应。
鲁棒性与泛化性研究:模型在外部验证数据集上保持了88.1%的准确率,仅比主数据集(91.5%)略有下降。十折交叉验证的平均准确率为90.8%,标准差较低(0.48),表明模型对不同数据划分具有稳定性。在不同亚组(如不同年龄、性别、ASD严重程度)上的性能分析显示,模型在儿童和青少年中表现最佳,在成人中稍弱(可能因样本量较小);在不同性别间表现平衡;对于轻度ASD病例的诊断准确性(87.3%)低于中重度病例,提示区分轻微症状与正常行为仍具挑战性。
模型推断时间与计算效率:TabPFNMix在计算效率方面也表现出色,其平均推断时间仅为每样本3.2毫秒,远低于DNNs(12.8毫秒)和SVM(9.5毫秒)。训练时间(28.4秒)和内存占用(1.4 GB)也处于合理范围,表明其适合在临床环境中进行实时或近实时部署。
与前沿研究的比较:与Halim等人(2023)和Alzakari等人(2025)的最新研究相比,TabPFNMix在准确率(91.5% vs 87.2% 和 89.1%)和AUC-ROC(0.942)方面均显示出优势,同时在推断速度上远超基于深度神经网络的方法。
该研究的结论部分强调,集成TabPFNMix和SHAP的框架显著提升了ASD诊断的准确性和可解释性。模型识别出的关键诊断因素与医学共识相符,增强了其结果在临床实践中的可信度。SHAP提供的透明解释不仅有助于临床医生验证AI的诊断,更重要的是能为家长提供清晰的见解,帮助他们理解孩子的状况并参与干预决策,从而在诊断准确性和家庭支持之间架起桥梁。然而,研究也指出了若干局限性,例如对结构化数据的依赖可能限制其应用场景,以及SHAP解释的计算成本在资源有限环境中可能构成挑战。未来工作可探索融入多模态数据(如语音、面部图像)以提升诊断的全面性,并进一步优化解释技术以实现更广泛的临床应用。
总之,这项研究为ASD的早期识别和家庭支持提供了一种强大而透明的AI驱动工具,代表了在弥合先进AI技术与实际临床需求之间差距的重要一步。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号