
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多模态机器学习模型的寻常型间质性肺炎诊断与验证:一项前瞻性多中心研究
【字体: 大 中 小 】 时间:2025年09月17日 来源:CHEST 8.6
编辑推荐:
本研究针对寻常型间质性肺炎(UIP)诊断异质性高、预后差的问题,开发了整合影像组学特征与临床数据的机器学习辅助诊断模型。通过前瞻性多中心收集2901例间质性肺疾病(ILD)患者的5321组高分辨率CT(HRCT)数据,采用XGBoost和逻辑回归构建的列线图模型在内部测试集和外部验证集分别达到0.802和0.794的AUC值,其诊断性能堪比10年以上经验的呼吸科专家,且预测的UIP状态与全因死亡率显著相关(HR=2.52, p<0.001),为UIP的精准诊断提供了重要工具。
在间质性肺疾病(Interstitial Lung Disease, ILD)的诊疗领域中,寻常型间质性肺炎(Usual Interstitial Pneumonia, UIP)因其进展迅速、预后较差而备受关注。然而,UIP的诊断始终面临显著异质性——不同医师对影像学表现判断存在差异,缺乏客观统一的诊断标准,这直接影响患者的治疗决策和预后评估。目前临床主要依赖高分辨率计算机断层扫描(High-Resolution Computed Tomography, HRCT)和病理活检,但前者依赖医师经验,后者具有侵入性风险。因此,开发一种准确、无创的辅助诊断工具成为临床迫切需求。
为应对这一挑战,由中国中日友好医院(临床医学研究所)王洪义等研究人员牵头,开展了一项前瞻性多中心研究,旨在通过整合多模态数据构建机器学习模型,提升UIP诊断的准确性与可靠性。该研究最终发表于呼吸领域权威期刊《CHEST》,为ILD的智能诊断提供了重要循证依据。
研究团队从三家医疗中心前瞻性收集了2901例ILD患者的5321组HRCT影像数据,并提取了多模态特征,包括全肺影像组学(Radiomics)指标、人口统计学信息、吸烟史、肺功能参数及合并症数据。采用极端梯度提升(eXtreme Gradient Boosting, XGBoost)和逻辑回归(Logistic Regression)算法构建预测列线图(Nomogram)模型,通过受试者工作特征曲线下面积(Area Under the Curve, AUC)评估模型性能,并利用Cox回归分析验证其与预后的关联。
方法学要点
本研究基于前瞻性多中心队列,共纳入2901例ILD患者,收集5321组HRCT图像。提取影像组学特征与临床数据后,采用XGBoost和逻辑回归构建分类模型,通过内部测试与外部验证评估性能,并运用Cox回归分析模型预测结果与全因死亡率之间的关联。
研究结果
样本与分组
共5213组有效HRCT数据集被划分为训练集(3639例)、内部测试集(785例)和外部验证集(789例)。整体队列中UIP患病率为43.7%,内部与外部验证集分别为42.7%和41.3%。
模型性能
基于纯影像组学特征的分类器在内部测试集和外部验证集的AUC分别为0.790和0.786;而融合多模态数据后,模型性能显著提升,AUC分别达到0.802和0.794。该集成模型的诊断能力与具有10年以上ILD诊疗经验的呼吸专科医师相当。
预后价值
在中位3.37年的随访期间,共522例患者死亡。多模态机器学习模型所预测的UIP状态与全因死亡风险显著相关,风险比(Hazard Ratio, HR)达2.52(p<0.001),表明该模型具备良好的预后评估价值。
结论与讨论
本研究成功开发并验证了一种基于多模态机器学习算法的UIP诊断模型,该模型整合了HRCT影像组学特征与临床数据,在内部及外部验证中均表现出稳定且较高的诊断效能。其性能媲美资深呼吸科医师,显著降低了诊断异质性。更重要的是,模型预测结果与患者预后密切相关,提示其在风险分层和临床决策支持中具备潜在应用价值。
该研究的创新之处在于首次在大规模前瞻性多中心队列中验证了机器学习模型在UIP诊断中的泛化能力与临床实用性。模型不仅提供诊断辅助,还衔接了预后评估,为实现UIP的早诊早治和个体化管理提供了有力工具。未来,可进一步探索该模型与其他生物标志物或分子通路数据的整合,以深化对UIP病理机制的理解并提升预测精度。
综上所述,这项研究为推动ILD的智能辅助诊断树立了标杆,也为多模态机器学习在呼吸系统疾病中的应用提供了范式。
生物通微信公众号
知名企业招聘