基于多中心大样本机器学习模型LIDGAX术前精准鉴别黄色肉芽肿性胆囊炎与胆囊癌的研究

《npj Digital Medicine》:Machine learning model for differentiating xanthogranulomatous cholecystitis and gallbladder cancer in multicenter largescale study

【字体: 时间:2025年10月03日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对黄色肉芽肿性胆囊炎(XGC)与胆囊癌(GBC)术前鉴别难题,开发了机器学习模型LIDGAX。通过整合临床、影像及实验室数据,模型在外部验证中AUC达0.88,显著提升诊断敏感性与特异性,并减少放射科医师诊断时间。该工具已部署于开源平台,为临床精准决策提供非侵入性支持。

  
在肝胆外科临床实践中,黄色肉芽肿性胆囊炎(Xanthogranulomatous Cholecystitis, XGC)与胆囊癌(Gallbladder Cancer, GBC)的术前鉴别始终是一大挑战。两者在临床症状(如腹痛、黄疸)和影像学表现(如胆囊壁增厚、邻近组织浸润)上高度重叠,导致误诊率高达10%-30%。若将GBC误判为XGC,可能延误根治性手术时机;反之,若将XGC误诊为GBC,则可能使患者承受不必要的肝切除、淋巴结清扫或辅助放化疗等过度治疗。目前,超声(US)、增强CT(CECT)和磁共振成像(MRI)是术前主要诊断手段,但单一影像模态的鉴别能力有限,且依赖医师经验。因此,开发一种能够整合多源数据、实现客观精准鉴别的工具迫在眉睫。
为突破这一瓶颈,浙江大学医学院附属第一医院联合多家中心开展了一项多中心回顾性研究,构建了基于机器学习的智能鉴别模型LIDGAX(LightGBM Intelligent Differentiator for XGC and GBC)。该研究纳入1246例经病理确诊的患者(554例XGC、692例GBC),通过多变量逻辑回归和LASSO(Least Absolute Shrinkage and Selection Operator)分析筛选出12个关键预测变量,包括性别、胆囊结石、胆管扩张、黏膜线连续性、壁内结节、瘤内肿瘤、周围淋巴结肿大、纤维蛋白原水平等。研究团队对比了六种机器学习算法(逻辑回归、随机森林、支持向量机、XGBoost、LightGBM和多层感知机),发现LightGBM模型性能最优,其在内部验证队列和外部测试队列中的AUC分别达到0.94和0.88,显著优于其他模型。此外,LIDGAX在放射科医师读片实验中展现出更高诊断一致性,并将平均诊断时间缩短30秒以上。研究成果发表于《npj Digital Medicine》,为术前鉴别提供了高效、可解释的辅助工具。
本研究的关键技术方法包括:首先,从四家医院收集患者临床资料、影像特征(US、CECT、MRI)及实验室指标(共79个变量),经缺失值插补和标准化预处理后,通过LASSO回归筛选出12个核心特征;其次,采用时间分层五折交叉验证评估模型稳定性;最后,利用SHAP(SHapley Additive exPlanations)值解析特征贡献度,并通过开源平台(https://lidgaxmodel.streamlit.app)实现临床部署。

模型构建与性能验证

通过多阶段特征筛选,LIDGAX最终纳入的12个变量涵盖临床、影像及实验室指标。模型在训练队列中AUC达0.98-1.00,内部验证队列中为0.92-0.94,外部测试队列中稳定在0.86-0.88。校准曲线和决策曲线分析表明,LIDGAX具有优异的临床实用性和预测一致性。

模型可解释性分析

SHAP分析显示,瘤内肿瘤和黏膜线连续性是区分XGC与GBC的最重要特征。例如,瘤内肿瘤的存在显著推高GBC预测概率,而黏膜线完整则更支持XGC诊断。个案力图示例如进一步验证了模型决策的透明性。

亚组分析与多模态对比

亚组分析证实LIDGAX在不同年龄、性别、时间段和医疗中心均保持稳健性能(AUC 0.85-0.91)。对比单模态模型(临床、影像或实验室单独建模)发现,融合多源数据的LIDGAX显著优于单一数据源模型(P<0.0001),其中影像特征贡献度最高。

医师读片实验

与六名放射科医师(包括专科医师、普通医师和实习生)对比,LIDGAX单独诊断的平衡准确率(88.2%)高于未辅助医师(76.3-85.2%)。在LIDGAX辅助下,医师诊断敏感性提升1.2-8.5%,特异性提升0.0-4.6%,诊断时间减少30.44-35.76秒。

真实世界验证

在124例真实世界队列中,LIDGAX通过在线平台实现AUC 0.95、准确率0.92、敏感性0.94和特异性0.89,验证其临床转化潜力。
本研究开发的LIDGAX模型首次在大规模多中心数据基础上实现了XGC与GBC的精准术前鉴别。其优势在于整合多维度数据、具备可解释性,并能无缝集成临床工作流。尽管存在回顾性设计的局限,但通过外部验证和真实世界测试证明了泛化能力。未来结合深度学习与前瞻性试验,有望进一步优化诊断效能。LIDGAX的推出不仅降低了误诊风险,也为肝胆疾病智能诊疗树立了新范式。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号