基于全切片图像与图神经网络的AI模型精准预测T1期食管鳞癌淋巴结转移
《npj Precision Oncology》:Artificial intelligence-driven prediction of lymph node metastasis in T1 esophageal squamous cell carcinoma using whole slide images
【字体:
大
中
小
】
时间:2025年11月24日
来源:npj Precision Oncology 8
编辑推荐:
本研究针对T1期食管鳞状细胞癌(ESCC)内镜黏膜下剥离术(ESD)后淋巴结转移(LNM)风险预测的临床难题,开发了一种基于全切片图像(WSI)的人工智能(AI)预测模型。该研究采用层次化图神经网络(GNN)架构,通过对手术切除标本的WSI进行深度学习,在内部验证中曲线下面积(AUC)达0.949。在外部ESD高危病例(浸润深度MM至SM2)验证中,模型阴性预测值(NPV)高达96.9%,特异性达91.4%。结果表明该AI模型可有效识别低LNM风险患者,为减少过度治疗提供了可靠的决策支持工具。
在全球范围内,食管鳞状细胞癌(ESCC)始终是重大的公共卫生负担,其发病率和死亡率在中国尤为突出。对于局限于黏膜或黏膜下浅层(T1a)的早期病变,内镜黏膜下剥离术(ESD)已被确立为一线根治性治疗方法。然而,ESD术后的组织病理学评估至关重要,一旦发现淋巴血管侵犯(LVI)、肿瘤出芽等高危特征,通常建议进行补充性食管切除术,因为这些特征与淋巴结转移(LNM)风险相关。但食管切除术创伤大、并发症多,尤其对于老年或合并多种疾病的患者,存在过度治疗的担忧——因为仅有约10%的LVI患者最终会发生淋巴结转移。这凸显了对ESD术后标本进行精准风险分层的迫切需求,以准确识别隐匿性LNM,从而实现个体化管理,减少低风险患者的不必要手术。
当前检测肿瘤转移(尤其是微转移)的传统诊断范式依赖于病理学家高强度的手工切片评估,该过程因形态学特征细微,易受诊断不确定性的影响。这些挑战表明,亟需自动化、客观的工具来增强组织病理学评估。过去十年,人工智能(AI)已成为医学诊断领域的变革性工具,能够对复杂的成像数据进行自动化或半自动化分析。计算病理学的进步——得益于高通量切片扫描、增强的计算能力和可扩展的存储方案——进一步扩展了AI挖掘微观病变和解读千兆像素级数字图像(即全切片图像,WSI)的能力。虽然AI驱动的LNM预测已在多种癌症中得到探索,但其在ESCC中的应用尚属空白,这是优化早期疾病风险分层的一个关键缺口。
为了应对早期ESCC(浸润深度从MM至SM2)LNM风险评估这一未满足的需求,研究人员开展了一项创新性研究。他们开发了一种基于监督学习的AI驱动图神经网络(GNN)模型,用于分析ESD标本的WSI。该方法旨在减少诊断主观性,提高微转移检测能力,并最终指导ESD术后的个体化管理。相关研究成果已发表在《npj Precision Oncology》上。
为完成此项研究,作者主要采用了以下几个关键技术方法:研究设计上,利用了一个包含374例接受原发性食管切除术(无既往ESD史)患者的手术队列进行模型开发,并从中平衡选取160例(72例LNM+,88例LNM-)用于训练、验证和内部测试;同时,一个独立的包含35例T1期ESCC(MM至SM2)ESD患者的外部队列用于验证。模型核心为一种层次化图神经网络(GNN)框架:首先将WSI分割成图像块,提取多模态特征(颜色直方图、空间坐标、ResNet-50深度特征嵌入),然后构建k近邻图(k=10)来表征组织学结构,通过两层图卷积层(GCNConv)进行消息传递以捕获空间依赖性,最后通过全局平均池化和分类器进行LNM预测。模型训练采用了加权交叉熵损失、Adam优化器及早停法等策略以优化性能并防止过拟合。模型性能通过受试者工作特征曲线下面积(AUC)、敏感性、特异性、阴性预测值(NPV)等指标进行评估。
本研究使用了两个独立的患者队列。模型开发基于一个手术队列,该队列最终纳入的160例患者被随机以7:3的比例分为训练/验证集(n=112, 442张WSI)和内部测试集(n=48, 217张WSI)。两组在年龄、性别、肿瘤大小、临床分期、肿瘤位置、分化等级、淋巴血管侵犯、神经侵犯状态、淋巴结检出数目等关键基线特征及实际LNM率(46.4% vs. 41.6%)方面均无统计学显著差异,表明分组均衡。外部验证队列包含35例接受ESD的高危患者,其最终淋巴结状态通过组织学确认或3年无复发生存(RFS)确认,其中4例为LNM+,31例为LNM-。
在内部测试集上确定模型的最佳截断值后,模型在预测ESCC的LNM方面表现出强大性能:内部验证队列的AUC为0.949(95% CI: 0.912-0.986),外部ESD验证队列的AUC为0.866(95% CI: 0.768-0.964)。
在外部验证队列中,按每张切片计算,AI模型的准确率达到90.1%。其性能指标包括敏感性81.8%、特异性91.4%、F1分数69.2%,以及阴性预测值(NPV)高达96.9%。如此高的NPV表明,该模型有潜力通过正确识别大部分非转移性病例来减少不必要的手术。对应的混淆矩阵显示有18个真阳性(TP)、4个假阴性(FN)、127个真阴性(TN)和12个假阳性(FP),结果强调了模型的高准确性和可靠性,特别是在正确分类非转移性病例方面,有效降低了假阳性预测的风险。
为了反映真实世界的临床决策(即单张切片阳性通常将病例定义为高风险),研究人员使用最大池化规则将切片水平预测聚合到病例水平。在外部ESD队列中,模型在病例水平上取得了稳健的性能:敏感性为100.0%(4/4),特异性为83.9%(26/31),总体准确率为85.7%(30/35)。尤为重要的是,病例水平的NPV达到了100.0%(26/26)。这一极高的NPV表明模型在识别可安全避免食管切除术的患者方面具有高度可靠性,同时保持了对真实转移病例检测的高敏感性。
本研究成功开发并验证了一个不依赖病理学家的AI模型,该模型能够利用ESD术后标本的WSI准确预测T1期ESCC的LNM风险。该模型基于层次化GNN框架,能够从WSI中自主学习多尺度组织病理学表征,捕获复杂的形态学模式,而无需依赖主观的人工判读。尽管模型开发时因淋巴结阳性T1 ESD病例有限而纳入了更晚期的病例,但其在最具临床相关性的MM-SM2 ESD病例外部验证中表现优异,特别是其极高的NPV(切片水平96.9%,病例水平100%)凸显了其在可靠识别LNM低风险患者方面的能力,这部分患者可能适合保守管理,从而有望减少不必要的手术。
该框架的一个关键创新在于其超越了传统的感兴趣区域(ROI)或基于图像块的分析方法的局限。通过构建一个整合多模态特征的生物学可解释的k近邻图,GNN架构有效地模拟了局部和全局的组织结构,无需人工标注,克服了那些会引入噪声或无法捕获空间依赖关系的方法的局限性。这种端到端的监督学习方法明确地捕获了组织病理学图像块之间的空间关系,解决了WSI分析中固有的“大海捞针”挑战,并识别出可能在常规评估中被忽略的细微转移特征。
值得注意的是,该AI系统直接从WSI中自主学习了具有预后相关性的形态学模式,无需对已知风险因素进行显式编程。它成功识别出了一部分低风险患者(经术后组织学证实),这些患者按照当前指南本可能被建议手术。为了增强可解释性,研究人员生成了决策热图,可视化模型优先关注的区域。这些热图一致性地突出了与已确立的高危特征(如浸润前沿、富含淋巴细胞的间质)相符的区域,该发现得到了独立专家病理学家的验证,从而为模型的预测提供了生物学合理性。
当然,研究也存在一些局限性,例如单中心回顾性设计可能影响普适性,需要未来多中心前瞻性验证;每位患者包含多张肿瘤切片带来了分析上的复杂性;训练集中包含更晚期病例可能造成域偏移等。然而,这项研究无疑为优化ESCC患者ESD术后管理路径提供了一个强大、自动化的决策支持工具。这种基于GNN的计算病理学方法标志着早期癌症风险分层向更客观、可重复和个性化的方向迈出了重要一步,有望最终改善患者的生活质量。未来的工作应聚焦于外部验证、真实世界临床整合以及开发结合AI预测与分子生物标志物的混合模型,以实现更精准的风险分层。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号