基于CT动脉期2.5D深度学习与多示例学习预测肝细胞癌早期复发及与病理指标关联性研究

【字体: 时间:2025年09月18日 来源:Journal of Investigative Surgery 3.5

编辑推荐:

  本研究创新性地构建基于CT动脉期图像的2.5D深度学习-多示例学习(2.5D DL-MIL)模型,在预测肝细胞癌(HCC)早期复发(ER)方面展现出卓越性能(AUC=0.840),显著优于传统影像组学和临床模型。通过SHAP分析揭示Bag-of-Words特征(如BoW_02、BoW_09)的关键贡献,并首次证实这些特征与微血管侵犯(MVI)分级和Ki-67表达显著相关,为深度学习特征赋予明确生物学意义。

  

研究背景与目的

肝细胞癌(HCC)作为全球第六大常见恶性肿瘤和第三大癌症相关死亡原因,术后复发是影响患者预后的关键因素。早期复发(ER)机制与肿瘤侵袭性(如微血管侵犯MVI、病理分级)和增殖活性(如Ki-67高表达)密切相关。尽管巴塞罗那临床肝癌(BCLC)分期系统和血清肿瘤标志物检测为HCC风险分层提供重要信息,但其对术后复发风险的预测性能有限,可能原因在于未能充分捕捉肿瘤异质性。本研究旨在开发基于CT动脉期图像的2.5D深度学习-多示例学习(2.5D DL-MIL)模型,评估其预测HCC早期复发的优势,并探索多示例学习特征与复发相关病理指标的生物学关联。

材料与方法

回顾性纳入191例接受根治性切除术的HCC患者,根据术后两年内随访结果分为早期复发组(ER=79)和非早期复发组(NER=112)。按7:3比例随机划分为训练集(133例)和验证集(58例)。所有患者术前一周内完成CT动脉期扫描和实验室检查,排除存在图像伪影或既往接受抗肿瘤治疗者。

CT图像预处理采用ITK-SNAP软件由两名经验丰富的放射科医师手动逐层勾画肿瘤轮廓,并进行体素间距标准化(1mm×1mm×1mm)和窗宽窗位标准化(窗宽259HU,窗位40HU)。2.5D数据生成以肿瘤最大横截面为中心层,选取相邻±1、±2、±4、±7、±9层共11层CT图像构建数据集。

采用ResNet18、ResNet101和DenseNet121三种深度学习架构进行切片级模型训练,通过多示例学习框架整合预测似然直方图(PLH)和词袋(BoW)方法,结合词频-逆文档频率(TF-IDF)加权策略构建MIL特征。经过Z-score标准化、t检验/Mann-Whitney U检验特征筛选(P<0.05)、Pearson相关性去冗余(r>0.9)和Lasso回归特征选择后,使用ExtraTrees算法构建预测模型,并采用SMOTE技术解决样本不平衡问题。

同时建立传统影像组学模型(基于手动勾画提取特征)和临床模型(基于AFP和性别等显著差异指标),比较三模型预测性能。通过SHAP分析解析模型决策机制,并采用Pearson相关性分析探索MIL特征与MVI分级、Ki-67表达指数及病理分级的相关性。

结果

基线特征分析显示训练集中AFP水平(P=0.012)和性别(P=0.016)在ER与NER组间存在显著差异。病理特征方面,191例HCC患者中Ki-67表达指数平均为0.23±0.21,MVI发生率为35.08%(67/191),病理分级包括Edmondson-Steiner I级13例(6.81%)、II级82例(42.93%)、III级73例(38.22%)和IV级23例(12.04%)。

切片级预测结果表明ResNet18在验证集表现最优(AUC=0.716),显著优于ResNet101(0.588)和DenseNet121(0.675),因此被选为后续MIL应用的基础架构。Grad-CAM可视化显示模型能自动聚焦于血供丰富区域和肿瘤-正常组织交界区。

模型比较显示2.5D DL-MIL模型在验证集表现卓越(准确率0.741,AUC 0.840,敏感性0.870,特异性0.657),显著优于影像组学模型(AUC=0.678,P=0.047)和临床模型(AUC=0.598,P=0.009)。决策曲线分析证实2.5D DL-MIL模型具有更优临床适用性。SHAP分析揭示BoW_01、BoW_02和BoW_03对HCC早期复发预测呈负向影响,而BoW_09、BoW_10和BoW_1呈正向影响,其中BoW_02贡献度最高。

相关性分析发现BoW_01(r=-0.22, P=0.0021)和BoW_02(r=-0.20, P=0.0066)与MVI分级显著负相关,BoW_09(r=0.22, P=0.0022)和BoW_1(r=0.30, P<0.0001)与MVI分级显著正相关。Ki-67表达方面,BoW_02与Ki-67指数负相关(r=-0.22, P=0.0026),BoW_09(r=0.24, P=0.0007)和BoW_1(r=0.19, P=0.0076)呈正相关。所有MIL特征与病理分级无显著相关性。

讨论

2.5D DL-MIL模型在预测HCC早期复发方面展现显著优势,其成功源于多重创新因素:2.5D深度学习技术整合肿瘤最大截面周围多层信息,比传统2D模型更能全面捕捉三维空间特征;多示例学习框架通过聚合多切片预测结果克服单切片信息局限性,有效表征肿瘤异质性;采用先进深度学习架构自动学习复杂特征表示,避免传统影像组学人工提取特征的主观性。

SHAP分析为模型决策机制提供重要解释,不同MIL特征在预测中扮演不同角色:负向影响特征可能代表相对良性生物学行为的影像特征,如较高ADC值和完整包膜;正向影响特征可能反映肿瘤较高侵袭性或复发倾向的影像特征,如较大肿瘤尺寸和不光滑肿瘤边缘。这种可解释性增强临床信任度。

MIL特征与病理指标相关性为模型提供生物学验证:BoW_02低值和BoW_09、BoW_1高值提示HCC具有较高侵袭性和活跃肿瘤细胞增殖,与这些特征在SHAP分析中的影响方向一致。BoW_01与MVI分级相关但不与Ki-67表达相关,表明其反映HCC侵袭性而不表征肿瘤细胞增殖活性。这些发现说明2.5D DL-MIL模型有效捕捉与HCC术后复发相关的影像信息,可能间接反映肿瘤分子生物学过程特征。

临床应用中,该模型可为HCC术后个性化治疗和随访提供精确指导:高风险患者可缩短随访间隔并考虑术后辅助治疗(如术后经动脉化疗栓塞、靶向药物疗法等);低风险患者可适当延长随访间隔,减少不必要的医疗费用和辐射暴露。

研究局限性包括回顾性设计可能存在的选择偏倚、单中心相对小样本量以及尚未探索影像特征与分子机制关联。未来计划开展中国三家医疗中心参与的多中心大样本前瞻性研究,通过影像基因组学关联分析阐明影像特征背后的分子机制。

结论

2.5D DL-MIL模型在预测HCC早期复发方面具有显著价值,其MIL特征与肿瘤侵袭性和增殖活性密切相关。SHAP分析和相关性研究为模型决策机制和生物学意义提供关键见解,为放射学在HCC精准诊疗领域的进步奠定坚实基础。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号