探索2D与3D影像组学模型预测肝细胞癌微血管浸润:肿瘤异质性的新视角

【字体: 时间:2025年09月18日 来源:Frontiers in Oncology 3.3

编辑推荐:

  本研究系统比较了基于增强CT的二维(2D)与三维(3D)影像组学特征在预测肝细胞癌(HCC)微血管浸润(MVI)中的效能,发现2D平衡期(BP)模型与3D门静脉期(PVP)模型表现最优,且影像组学模型显著优于临床特征模型。研究为无创性术前MVI预测提供了新策略,并深入探讨了肿瘤空间异质性的捕获机制,对推动HCC精准诊疗及影像组学标准化具有重要临床意义。

  

引言

肝细胞癌(Hepatocellular Carcinoma, HCC)是全球第六大常见恶性肿瘤和第三大癌症相关死亡原因。世界卫生组织预测,到2025年,新增肝癌病例将超过100万例。手术切除是早期HCC最有效的治疗方法,但术后复发率高达70%,严重影响患者长期生存。术前预测HCC复发并实施针对性干预是紧迫且具有临床意义的课题。

大量研究表明,微血管浸润(Microvascular Invasion, MVI)是HCC术后复发的独立危险因素。作为具有双重血供的高血管化肿瘤,HCC易发生MVI,这是术后复发和转移的最关键病理机制,也是预测HCC复发的关键因素之一。此外,MVI与患者预后相关,是HCC患者术后生存和肝外转移的独立危险因素。

近年来,随着对MVI研究的深入和影像组学的发展,术前精准预测MVI已成为可能。影像组学这一新兴领域由荷兰学者Lambin于2012年首次提出,过去十年迅速发展成为医学影像与精准医学之间的桥梁。

增强计算机断层扫描(Computed Tomography, CT)是HCC患者术前评估最常用的诊断工具之一。基于增强CT图像影像组学特征的预测模型在术前预测HCC MVI方面的高效性已得到广泛认可。然而,现有研究在具体方法和详细方法上存在差异。

在影像组学感兴趣区域(Region of Interest, ROI)勾画中,主要使用两种方法:勾画所有肿瘤受累切片[三维(3D)]和仅勾画最大肿瘤面积的单层轴位切片[二维(2D)]。3D ROI的优势明显,能够全面分析所有肿瘤细胞群体,包括肿瘤内的空间分布,这已成为以往大多数研究的主要方法。相比之下,2D ROI提供更清晰的肿瘤边界和更好的可重复性。此外,2D ROI更易于获取,且与3D ROI相比,工作量和计算资源需求显著减少。鉴于HCC肿瘤内广泛存在的空间异质性,目前尚不清楚代表最大肿瘤横截面积的单层图像是否能在影像组学研究中充分反映整体肿瘤特征。迄今为止,HCC领域尚无研究报道基于2D和3D特征的模型性能差异,需要进一步研究。

材料与方法

患者选择

这项回顾性研究利用深圳市人民医院电子病历系统和影像数据系统中的临床信息和CT图像。研究经深圳市人民医院机构审查委员会批准,豁免知情同意。纳入2015年7月至2022年6月期间在我院接受增强CT扫描的连续患者。样本量基于可行性确定。回顾性收集所有符合资格标准的患者。纳入标准要求所有影像数据使用B样条插值重采样算法统一重新格式化,体素大小为1.0 mm × 1.0 mm × 1.0 mm。排除标准如下:接受术前抗肿瘤治疗的患者;有HCC复发史或并发原发性肿瘤的患者;伴有HCC远处转移的患者;图像质量差;临床或病理信息不完整。

“图像质量差”定义为存在显著运动伪影、低信噪比、感兴趣区域覆盖不完整或其他妨碍准确分割和特征提取的技术问题。图像质量由两名经验丰富的放射科医生独立评估,任何分歧通过协商一致解决。

筛选后,共有150例HCC患者纳入研究(120例男性和30例女性,平均年龄:57岁,范围:29-84岁),包括46例MVI阳性病例和104例MVI阴性病例。从电子病历系统中提取临床特征,包括性别、年龄、癌胚抗原(Carcinoembryonic Antigen, CEA)、甲胎蛋白(Alpha Fetoprotein, AFP)、CA125等44个变量。患者按70:30的比例随机分配到训练组和验证组。所有患者的人口统计学和临床特征总结于表1。

CT成像与ROI分割

所有CT检查均使用深圳市人民医院放射科的螺旋CT扫描仪进行,扫描参数相同。成像方案遵循LI-RADS指南推荐的标准。由一名具有9年临床经验的肝胆外科医生使用3D Slicer软件进行3D手动分割。在所有平扫(Non-contrast, NC)、动脉期(Arterial Phase, AP)、门静脉期(Portal Venous Phase, PVP)和平衡期(Balanced Phase, BP)图像中沿病灶可见边界勾画ROI,涵盖整个病灶体积。多项研究表明,将瘤周区域纳入ROI可增强影像组学模型的预测性能。因此,使用3D Slicer自动扩展3 mm边缘,并手动移除任何延伸至肝脏体积以外的区域,确保最终ROI包含瘤周区域。最终分割结果由一名具有14年临床经验的高级肝胆外科医生验证。随后,软件自动生成肿瘤最大横截面积的2D图像。为评估观察者内可重复性,由同一位肝胆外科医生在影像数据集上随机重新标注一部分ROI。组内相关系数(Intraclass Correlation Coefficient, ICC)分析显示两组标注之间具有良好的一致性。

影像组学特征提取

使用3D Slicer 5.4.0中的Radiomics插件包为每个期相(NC、AP、PVP、BP)提取影像组学特征。应用B样条插值重采样算法标准化图像格式,体素间距为1.0 mm × 1.0 mm × 1.0 mm。对小波变换衍生图像应用相同的提取过程以增强图像数据的维度。

每个数据集包含1,130个特征,并建立一一对应关系以确保可比性。这些特征包括一阶形状特征、一阶统计特征、二阶纹理特征、高阶特征和小波变换特征,定量表示相应肿瘤区域的成像信息。在进一步处理之前,提取的特征进行无量纲化处理。应用Python中的Min-Max缩放器函数对训练数据集进行归一化,随后将相同的缩放参数应用于验证集。此过程用于加速模型训练并减轻不成比例缩放特征对模型性能的潜在影响。

影像组学特征选择:嵌入式最小绝对收缩和选择算子

大多数提取的影像组学特征与结果无关。采用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)从大量提取的特征中选择与结果最相关的一小部分特征。此外,在结果相关特征中,可能存在多个高度相关的特征。通过引入L1正则化,LASSO将一些特征的回归系数减少为零,从而自动选择关键特征并有效防止过拟合,解决多重共线性引起的问题。

通过LASSO算法从八个影像组学组的NC、AP、PVP和BP图像中选择2D和3D特征。选择最具预测性的特征用于模型构建。此外,我们合并了所有四个成像期相,并分别从2D和3D数据集的混合ROI中识别最佳特征。这些选定的特征随后应用于验证队列以确认模型泛化能力。

模型构建与评估

最初使用从NC、AP、PVP和BP中选择的2D和3D特征构建了八个预测模型。同时使用了传统逻辑回归和XGBoost机器学习算法。为优化XGBoost模型的超参数,采用了网格搜索策略。选择在验证队列上产生最高平均AUC的参数集用于最终模型。使用受试者工作特征(Receiver Operating Characteristic, ROC)曲线和曲线下面积(Area Under the Curve, AUC)评估模型对MVI的预测性能。随后,构建了一个组合影像组学模型,该模型包含了所有四个期相的2D和3D特征。

之后,从所有模型中选择最优的2D和3D影像组学模型。使用LASSO回归系数构建影像组学评分,并通过结合患者人口统计学和实验室数据进一步开发基于影像组学临床特征的组合模型,旨在探索最佳的术前MVI预测方法。训练阶段结束后,在测试队列中评估模型性能。随后利用Shapley值对特征进行排序并确定其贡献和重要性。这些结果为评估HCC瘤内异质性提供了证据。

在本研究中,所有统计分析均使用R语言(版本4.4.1)进行。使用tidyverse和CBCgrps包进行数据预处理和描述性统计。通过glmnet包进行LASSO回归特征选择,同时使用caret包进行交叉验证。使用xgboost构建预测模型,而超参数调优和模型评估通过caret进行。通过AUC评估模型性能,并使用rms包进行内部验证和校准分析。通过SHAP值促进模型解释,同时使用pheatmap和ggplot2可视化模型。所有分析均采用10折交叉验证以确保模型的稳健性和泛化能力。

结果

患者特征

本研究共纳入150例合格患者。表1展示了训练队列(n = 106)和测试队列(n = 44)的统计数据和临床特征。组织病理学检查显示,MVI状态在训练和测试队列中平衡(p = 1)。

提取的影像组学特征

从2D和3D配置的四个序列的八组ROI中总共提取了1130个特征。采用无监督聚类算法探索这些特征之间的潜在相关性。随后生成热图以可视化2D和3D区域之间的相关性,如图2所示。

我们的结果表明,2D和3D特征之间的整体相关性较弱;然而,所有四个序列中的少量特征表现出强相关性。平衡期2D和3D特征的相关性最强,而PV期的相关性最弱。这些发现为后续预测模型结果的解释提供了进一步 insight。

特征降维与选择

在2D ROI中,分别为NC、AP、PVP和BP识别出7个、9个、6个和12个MVI相关特征。对于3D ROI,在这四个期相中识别出的MVI相关特征分别为10个、6个、6个和7个。从八组成像数据选出的63个特征中,41个是小波特征。

预测模型的性能与评估

所有模型均应用了逻辑回归和机器学习方法。所有24个预测模型的性能总结于表2,这些模型的ROC曲线描绘于图3。在利用单序列图像提取特征的16个案例模型中,2D单序列模型在BP的测试集中实现了最佳AUC(逻辑回归,AUC = 0.801,95% CI:0.663?0.94)。3D单序列模型在PVP表现出最佳AUC(逻辑回归,AUC = 0.876,95% CI:0.753?0.999)。

使用2D和3D成像中所有四个序列提取的特征构建了逻辑回归和XGBoost模型。2D组合模型在测试集中的AUC为0.851(逻辑回归,95% CI:0.726?0.976),而3D组合模型的AUC为0.811(XGBoost,95% CI:0.648?0.975)。这些结果表明,2D和3D模型都对MVI表现出强大的预测性能。然而,3D影像组学并未提供显著优势,并且在某些情况下表现不如2D模型,尤其是在组合模型中。

在44个不同的临床特征中,LASSO回归识别出四个特征(纤维蛋白原、CEA、AFP和肿瘤直径)用于构建预测模型。仅基于临床特征的模型在测试集中的AUC为0.71(XGBoost,95% CI:0.535?0.886)。

最后,选择表现最佳的3D PVP和2D BP模型。这些模型基于λ系数被压缩成影像评分(R-score)。构建了一个预测模型,该模型结合了R-score以及识别出的四个临床特征。临床-影像组学组合模型在测试集中的AUC为0.818(逻辑回归,95% CI:0.654?0.981)。我们的发现表明,虽然临床特征能够术前预测MVI,但其预测性能不如影像组学。此外,在模型中结合影像组学评分和临床特征提高了预测能力。然而,组合模型并不是最有效的。

在12组24个模型中,8个逻辑回归模型表现优于其他模型,而4个XGBoost模型显示出更优的结果。总体而言,尽管XGBoost在训练集上表现出更好的性能,但在验证中并未显示出相对于逻辑回归模型的优势。

随后,对2D和3D组合模型进行了Shapley分析。图4展示了为构建模型而选择的关键影像组学特征及其分类和贡献排名。结果显示,2D组合模型主要选择来自BP的特征,而3D模型偏好来自PVP的特征。相比之下,在单序列模型中,2D和3D模型的性能都是最佳的。此外,不同序列之间存在显著的特征重叠,表明来自不同序列的所选影像组学特征存在大量共线性。这表明LASSO识别的最佳特征主要来自单个序列。这一发现与热图中所示的整体特征相关性结果形成对比。

在2D组合模型中,各种特征的贡献相对平衡。然而,在3D组合模型中,单个特征wavelet-LLH-glszm-Small-Area-Emphasis贡献超过60%。模型中的主导特征之一源自小波分解和灰度区域大小矩阵(Gray Level Size Zone Matrix, GLSZM),这通常反映了在特定尺度和方向上存在大量小而均匀的灰度区域。该影像组学特征代表了细微的瘤内纹理异质性,与坏死、纤维化和MVI等病理特征密切相关。这些因素通常表明肿瘤侵袭性和不良预后。因此,该纹理特征在影像组学模型中的主导地位可能归因于其捕获肿瘤内复杂空间异质性的能力,从而增强了模型准确预测MVI的能力。然而,过度依赖单个特征可能会削弱模型的稳健性。如果该特征受到外部条件(例如,图像质量、数据采集错误或患者状况变化)的影响,模型的性能可能会急剧下降。这可能是结合3D特征的组合模型性能未达预期的原因之一。

讨论

在单序列影像组学模型中,2D和3D模型的整体性能相似。一个可能的原因是2D和3D ROI之间存在重叠的数据特征。在肝癌影像组学中,某些序列不同切片的一些特征可能非常相似。尽管3D模型处理所有切片,但并未捕获显著不同的信息。MVI的成像特征可能已经在肿瘤的局部区域得到充分反映。此外,提取了大量纹理特征和小波变换特征,SHAP分析也表明(图3),对于某些序列,MVI预测主要依赖于纹理特征而非空间特征,从而减少了对空间信息的需求。因此,3D模型的空间信息贡献可能被削弱。

在肝癌领域,尚无相关研究讨论2D和3D ROI的优缺点。然而,在其他癌症的类似研究中得出了相似的结论。在肺癌中,Zhang等人报道,使用CT平扫期的2D和3D模型在各种任务(如淋巴血管浸润(LVI)、胸膜侵犯(VI)和pT分期预测)中的预测性能没有差异。另一项研究比较了2D和3D MRI特征在脑膜瘤分级中的性能,发现两者预测性能相似。一项多中心研究比较了2D和3D CT影像组学在胃癌特征描述中的性能,并得出结论:在大多数任务中2D特征略优。这些研究指出了3D模型的常见缺点。3D图像标注是逐层进行的,耗时、费力且噪声大。手动勾画3D肿瘤通常导致边界不清,可能影响预测准确性。此外,3D ROI勾画中的Z轴厚度通常比X和Y轴的平面分辨率粗糙,由于空间分辨率不一致导致详细信息丢失,而2D成像可以在单个最大横截面中捕获最清晰的信息。

然而,上述原因无法解释为何在BP期2D ROI模型表现出比3D模型更好的预测性能,而在PVP期3D ROI模型优于2D模型。对2D和3D特征进行了相关性分析,如图3所示。2D和3D特征在BP期的相关性最强,在PVP期最弱,这与预测模型的结果一致。基于此相关性分析,可以推测观察到的发现可能归因于HCC的内在特性。与其他肿瘤相比,HCC可能更具异质性。其生长模式通常不规则且呈浸润性,常常超出单个平面并倾向于侵犯周围组织。此外,HCC通常是高血管化的,尤其是在动脉期和门静脉期,肿瘤在血流中表现出显著强化。这些血管特性在不同层中以3D分布表达。PVP图像更好地反映了HCC异质性固有的空间结构、密度变化、微血管分布和灌注差异。3D ROI可以提供比单个2D平面更全面的信息。

在BP期,2D模型优于3D模型。这可能是因为BP期在预测MVI方面具有独特特征:BP期更好地反映了与MVI相关的组织通透性特性,此时造影剂在肿瘤和周围组织之间达到相对平衡。此时,肿瘤的组织通透性和微血管特征变得更加突出。在2D图像中,这些局部纹理和密度变化可以更清晰地呈现,有效提供MVI预测所需的特征。此外,3D整合可能存在的“信息稀释”问题是另一种解释。3D模型结合了多个切片的特征,可能会稀释BP期局部特征的预测能力。

无论是2D还是3D模型,小波变换特征都起到了关键作用。这表明两种模型都依赖于某些频率子带中的局部纹理细节。2D模型的更强结果意味着这些纹理细节可能并非 exclusively 来自发生MVI的局部区域;肿瘤其他区域的纹理细节也可以反映MVI的存在。从影像组学的角度来看,这为肝癌的异质性提供了进一步证据。

相比之下,使用相同方法开发了基于临床特征的模型。该模型也显示出术前预测MVI的能力。在44项临床指标中,肿瘤大小和AFP具有最显著的预测能力,这与大多数先前的研究一致。然而,基于临床特征的模型在任何序列上均未优于基于影像组学的模型。

接下来,将单序列模型中2D BP和3D PVP的最佳影像组学特征与临床特征结合,构建了多模态影像组学-临床组合模型。我们的结果表明,在模型中结合影像组学评分和临床特征增强了预测能力。这一结论与之前几项研究的发现一致。Xia等人构建了一个临床-影像组学语义特征-影像组学评分预测模型,预测MVI状态的AUC为0.86(95% CI:0.79, 0.92),外部测试集的AUC为0.84(95% CI:0.78, 0.91)。与纯影像组学模型相比,组合模型在合理的阈值概率范围内提供了更大的净收益。Xu等人的一项多中心研究表明,影像组学模型预测MVI的准确性优于基于AST、肿瘤大小和AFP的临床逻辑回归模型(验证队列中的AUC分别为0.750和0.648)。然而,在本研究中,它并非最优预测方法,这可能归因于多种因素,包括样本量和3D模型较弱的抗噪声能力。

在本研究中,采用LASSO从八组成像数据中共选择了63个特征,其中大量小波变换特征被识别。值得注意的是,其中一些小波特征在2D和3D图像的不同序列中重复出现。这表明基于影像组学的MVI预测高度依赖于局部纹理特征,并且增强成像不同序列的某些特征之间存在强共线性。进行了特征的相关性分析,并绘制了热图以进一步证实这一观察结果。

Ni等人的研究结果表明,对影像组学特征采用的降维和模型构建方法会影响所得影像组学模型的预测性能。LASSO降维结合梯度提升决策树(Gradient Boosting Decision Trees, GBDT)产生最高的预测准确性,并且当阈值概率超过0.22时,LASSO + GBDT方法优于其他方法。GBDT和XGBoost都是使用多个弱学习器(通常是决策树)来增强模型性能的集成方法。XGBoost是GBDT的扩展,专注于提高性能和效率。它包含了相对于传统GBDT算法的若干增强,包括正则化项、更高效的节点分裂和学习率衰减,从而在速度和性能上优于传统GBDT。

基于Ni等人的结论,构建了LASSO + XGBoost预测模型,并使用逻辑回归模型进行比较。然而,在本研究中,尽管XGBoost在训练集上表现出更好的性能,但在验证集上并未显示出相对于逻辑回归模型的优势。这一结果可能归因于XGBoost树模型结构的复杂性,在验证集上显示出轻微的过拟合。如果CT成像特征与肝癌MVI之间的关系不是高度非线性的,XGBoost的优势可能无法完全实现,甚至可能导致预测性能下降。逻辑回归可能更适合这种相对简单的特征表示。值得注意的是,与逻辑回归模型相比,XGBoost模型在3D模型上通常表现更好,这可能是因为3D数据集的复杂性更高。另一方面,XGBoost模型涉及众多参数(如学习率、树深度和正则化参数),实现最佳性能需要仔细的参数调优。由于本研究的研究人员是临床医生,在调整复杂机器学习模型方面经验有限,这可能导致了机器学习模型的性能欠佳。

总体而言,基于各种序列增强CT图像的影像组学模型表现出一定程度的预测能力。影像组学组合模型优于一些单序列模型,但并未取得最佳结果。在单序列模型中,3D PVP模型表现出最高的准确性,而2D BP模型显示出最高的AUC。Ma等人对157例经组织学证实伴或不伴MVI的HCC患者进行了一项研究,发现增强CT成像的AP、PVP和BP的影像组学特征均可用于构建肝癌MVI预测模型。他们发现PVP在预测性能上优于AP和BP以及多序列模型。我们的发现与Ma等人的结论部分一致;然而,在他们的研究中,组合模型直接结合了多序列影像组学特征,在训练集上实现了高AUC,但在验证集上的准确性、特异性、敏感性和AUC欠佳。类似地构建了一个术前MVI预测的影像组学模型,但训练和测试数据集显示出显著差异,这可能是由于特征数量与训练集样本量不匹配导致模型过拟合所致。他们的结论不够严谨。

本研究存在若干局限性。单中心回顾性设计不可避免地导致样本选择偏倚。此外,样本量相对较小,由于训练数据有限,更复杂组合模型的优势受到限制。此外,我们的预测模型未纳入基于医生影像解读的语义特征。而且,临床问题以及图像采集和重建方案的差异可能会影响结果。因此,需要进一步验证以提高结论对其他疾病和临床背景的普适性。

结论

本研究成功基于增强CT成像的2D和3D影像组学特征,开发了用于HCC患者术前预测MVI的预测模型。系统比较了不同ROI勾画方法和成像序列的性能。结果表明,2D PVP模型在捕获局部纹理特征方面表现出色,而3D AP模型在反映肿瘤空间异质性方面展现出更大优势。总体而言,影像组学模型优于传统的基于临床的预测模型,尽管3D模型并未显示出比2D模型显著更好的整体预测性能。

该研究进一步强调了影像组学特征对肿瘤异质性的敏感性,特别是在纹理和空间特征表达方面。小波变换特征被广泛选择并对预测结果产生显著影响。这凸显了影像组学在捕获肿瘤内复杂性和异质性方面的关键作用。这项研究为HCC的影像组学研究提供了有力证据,推进了术前MVI预测技术,并为肝癌的个性化和精准诊断与治疗提供了关键见解。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号