
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的营养不良肝细胞癌患者介入治疗后无复发生存预测模型研究
【字体: 大 中 小 】 时间:2025年09月16日 来源:Cancer Medicine 3.1
编辑推荐:
这篇研究通过机器学习方法(RSF和XGBoost)筛选出影响营养不良肝细胞癌(HCC)患者介入治疗(TACE+RFA)后复发的关键因素(GGT、APTT、年龄、ALT),并构建了预测1/3/5年无复发生存(RFS)的列线图模型。该模型在训练集和验证集中均表现出优异的区分度(AUC 0.690-0.795)、校准性和临床实用性(DCA验证),为营养不良HCC患者的个体化预后评估提供了新工具。
ABSTRACT
研究采用机器学习算法(随机生存森林和XGBoost)结合多变量Cox回归,从512例接受TACE联合RFA治疗的营养不良(CONUT评分≥2)肝细胞癌患者中筛选出GGT、APTT、年龄和ALT四个独立风险因素,构建的列线图模型能有效预测1/3/5年无复发生存率。模型通过KM曲线、ROC分析(AUC最高达0.795)、校准曲线和决策曲线分析验证了其优越的预测性能。
1 Introduction
肝细胞癌作为全球第六大高发恶性肿瘤,介入治疗后的高复发率(5年内达70%)仍是临床难题。营养不良状态(CONUT评分≥2)与HCC预后显著相关,但针对该人群的复发预测模型尚属空白。本研究创新性地将机器学习应用于营养不良HCC患者的复发预测,填补了这一领域的研究缺口。
2 Materials and Methods
研究纳入2014-2020年北京佑安医院512例接受TACE+RFA联合治疗的营养不良HCC患者,按7:3随机分为训练集和验证集。通过RSF和XGBoost算法从34项临床指标中初筛变量,再经多变量Cox回归确定最终预测因子。模型性能通过时间依赖性ROC、校准曲线和DCA进行全方位评估。
3 Results
3.1 基线特征
训练集(n=358)与验证集(n=154)在性别(男性71.2% vs 72.1%)、肝硬化比例(89.1% vs 89.6%)等52项基线特征上均无统计学差异(p>0.05),确保了两组数据的可比性。
3.2 关键预测因子
RSF算法筛选的前15位变量包含肿瘤数量、BCLC分期等,XGBoost则突出GGT、APTT等指标的重要性。两者交集经Cox回归最终确定:GGT(HR=1.005,p<0.001)、APTT(HR=1.062,p=0.018)、年龄(HR=1.022,p=0.023)和ALT(HR=1.011,p=0.045)。
3.3 列线图构建
基于上述四因子构建的列线图模型,各变量赋分范围为:GGT(0-100分)、APTT(0-50分)、年龄(0-60分)和ALT(0-40分),总分对应1/3/5年RFS概率。
3.4 风险分层验证
按最佳截断值分组后,KM曲线显示高低风险组的RFS存在显著差异(p<0.0001),高风险组5年复发率较对照组增加2.3倍。
3.5 模型验证
训练集中1/3/5年预测的AUC分别为0.714/0.751/0.795,验证集为0.690/0.706/0.745。校准曲线紧贴45°参考线,DCA显示在10%-90%阈值概率范围内具有显著临床净获益。
4 Discussion
相较于传统CONUT评分研究多聚焦总体预后,本研究首次针对营养不良HCC人群开发复发预测模型。GGT反映肝代谢异常,APTT提示凝血功能障碍,这些指标与肿瘤微环境相互作用可能促进复发。模型创新性地整合了机器学习算法与传统统计方法,但存在单中心回顾性研究的局限性。
5 Conclusions
该列线图模型能准确预测营养不良HCC患者介入治疗后的长期复发风险,为临床个体化随访策略制定提供了量化工具。未来需通过多中心前瞻性研究进一步验证其普适性。
生物通微信公众号
知名企业招聘