
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的个体化预测模型SPRIGHT:提升镰状细胞病造血干细胞移植结局预测的新工具
【字体: 大 中 小 】 时间:2025年09月18日 来源:JMIR AI 2
编辑推荐:
本研究针对镰状细胞病(SCD)造血干细胞移植(HCT)个体化预后预测的临床需求,开发了首个机器学习预测工具SPRIGHT。通过分析CIBMTR登记库中1641例患者数据,整合17项临床特征,实现对总体生存(OS)、无事件生存(EFS)、移植物抗宿主病(GVHD)等7项关键结局的精准预测。该模型AUC值达0.68-0.88,校准斜率0.87-0.96,为医患共同决策提供了重要工具。
镰状细胞病(Sickle Cell Disease, SCD)是一种遗传性血红蛋白病,患者面临疼痛危象、器官损伤等严重并发症。虽然疾病修饰疗法可缓解症状,但造血干细胞移植(Hematopoietic Cell Transplantation, HCT)和基因治疗是目前唯一可能根治该病的手段。然而,现有的登记研究仅能提供群体水平的预后评估,无法解答患者最关心的问题:"像我这样的个体接受移植后,究竟会发生什么?"这种不确定性成为医患共同决策的重要障碍。
为解决这一临床痛点,耶鲁大学医学院研究团队在《JMIR AI》发表了首个针对SCD的机器学习预测模型SPRIGHT(Sickle Cell Predicting Outcomes of Hematopoietic Cell Transplantation)。该研究利用国际血液和骨髓移植研究中心(CIBMTR)1991-2021年间1641例移植患者数据,通过随机森林算法整合了年龄、功能状态、并发症指数、CMV血清状态、急性胸综合征病史、换血需求、血管闭塞危象(VOC)频率等17项临床特征,可同时预测7项关键临床结局。
研究采用的主要技术方法包括:1)使用CIBMTR登记库的1641例SCD移植患者数据;2)通过前向序列选择(FSS)和反向特征消除(BFE)进行特征优化;3)采用随机森林算法构建预测模型;4)使用2次重复10折交叉验证解决数据不平衡问题;5)通过SHAP值分析特征重要性。
特征选择与优化
从160个初始变量中筛选出31个临床相关预测变量,最终确定17个核心预测因子,分为患者数据(年龄、功能评分、合并症指数等)、SCD特异性数据(急性胸综合征发作次数、换血需求等)和移植数据(供者类型、预处理方案等)三大类别。
评估结果与模型性能
随机森林模型在所有结局预测中表现最优,总体生存(OS)的AUC达0.7925,无事件生存(EFS)为0.7900,移植物失败(GF)为0.8024,急性GVHD(AGVHD)为0.6793,慢性GVHD(CGVHD)为0.7320,移植后VOC预测更是达到0.8779的高 discriminative 性能。模型在校准方面表现良好,四个主要结局的校准斜率在0.87-0.96之间,截距接近零。
SPRIGHT用户界面
该工具提供网络访问接口,用户可通过下拉菜单选择分类变量,输入患者特异性数据后,即可获得表格形式和饼图展示的个性化预测结果。独特之处在于用户既可选择已发表的移植方案,也可自定义组合条件方案、GVHD预防方案和血清治疗方案进行比较分析。
研究讨论部分指出,SPRIGHT相比Brazauskas等人开发的仅基于年龄和供者类型的风险评分模型具有明显优势:不仅将年龄作为连续变量处理,还纳入疾病严重程度指标和移植方案特征,预测结局也更全面。然而研究也存在一定局限性,包括登记数据的固有选择偏倚、某些治疗细节(如全身照射剂量)的缺失、以及阴性事件罕见导致的校准精度限制等。
该研究的重要意义在于首次提供了SCD患者HCT治疗的个性化预后预测工具,将机器学习技术与临床决策需求紧密结合。通过量化个体患者的治疗获益与风险,SPRIGHT有望显著改善医患沟通质量,促进基于证据的共享决策制定。研究者计划后续使用欧洲血液和骨髓移植协会(EBMT)登记数据进行外部验证,并进一步优化模型以适应不同健康素养水平患者的需求。
生物通微信公众号
知名企业招聘