利用数据驱动的机器学习:从可解释的风险预测到基于层次聚类的术后谵妄亚型分析——以一项前瞻性非心脏手术队列为研究对象

《Journal of Clinical Anesthesia》:Leveraging data-driven machine learning: From explainable risk prediction to hierarchical clustering-based subtypes of postoperative delirium in a prospective non-cardiac surgery cohort

【字体: 时间:2025年09月19日 来源:Journal of Clinical Anesthesia 5.1

编辑推荐:

  术后谵妄预测模型开发及亚型分析,基于1106例非心脏手术患者的围手术期数据,采用可解释机器学习(SHAP辅助随机森林)筛选14项核心风险因素,识别出高炎症负荷型(最长住院21.5天)、临床稳定型(最优生存率)和衰老脆弱型(最短住院5天)三种POD亚型,显著改善风险分层和精准干预。

  这项研究聚焦于术后谵妄(Postoperative Delirium, POD)的风险预测与分型,旨在通过机器学习(Machine Learning, ML)模型提升对这一临床问题的识别能力,并探索其潜在的异质性特征。研究团队由来自南京中医药大学附属医院麻醉科的多位学者组成,他们通过对非心脏手术患者的数据进行分析,揭示了POD的多个风险因素,并进一步利用聚类分析方法识别出三种具有不同临床特征的POD亚型。研究结果不仅有助于理解POD的复杂性,也为个体化风险评估、早期干预和医疗资源优化提供了新的视角。

术后谵妄是一种常见的术后认知障碍,其临床表现包括注意力不集中、思维混乱、意识水平改变以及症状波动等。它与多种不良后果相关,如住院时间延长、死亡率升高以及术后认知功能的长期损害。因此,准确预测POD风险对于改善患者预后、优化医疗资源配置具有重要意义。然而,POD的发生涉及患者自身、手术过程以及围手术期多种因素的复杂交互作用,这使得其早期识别和预测面临挑战。传统的基于心理运动活动(如低活动、高活动或混合型)的POD分型方法虽然在临床实践中有所应用,但其分类方式较为简单,缺乏对潜在病理机制的深入理解,且依赖于医生的主观判断,难以满足精准医疗的需求。

在此背景下,机器学习作为一种数据驱动的分析工具,展现出在识别复杂疾病模式方面的潜力。与传统统计方法相比,机器学习能够处理大量高维数据,挖掘潜在的非线性关系,并构建具有较高预测准确性的模型。此外,机器学习模型的可解释性也是其在临床应用中的关键优势之一。尽管近年来机器学习在POD预测中的应用逐渐增多,但目前的研究仍多集中于模型的构建与验证,缺乏对POD异质性的深入探讨。因此,本研究不仅致力于开发一个高效的POD预测模型,还尝试通过聚类分析揭示POD的潜在亚型,从而推动对这一疾病更全面的理解。

研究采用了多中心、前瞻性观察性研究的二次分析方法,涵盖了1106名接受非心脏手术的患者。数据来源于中国南京的两家三级医院——金陵医院和东南大学附属中大医院,时间跨度为2018年12月至2023年4月。为了验证模型的外部有效性,研究还利用了2023年9月至12月期间在另一家独立医院收集的数据。通过对这些数据进行系统的分析,研究团队筛选出与POD相关的14个关键风险因素,并选择了随机森林(Random Forest, RF)作为最优的预测模型。该模型在预测性能上表现出色,其曲线下面积(Area Under the Curve, AUC)达到0.85,95%置信区间为0.78–0.91。这一结果表明,RF模型在区分POD与非POD患者方面具有较高的准确性。

为了进一步提升模型的可解释性,研究团队应用了SHapley Additive exPlanations(SHAP)方法,对模型中的关键变量进行了排序和可视化分析。结果显示,手术持续时间、术前简易精神状态检查(Mini-Mental State Examination, MMSE)得分以及爱丁堡虚弱量表(Edmonton Frail Scale)是预测POD的三个最重要因素。这些变量不仅具有临床意义,而且易于在围手术期获得,为临床实践提供了切实可行的预测依据。此外,SHAP分析还揭示了单个变量对预测结果的影响机制,使得模型的输出更加透明,有助于医生理解模型的决策过程,从而增强其在临床中的可信度和应用价值。

在风险因素筛选过程中,研究团队首先进行了单变量分析,以识别与POD显著相关的变量。随后,他们采用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归方法,进一步筛选出对模型构建具有重要贡献的变量。LASSO回归不仅能够有效处理高维数据,还能通过正则化技术减少模型的过拟合风险,提高预测的稳定性。通过这一过程,研究团队最终确定了14个关键风险因素,涵盖了术前、术中以及术后多个阶段的临床信息。这些因素包括但不限于年龄、BMI、ASA分级、手术类型、麻醉方式、术后镇痛策略以及术前认知功能评估等。

在模型构建方面,研究团队比较了六种不同的机器学习算法,包括基于分类树的自适应提升(Adaptive Boosting)、随机森林、神经网络、支持向量机(Support Vector Machines, SVM)、极端梯度提升(Extreme Gradient Boosting, XGBoost)以及逻辑回归(Logistic Regression)。通过对这些算法的性能评估,研究团队发现随机森林在所有模型中表现最佳,其预测准确率显著高于其他方法。这一结果可能与随机森林在处理非线性关系、减少过拟合风险以及对高维数据的适应性有关。此外,随机森林模型的可解释性也优于其他算法,使其在临床应用中更具优势。

为了进一步验证模型的适用性,研究团队将最优模型(随机森林)应用于另一家独立的三级医院,以评估其在不同医疗环境下的预测效果。这一外部验证过程不仅有助于提高模型的泛化能力,还能够减少因数据偏差或医院特定因素导致的预测误差。外部验证的结果表明,随机森林模型在新数据集中的表现同样良好,验证了其在不同人群和医疗环境中的稳健性。

在识别POD亚型方面,研究团队采用了一种基于风险因素的层次聚类分析(Hierarchical Clustering)。他们首先通过单变量分析筛选出与POD相关的风险因素,然后将这些因素作为输入,利用层次聚类方法对患者进行分组。最终,研究团队发现了三种具有显著差异的POD亚型:亚型1(高风险型,具有显著合并症和炎症失调,住院时间最长,平均为21.5天,四分位距为19–28天);亚型2(具有较强恢复能力的多数患者,生存率最优);以及亚型3(高龄、虚弱和认知储备较低的患者,住院时间最短,平均为5天,四分位距为4–8天)。这些亚型的识别不仅有助于理解POD的异质性,还为个体化干预策略的制定提供了依据。

进一步的Kaplan-Meier生存分析显示,三种亚型在12个月的生存率上存在显著差异,其中亚型2的生存率最高,亚型3次之,而亚型1的生存率最低。这一结果表明,不同亚型的患者在术后恢复过程中可能面临不同的挑战和风险,从而需要针对性的干预措施。例如,亚型1患者可能需要更密切的监测和更积极的治疗方案,以降低其不良预后的风险;而亚型3患者则可能因恢复能力强而需要较少的医疗干预,从而节省医疗资源。

本研究的创新之处在于其将机器学习与聚类分析相结合,不仅构建了一个高效的POD预测模型,还揭示了POD的潜在亚型。这种多维度的分析方法为理解POD的复杂性提供了新的视角,并有助于推动精准医疗的发展。此外,研究团队在模型构建过程中强调了可解释性的重要性,通过SHAP方法对模型的决策过程进行了可视化分析,使得临床医生能够更好地理解和应用模型的预测结果。

从临床角度来看,本研究的结果具有重要的实践意义。首先,它提供了一种基于数据驱动的POD预测方法,可以辅助医生在术前评估患者的风险,并制定相应的预防措施。其次,通过识别三种不同的POD亚型,研究为术后护理提供了更细致的分类依据,有助于实现个体化医疗管理。例如,对于亚型1患者,可能需要在术后早期加强监测,及时识别并干预可能的谵妄症状;而对于亚型2患者,由于其恢复能力强,可能可以采取相对宽松的管理策略,减少不必要的医疗干预。此外,研究还指出,高龄、虚弱和认知储备较低的患者更容易发展为亚型3,这提示在术前评估中应特别关注这些因素,并采取相应的预防措施。

在方法学方面,本研究采用了多种分析手段,包括单变量分析、LASSO回归、机器学习模型构建以及SHAP和层次聚类分析。这种综合性的分析框架不仅提高了模型的预测性能,还增强了其临床适用性。例如,单变量分析有助于初步筛选出与POD相关的变量,而LASSO回归则能够进一步优化变量选择,减少模型的复杂度。机器学习模型的构建和验证过程确保了模型的准确性和泛化能力,而SHAP分析和层次聚类方法则提升了模型的可解释性,使其更符合临床实践的需求。

研究的局限性也需要被关注。首先,尽管本研究的数据来源于多个医疗中心,但仍可能存在一定的样本偏差,特别是在外部验证过程中,数据量相对较小,可能影响模型的泛化能力。其次,研究中使用的风险因素主要来自临床记录,缺乏对患者生物标志物或神经影像学数据的分析,这可能限制了对POD潜在机制的深入理解。此外,本研究主要关注非心脏手术患者,未来研究可能需要扩展至心脏手术或其他类型的手术,以验证模型的适用性。

尽管存在上述局限性,本研究仍为POD的预测和分型提供了重要的参考。它不仅展示了机器学习在医学领域的应用潜力,还强调了可解释性在临床决策中的重要性。随着人工智能技术的不断发展,机器学习模型有望在未来的临床实践中发挥更大的作用,特别是在复杂疾病的预测和管理方面。然而,要实现这一目标,仍需进一步研究和验证,以确保模型的准确性和可靠性。

本研究的结论为未来的研究方向提供了新的思路。首先,进一步探讨POD的神经生物学机制可能有助于开发更有效的干预策略。例如,通过分析不同亚型的生物标志物,研究者可以更深入地了解POD的发病机制,并探索针对性的治疗方案。其次,研究团队建议在未来的临床研究中,结合更多类型的临床数据,如影像学检查、基因表达谱以及神经心理学测试,以提高模型的预测性能和临床适用性。此外,研究还指出,基于POD亚型的个体化干预策略可能需要更多的临床试验来验证其有效性,特别是在不同手术类型和患者群体中的应用。

总之,本研究通过机器学习和层次聚类分析,为术后谵妄的预测和分型提供了新的方法和技术支持。其发现的三种POD亚型不仅有助于理解该疾病的异质性,还为个体化医疗管理提供了理论依据。未来的研究可以在此基础上,进一步探索POD的生物学机制,并开发更精确的预测模型,以更好地服务于临床实践和患者管理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号