基于生命体征的机器学习模型预测急性住院患者病情恶化:一项回顾性多中心研究

【字体: 时间:2025年09月22日 来源:Mayo Clinic Proceedings: Innovations, Quality & Outcomes CS6.7

编辑推荐:

  本研究针对临床恶化事件低发生率导致的预警系统阳性预测值(PPV)低、误报率高的问题,开发了仅基于生命体征的LightGBM机器学习模型。通过创新的双时间窗特征提取技术,模型在73.4%灵敏度下达到30.4%的PPV,显著优于EPIC恶化指数(EDI),为降低警报疲劳提供了有效解决方案。

  

在医院普通病房和遥测病房中,患者病情的突然恶化始终是临床实践中的重大挑战。临床恶化(Clinical deterioration)通常表现为生命体征的显著偏离基线,如血压不稳定、心率(HR)增快、呼吸窘迫或血氧饱和度(SpO2)下降。若未能及时识别和处理,可能导致器官衰竭、心脏骤停甚至死亡,成为可预防死亡的主要原因之一。及时识别临床恶化至关重要,因为延迟的识别和干预不仅与患者不良结局相关,还会增加医疗成本。

生命体征作为患者健康状况的关键指标,往往是临床恶化的首要信号。心率骤增、呼吸模式异常或血氧饱和度下降等变化,都可能是严重事件发生的前兆。研究表明,基于这些预警信号的早期干预——如启动快速反应团队(RRT)或将患者转入更高水平的护理——能够显著降低死亡率并改善患者结局。

尽管目前已有多种早期预警系统被开发用于识别临床恶化,包括广泛使用的改良早期预警评分(MEWS)、国家早期预警评分(NEWS)和EPIC恶化指数(EDI)等,但这些系统普遍存在阳性预测值(PPV)较低的问题,导致误报频繁。低PPV会加剧医护人员的警报疲劳,过多的警报使工作人员变得不敏感,从而延误对真实紧急情况的响应。

大多数早期预警机器学习模型可以整合除生命体征外的更广泛输入数据,但这些数据在床边并不总是立即可用。随着生命体征监测设备和可穿戴传感器的日益普及,开发仅依赖生命体征的模型显得尤为有利,因为这些输入数据能够更持续地获取。

为了解决这些挑战,研究人员假设基于极端梯度提升的模型,利用来自大型患者队列的易获取生命体征数据,可以在检测低发生率临床恶化事件时实现高PPV同时保持良好的敏感性。为此,该研究采用了三种新颖技术:从纵向生命体征数据中提取选择性特征的分段窗口方法、仅使用生命体征作为输入以及临床关注度的替代指标。

该研究由Santiago Romero-Brufau、Radit Smunyahirun、Timothée Filhol、Lucille Niederhauser、Thanawin Trakoolwilaiwan和Gurpreet Singh合作完成,发表在《Mayo Clinic Proceedings: Innovations, Quality & Outcomes》上。

研究方法概述

本研究利用2019年1月1日至2023年7月31日期间多家医院医疗机构的227,858名住院患者数据,经过高质量数据筛选后,最终使用30,118名患者训练LightGBM模型,30,095名患者用于盲法验证。研究采用创新的双时间窗特征提取方法——当前窗口(1小时)和基线窗口(最长24小时),从呼吸频率、心率、血氧饱和度和收缩压四个生命体征中提取统计特征,并结合年龄、性别等人口学变量,共37个特征。模型训练采用10倍交叉验证的网格搜索进行超参数优化,并对正例误分类设置10倍惩罚权重以反映临床优先级。

研究结果

主要性能指标

模型在73.4%灵敏度(95%CI, 72.2%-74.4%)下达到30.4%的PPV(95%CI, 29.6%-31.3%),C统计量为0.874(95%CI, 0.867-0.881),警报率为每天每患者0.170次(95%CI, 0.167-0.173),标准化警报率为2.41(95%CI, 2.31-2.51)。与EDI相比,模型表现出显著优越的性能。

医院分层分析

按医院分层的分析显示,罗切斯特院区表现最佳,在敏感性为0.73时PPV达到54.9%(95%CI, 52.9%-57.0%),较EDI的7.57%提高46%或6倍。其他院区的PPV依次为:亚利桑那32%、梅奥诊所健康系统(MCHS)13%、佛罗里达9%,表明医院级别的操作流程和患者群体特征对模型性能有显著影响。

种族分层分析

按种族分层的分析显示,白人患者占数据集的90%,其PPV为0.31,与整体模型性能基本一致。非白人族群由于样本量较小(各约2%),表现存在变异性,但使用的生理特征表明种族偏倚风险较低。

讨论与结论

本研究开发的机器学习模型仅使用四种生命体征(呼吸频率、心率、血氧饱和度和收缩压)即实现了较高的预测性能,在罗切斯特院区数据上达到0.55的PPV(敏感性0.73),是EDI(0.08)的6倍以上,标准化警报率仅为1.3。这一改进归因于采样时间的使用(反映"担忧因子")和结合基线窗口与当前窗口的先进特征提取方法。

研究结果强调了医院级别差异对模型性能的复杂影响,包括事件比率、患者人口特征和操作程序等因素都可能导致观察到的变异性。尽管存在数据质量限制和医院间性能差异等局限性,但该模型为降低警报疲劳、提高临床预警效率提供了有效解决方案。

未来研究应侧重于在更广泛的医院人群中验证模型,制定针对特定医院工作流程的模型配置策略,整合可穿戴设备实现连续监测,并通过实时临床部署评估实际效用,将模型嵌入医院工作流程系统,向临床医生提供及时警报,从而减少警报疲劳,提高工作流程效率,最终改善患者结局。

该研究的重要意义在于证明了仅基于生命体征的机器学习模型能够显著提高临床恶化预测的准确性,为解决长期困扰临床实践的警报疲劳问题提供了切实可行的技术路径,对提高住院患者安全性和医疗质量具有重要价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号