
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于电子健康记录与人工智能构建公平高效的射血分数保留性心力衰竭(HFpEF)诊断模型
【字体: 大 中 小 】 时间:2025年09月17日 来源:European Heart Journal - Digital Health 4.4
编辑推荐:
本研究针对射血分数保留性心力衰竭(HFpEF)诊断率低、尤其在非白种人群和社会经济弱势群体中漏诊率高的问题,开发了基于电子健康记录(EHR)和人工智能(AIM-HFpEF)的自动化诊断模型。通过自然语言处理(NLP)和机器学习技术,该模型在验证队列中表现出优异诊断性能(AUC=0.88),且在非白种人群(AUC=0.89)和高 deprivation 人群(AUC=0.90)中保持稳定,显著优于传统H2FPEF和HFpEF-ABA评分。该研究为HFpEF的公平筛查提供了可嵌入EHR系统的有效工具。
射血分数保留性心力衰竭(Heart Failure with Preserved Ejection Fraction, HFpEF)约占所有心衰病例的一半,其发病率、死亡率和医疗成本居高不下。尽管国际指南已明确诊断标准,但临床实践中HFpEF的识别率极低——约90%符合诊断标准的患者从未获得正式诊断。这一现象在非白种人种和社会经济地位较低的人群中尤为突出,现有临床预测模型如H2FPEF和HFpEF-ABA在这些群体中存在明显的性能局限。因此,开发一种能够自动化、公平且高效地从海量临床数据中识别HFpEF患者的工具,成为心血管疾病管理领域的迫切需求。
为此,由英国国王学院医院牵头的研究团队在《European Heart Journal - Digital Health》上发表了一项重要研究,题为“Artificial Intelligence Methods to Detect Heart Failure with Preserved Ejection Fraction (AIM-HFpEF) within Electronic Health Records: An equitable disease detection model”。该研究利用自然语言处理(NLP)和多种机器学习算法,基于两个大型英国医疗信托(King’s College Hospital和Guy’s and St Thomas’ Hospital)的电子健康记录(EHR)数据,构建了全新的HFpEF预测模型AIM-HFpEF,并对其进行了内部验证与外部验证。
研究的关键技术方法主要包括:1)使用经过验证的NLP管道从EHR的非结构化文本中提取心衰相关诊断、症状和合并症;2)整合结构化数据(如年龄、BMI、超声参数)与非结构化数据;3)采用XGBoost、随机森林、支持向量机和逻辑回归等机器学习算法进行模型训练与优化;4)利用SHAP(Shapley Additive Explanations)分析进行特征重要性排序与模型简化;5)通过校准曲线、ROC分析和Delong检验评估模型性能并与现有评分进行比较。
研究结果主要包括以下几个方面:
模型构建与性能表现
研究人员共纳入5,572名HFpEF患者和2,984名非心源性呼吸困难对照组。XGBoost模型在测试集(n=635)中表现最佳,AUC达0.891(95% CI: 0.8665–0.9154),显著优于其他机器学习模型。在外部验证集(n=5,383)中,AIM-HFpEF的AUC为0.893,显示出优秀的泛化能力。
简化模型与特征解析
通过SHAP分析筛选出前10位重要预测特征,包括NT-proBNP、年龄、肺动脉收缩压(PASP)、左房容积、BMI、心房颤动(AF)、性别、左室质量、胸痛和糖尿病。基于这些特征构建的简化模型仍保持较高诊断性能(AUC=0.880),适于临床推广应用。
与传统评分的比较
AIM-HFpEF在整体队列、非白种人群体和低社会经济地位群体中均显著优于H2FPEF和HFpEF-ABA评分。例如,在外部验证集的非白种人亚组中,AIM-HFpEF的AUC为0.896,而H2FPEF和HFpEF-ABA仅分别为0.768和0.710(P<0.0001)。
预测能力与临床结局关联
AIM-HFpEF预测概率与患者临床结局显著相关。预测概率最高三分位组相比中间组,死亡风险(P<0.0001)、卒中风险(P=0.001)和住院风险(P<0.0001)均显著升高,表明模型具备预后预测价值。
讨论与结论
本研究开发的AIM-HFpEF模型是首个基于EHR数据、专门针对HFpEF检测的自动化人工智能工具,其创新性在于将符合ESC诊断标准但未被临床诊断的患者纳入训练集,从而更好地捕捉现实世界中HFpEF的临床特征。该模型不仅诊断性能优越,更重要的是在不同种族和社会经济群体中保持一致的准确性,有助于减少健康 disparities。
研究的局限性包括依赖超声心动图数据可能限制在资源有限地区的应用,以及模型尚未在初级医疗机构中进行验证。此外,NT-proBNP作为预测特征可能引入一定程度的临床怀疑偏倚,但敏感性分析显示模型在排除NT-proBNP后仍保持良好性能。
未来工作将聚焦于模型的前瞻性验证和多中心实施,利用CogStack平台实现实时患者筛查与提示,并探索在缺乏高级别超声参数的医疗环境中开发替代模型。该研究的成功实施将推动人工智能在心血管疾病早期诊断中的实际应用,为实现精准、公平的心衰管理提供有力工具。
生物通微信公众号
知名企业招聘