人工智能赋能手持单导联心电图分析预测心房颤动:VITAL-AF随机试验分析

《npj Digital Medicine》:Artificial intelligence-enabled analysis of handheld single-lead electrocardiograms to predict incident atrial fibrillation: an analysis of the VITAL-AF randomized trial

【字体: 时间:2025年11月27日 来源:npj Digital Medicine 15.1

编辑推荐:

  本研究针对当前房颤(AF)筛查效率低下的问题,聚焦于利用人工智能(AI)分析手持单导联心电图(1L ECG)预测新发AF。研究人员在VITAL-AF随机试验中,开发并验证了名为1L ECG-AI的深度学习模型。结果表明,结合年龄和性别后,该模型对2年新发AF的预测能力与包含11个临床风险因子的CHARGE-AF评分相当,并能显著优化基于年龄阈值的筛查策略,为风险导向的AF筛查提供了高效新工具。

  
心房颤动(Atrial Fibrillation, AF)是一种常见的心律失常,与脑卒中、心力衰竭等严重并发症风险增加密切相关。然而,AF常常无症状或症状不典型,导致大量患者未被及时诊断。因此,通过筛查早期发现AF,从而及时启动抗凝等预防性治疗,是心血管疾病防控的重要策略。目前,多个国际指南建议对≥65岁的人群进行AF筛查。但这一基于单一年龄的筛查策略存在明显局限性:它会使大量低AF风险的个体接受筛查,而可能漏掉部分年轻但高风险的个体。大规模筛查试验也未能一致证明这种广泛筛查策略能显著改善脑卒中或死亡率等关键结局。这凸显出现有AF筛查方法效率不高,亟需一种更精准、基于个体风险的分层筛查方法。
传统的AF风险预测工具,如CHARGE-AF临床风险评分,虽然具有中等预测能力,但其计算相对繁琐,在临床实践中的使用受到限制。近年来,人工智能(AI)技术,特别是深度学习,在医疗领域展现出巨大潜力。已有研究证明,利用深度学习分析标准的12导联心电图(ECG),即使在窦性心律下,也能有效预测AF的发生风险。这为AF风险估算开辟了新途径。然而,12导联心电图的采集通常需要专业人员和设备,限制了其可及性。相比之下,手持式单导联心电图(1L ECG)设备(如 AliveCor Kardia)日益普及,使得在诊所甚至家庭环境中便捷地获取心电图成为可能。一个关键的科学问题是:从这些在真实世界中采集的、可能含有更多噪声的手持单导联心电图中,人工智能是否依然能够提取出有意义的信号,来预测未来的房颤风险?
为了回答这个问题,由 Shaan Khurshid 和 Sam F. Friedman 作为共同第一作者,Patrick T. Ellinor 作为通讯作者的研究团队,在《npj Digital Medicine》上发表了他们的最新研究成果。他们利用大规模随机临床试验VITAL-AF的独特资源,开展了这项人工智能赋能的手持单导联心电图分析预测新发房颤的研究。
本研究基于VITAL-AF随机对照试验的数据。该试验在美国麻省总医院(MGH)的16家初级诊疗机构中进行,招募了年龄≥65岁的初级诊疗患者。在干预组诊所中,由经过培训的医务人员使用AliveCor Kardia设备为就诊患者采集30秒的手持单导联心电图(1L ECG)进行AF筛查。研究最终纳入了15,694名基线无AF且至少有一次有效1L ECG记录的参与者(平均年龄74.3岁,58%为女性)作为“全推理集”,其中411人在2年随访期内发生AF(累积发生率3.1%)。研究人员主要比较了三种基于深度学习的AF风险预测方法:其一是预先使用标准12导联心电图的单导联数据训练的模型(1L ECG-AI);其二是将该模型在VITAL-AF的一个子集(开发集)中进行微调(1L ECG-AI Fine-Tuned);其三是在VITAL-AF开发集中从头训练的模型(1L VITAL)。模型性能在一个独立的测试集(n=4,221)中进行初步比较,随后最佳模型在“全推理集”中与CHARGE-AF临床风险评分进行详细对比。模型输入的是从30秒记录中通过噪声检测算法选取的10秒最清晰信号段。主要评估指标是模型对2年新发AF的判别能力(AUROC)和校准度等。
识别使用1L ECG进行AF风险预测的最佳方法
在包含4,221名参与者的测试集中,三种AI模型(1L ECG-AI, 1L ECG-AI Fine-Tuned, 1L VITAL)对2年新发AF的预测能力相似(AUROC分别为0.672, 0.654, 0.667)。鉴于1L ECG-AI模型完全在VITAL-AF试验数据之外训练完成却表现出可比甚至略优的性能,研究人员选择该模型进行后续深入分析。这表明,通过迁移学习将基于高质量12导联心电图训练的模型应用于真实世界的手持1L ECG数据是可行的。
1L ECG-AI在VITAL-AF全推理集中的性能
在15,694名无既往AF的参与者中,仅使用1L ECG信号的AI模型(1L ECG-AI)对2年新发AF的预测AUROC为0.666。当模型结合了易于获取的年龄和性别信息后(1L ECG-AI AS),预测性能显著提升(AUROC 0.695)。重要的是,这个仅需年龄、性别和一次1L ECG检查的简单组合,其预测能力与需要11个临床风险因子的CHARGE-AF评分(AUROC 0.679)相当,两者无统计学差异。在校准度方面,1L ECG-AI AS模型表现出最佳的绝对风险预测准确性。
结合临床风险因素与AI信号
研究人员进一步探讨了AI信号与临床风险因素的互补性。将1L ECG-AI与CHARGE-AF评分结合后,模型判别能力有轻微提升(AUROC 0.703)。多变量Cox回归分析显示,两者均为AF的独立预测因子。根据两种模型划分风险分层发现,同时被两种模型判定为高风险(2年风险≥3%)的个体AF累积发生率最高,而仅被一种模型判定为高风险者次之,两种模型均判定为低风险者AF发生率最低。这证实了AI心电图信号与临床风险因素提供了互补的预测信息。
使用1L ECG-AI AS进行风险分层
研究人员评估了1L ECG-AI AS作为AF筛查分层工具的潜力。按预测风险分级(<1%, 1-2%, ≥3%)可以有效区分AF的长期发生风险。与目前指南推荐的筛查所有≥65岁人群的策略相比,使用1L ECG-AI AS(风险≥3%作为筛查阈值)可带来显著的净重分类改善(NRI 0.27),这主要源于能够正确地将大量(约9900名)未发生AF的个体分类为低风险,从而避免对其不必要的筛查,尽管这会漏掉一部分(149名)最终发生AF的病例。决策曲线分析进一步表明,在很宽的决策阈值范围内,使用1L ECG-AI AS选择筛查对象都比筛查所有≥65岁人群能带来更大的净收益。
次要和亚组分析
显著性图谱(Saliency map)显示,1L ECG-AI模型的预测主要关注P波及其周边区域,这与临床认知和其前身12导联ECG-AI模型的行为一致。在可确定AF类型的亚组中,模型对持续性AF的预测能力似乎优于阵发性AF。1L ECG-AI AS预测的风险与AF相关生物标志物(如NT-proBNP)和心脏结构指标(如左房内径)仅呈弱相关,提示其提供了独特的预测信息。模型在不同年龄亚组和性别中的性能基本一致。对同一患者多次记录的分析表明,模型预测分数在个体内具有中度至高度的稳定性。
本研究证实了利用人工智能分析真实世界环境下采集的手持单导联心电图来预测未来房颤风险的可行性。研究人员成功地将一个在大型标准心电图数据库上预训练的模型(1L ECG-AI)通过迁移学习应用于嘈杂的手持设备数据,并取得了与基于临床风险因子(CHARGE-AF)的复杂评分系统相媲美的预测性能。这项工作的重要意义在于,它为实现高效、精准、可及性更广的房颤风险分层筛查提供了强有力的新证据。仅需一个廉价、便携的手持设备记录约30秒的心电图,结合年龄和性别,就有可能识别出AF高危个体,从而优化筛查资源分配,将筛查重点聚焦于最需要的人群。这种方法有望克服当前基于年龄的“一刀切”筛查策略的局限性,也可能有助于发现那些年轻但基于心电图特征显示高风险的患者。未来,需要进一步的研究在其他人群和设备上验证这些发现,并最终通过临床试验来评估这种AI驱动的风险分层筛查策略是否能真正改善患者的重要临床结局。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号