单导联消费者用心电图设备是否足以实现准确的QTc监测?一种基于校准不确定性的人工智能方法
《Journal of Electromyography and Kinesiology》:Are single-lead consumer ECG devices enough for accurate QTc monitoring? A calibrated uncertainty AI approach
【字体:
大
中
小
】
时间:2025年10月08日
来源:Journal of Electromyography and Kinesiology 2.3
编辑推荐:
基于单导联ECG的不确定性感知AI模型在QTc评估中的临床应用与验证。该模型通过变分推理实现概率输出,结合校准误差分析(ENCE 14.6%)有效识别高不确定性病例(11%),使剩余89%病例与12导联参考值高度吻合(均值偏移-0.7ms,95%CI 0.85-0.89 AUROC达0.96)。研究为可解释AI在医疗诊断中的应用提供新范式。
在心血管疾病的诊断和监测中,QT间期的测量具有重要的临床意义。QT间期经过心率校正(QTc)后,是评估心室复极状态的关键指标,并且能够预测严重的室性心律失常,例如尖端扭转型室性心动过速(TdP)和猝死(SCD)[[1,2]]。药物引起的QT间期延长是导致这些风险的主要原因之一,目前已有超过200种药物,包括抗生素、抗精神病药和抗心律失常药,均包含对QT间期延长的警告[[3]]。然而,尽管这些风险存在,遵循指南推荐的QTc监测仍面临资源消耗大和实施困难的问题。例如,仅有不到50%的开始使用QT延长型精神类药物的患者会按照建议接受基线或随访心电图(ECG)检查,这使得许多患者面临未被发现的室性心律失常风险[[4]]。这种缺口在农村或医疗资源匮乏的地区尤为明显,因为这些地区获取12导联心电图的条件受到物流和地理因素的限制[[5]]。
虽然12导联心电图是QTc测量的金标准,但在常规或频繁监测中,其使用并不现实,因为需要进行诊所访问和使用专门设备。相比之下,单导联消费级心电图设备,如Apple Watch和AliveCor KardiaMobile,已经成为远程心脏监测的可行替代方案[[6], [7], [8]]。这些设备能够实现患者在家进行QTc监测,减少对诊所访问的依赖,从而使得QT间期的频繁评估更加便捷和可及。然而,单导联设备在QTc测量方面仍受到技术挑战的限制,如噪声干扰、T波形态的变异性以及与多导联系统相比的固有局限性[[9]]。已有研究评估了单导联设备在QT测量方面的表现,结果显示其与12导联心电图之间的共识度仅为中等水平,且在信号质量差或波形异常的情况下,准确性进一步下降[[10]]。基于深度学习的QT测量方法,如QTNet[[11]],在应用于来自临床级多导联记录的单导联心电图时,能够实现极低的测量误差。这些结果表明,单导联设备中的I导联信号包含足够的信息,以实现准确的QT间期评估,从而支持单导联监测在克服消费级设备的技术挑战后,具有重要的临床潜力。
近年来,人工智能(AI)技术的进步为解决这些限制提供了新的可能性。通过将不确定性估计集成到深度学习模型中[[12]],AI系统可以量化其对QTc测量的置信度,并识别那些由于信号质量或形态问题导致结果不可靠的案例。这种方法模仿了临床推理,即识别存在歧义的案例,而不是提供过于自信或错误的预测。在心脏病学领域,不确定性感知的人工智能已经被成功应用于其他诊断挑战,包括心律失常检测[[13]]和冠状动脉疾病风险预测[[14]],表明其在减少假阳性和假阴性方面具有显著的可靠性提升。
本研究旨在评估是否可以通过不确定性校准的AI模型,从单导联心电图记录中可靠地测量QTc。不确定性校准指的是确保模型的置信度评分与实际误差率一致的过程,该过程通过变分推断和归一化校准误差(ENCE)验证实现。具体而言,我们提出了以下两个假设:
1. 使用大量12导联心电图数据集训练的AI模型,能够在低不确定性情况下,实现与12导联参考QTc测量值在临床可接受范围内的共识(±30 ms标准差,依据IEC 60601–2-25标准[[15]])。
2. 通过不确定性校准,模型能够有效识别那些QTc测量误差超过临床可接受阈值的高不确定性案例。
通过引入AI驱动的方法来解决单导联设备的局限性,本研究的目标是建立一个可扩展、可及的QTc监测框架,该框架能够补充传统的临床工作流程,同时扩展对医疗资源匮乏人群的监测能力。
本研究采用了一种回顾性设计,开发并评估了用于预测RR/QT间隔的AI模型,同时集成了不确定性量化。我们的方法特别优化了模型,使其能够为每个QTc测量报告置信度,从而让用户评估个体测量的可靠性。该研究的四阶段设计包括:(1)使用变分推断进行概率输出的架构开发,(2)与12导联参考标准进行校准,(3)模型性能的评估,以及(4)不确定性校准的验证。通过对大量回顾性数据集(约400,000份心电图)进行训练,并在2050份手动标注的AliveCor KardiaMobile单导联(I导联)心电图上进行测试,我们能够验证模型在不同条件下的表现。
在所有心电图数据中,AI模型在单导联QTc预测与12导联QTc测量之间表现出良好的共识。平均偏差为1.0 ms,标准差为±28.5 ms,如图3所示的Bland-Altman图所展示。标准差(±28.5 ms)在IEC 60601–2-25标准下,与自动化12导联解释软件的误差容忍阈值(30 ms)一致,尽管该模型仅使用了消费级设备中的单导联信号。这种表现表明,AI模型在低不确定性情况下,能够提供接近临床标准的QTc测量结果。
在结果分析中,我们发现,该模型在89%的心电图记录中,单导联QTc预测与12导联参考值之间表现出高度的共识。这一水平的性能尤其重要,因为它表明,在大多数情况下,单导联心电图可以提供可靠的心室复极状态评估,这对于评估心脏安全和室性心律失常的风险至关重要。此外,识别高不确定性案例的能力同样关键,因为这些案例可能需要重新检测以确保结果的准确性。
通过不确定性分析,我们排除了11%的心电图记录,这些记录被标记为不可靠。排除后的89%记录显示,与12导联参考值之间存在良好的共识(平均偏差:-0.7 ms,共识范围:-42至+41 ms)。而被排除的高不确定性案例则表现出显著更大的误差(平均偏差:15.3 ms,共识范围:-104至+134 ms)。不确定性估计的校准效果良好(ENCE:14.6%),使模型能够有效识别不可靠的预测结果,供专家进行复核,同时在保留的案例中维持临床级别的准确性。在低不确定性案例中,分类表现达到了优异的AUROC值:0.87(95% CI:0.85–0.89)用于≥450 ms的QTc延长分类,0.90(95% CI:0.86–0.93)用于≥470 ms,0.96(95% CI:0.92–1.00)用于≥500 ms。
这些结果表明,通过不确定性量化,AI模型能够实现对单导联心电图的可靠QTc监测,动态标记不可靠的测量结果。这种方法不仅提高了临床安全性,还拓展了在偏远地区进行心脏风险评估的可能性。此外,该方法为开发透明、可靠的AI工具提供了范例,强调信任的重要性,而不仅仅是传统的可解释性。
本研究的成果验证了我们提出的两个假设。首先,我们证明了使用12导联心电图数据集训练的AI模型,在低不确定性情况下,能够实现与12导联参考QTc测量值在临床可接受范围内的共识(平均偏差:-0.7 ms,标准差:±21.1 ms),从而支持了我们的第一个假设。其次,不确定性校准有效地识别了11%的心电图记录,这些记录的测量误差超过了临床可接受阈值(平均偏差:15.3 ms,标准差:±60.2 ms),验证了我们的第二个假设。
在研究过程中,作者们使用了Perplexity Pro来识别相关临床标准、定位支持文献并澄清技术概念,同时使用LanguageTool来增强语法准确性和风格一致性。在使用这些工具后,作者们对内容进行了必要的审查和编辑,并对出版内容承担全部责任。
此外,本研究还声明了可能存在的利益冲突。Peter Doggart和Dr. Alan Kennedy是PulseAI Ltd.的董事和股东。Professor Raymond Bond、Professor Dewar Finlay和Dr. Daniel Guldenring是PulseAI Ltd.的顾问。Dr. Dave Albert持有AliveCor Inc.的大量股票。
本研究得到了来自“皇家展览基金会1851年”的工业奖学金的支持。这种支持为研究提供了必要的资源,使得AI模型的开发和评估得以顺利进行。
总的来说,这项研究展示了单导联心电图在心脏风险评估中的潜力,特别是在结合不确定性量化后,能够实现可靠和安全的QTc监测。这种技术的突破不仅有助于提高远程医疗的可行性,还为未来AI在医疗领域的应用提供了新的思路和方法。通过构建一个既符合传统临床流程又能够扩展监测能力的框架,这项研究为实现更广泛、更便捷的心脏健康评估奠定了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号