利用残差神经网络从心电图信号中识别心脏风险因素
《Congenital Heart Disease》:Identification of Cardiac Risk Factors from ECG Signals Using Residual Neural Networks
【字体:
大
中
小
】
时间:2025年10月03日
来源:Congenital Heart Disease 1.2
编辑推荐:
心脏异常自动检测与ECG年龄预测研究:提出基于改进ResNet的多标签分类模型,通过波let去噪、形态学滤波和自适应数据增强处理不平衡数据,并评估12导联缺失下的鲁棒性。实验表明模型在基准测试中达到93.9%的F1分数,且通过分组训练策略使ECG年龄预测误差降低至MAE 0.78±0.02岁。
心血管疾病是全球范围内的主要健康问题之一,其导致的死亡率高达32%,每年造成近1790万例死亡。这凸显了对心血管疾病进行准确且及时诊断的必要性。心电图(ECG)作为评估心脏健康的重要工具,能够通过分析心脏的电传导系统产生的电压变化,提供关于心脏节律、心率和功能的关键信息,从而帮助识别如心律失常、传导阻滞和结构性心脏病等病症。然而,传统的ECG解读依赖于人工分析,这一过程需要专业人员对波形、间隔和节律进行细致观察,存在主观性差异、疲劳和误诊等挑战,特别是在识别细微或复杂情况时,这些限制可能导致漏诊或误报,尤其是在预测心脏病发作等关键场景中。
为了解决这些问题,自动化方法结合先进的深度学习技术已成为一种有前景的解决方案。12导联心电图作为全球心脏评估的标准配置,通过结合肢体和胸导联,提供了关于心脏电活动的详细信息,有助于检测局部异常并提高诊断的准确性。近年来,深度学习,特别是卷积神经网络(CNN)和残差神经网络(ResNet),在ECG信号的自动处理方面取得了显著进展。CNN擅长检测局部波形模式,而ResNet通过其跳接结构,能够在不牺牲性能的情况下构建更深的网络,有效捕捉细微信号变化和长期依赖关系。此外,ECG年龄(ECG Age)的概念为心脏健康提供了一个新的视角,它反映的是心脏的生理年龄,而不是实际年龄,从而揭示了潜在的心血管疾病。
在本研究中,提出了一种改进的ResNet架构,用于检测心脏异常并估计ECG年龄。研究聚焦于12导联ECG数据中常见的六种心脏状况:1度房室传导阻滞(1dAVB)、右束支传导阻滞(RBBB)、左束支传导阻滞(LBBB)、窦性心动过缓(SB)、窦性心动过速(ST)和心房颤动(AF)。为了应对如类别不平衡、缺失导联和模型泛化等重要问题,研究采用了多步骤的预处理方法,包括高通滤波、陷波滤波、形态学滤波和小波变换,以去除噪声并增强信号质量。这些预处理步骤不仅确保了数据的高质量,还为后续的深度学习模型训练提供了可靠的基础。
为了处理类别不平衡问题,研究从原始数据集中选取了30,000个样本,并通过随机采样确保各异常类别具有可比的代表性。最终,数据集被划分为训练集(70%)、验证集(20%)和测试集(10%),以保持类别分布的一致性。在模型训练过程中,采用了网格搜索策略和验证性能监控,以优化超参数的选择。研究中选择了0.001作为学习率,平衡了特征学习和收敛效率;选择了32作为批量大小,以在训练效率和模型性能之间取得最佳平衡;采用Adam优化器,以兼顾动量和RMSprop的优势;并应用了L2正则化,以防止过拟合并提高模型在未知数据上的泛化能力。对于多标签分类任务,模型采用了二元交叉熵损失函数,以优化多类别预测的准确性。
在模型设计方面,研究引入了残差学习和跳接结构,以应对ECG信号中常见的细微变化和复杂模式。跳接结构使得输入可以直接添加到残差块的输出,从而确保梯度的稳定流动,并保留信号的基本结构。这种设计对于ECG信号的处理至关重要,因为基线特征(如心电波形的总体形态)必须保持不变,以便网络能够准确检测出与异常相关的细微变化。通过残差学习和跳接结构,模型能够更有效地处理高维、多变量的时间序列信号,从而提高对心脏异常的识别能力。
在模型评估方面,研究对比了多种模型,包括12层CNN、15层CNN和Ribeiro等人的基准模型。提出的ResNet模型在多个关键指标上表现出色,如子集准确率(Subset Accuracy)、汉明损失(Hamming Loss)、宏平均精确度(Macro Precision)、宏平均召回率(Macro Recall)、宏平均F1分数(Macro F1 Score)、微平均精确度(Micro Precision)、微平均召回率(Micro Recall)和Jaccard指数。ResNet模型的子集准确率达到0.90557,汉明损失为0.02154,Jaccard指数为0.90505,这些结果表明模型在识别多标签ECG异常时具有较高的准确性,并且在处理不同类别时表现出良好的平衡性。此外,模型的微平均F1分数达到0.93042,显示出其在处理不同频率的异常时的稳健性。
在评估模型对缺失导联的鲁棒性时,研究通过系统地移除不同组合的导联,生成了4096种不同的缺失导联情况,以全面分析模型在不同数据完整性的表现。结果显示,基于心率的异常(如ST、SB和AF)在高达75%的导联缺失情况下仍能保持较高的分类准确率,而基于传导的异常(如1dAVB、RBBB和LBBB)则在导联缺失超过四个时表现出显著的性能下降。这一发现强调了针对不同异常类型优化模型的重要性,从而确保在实际应用中,即使在数据不完整的情况下,模型也能提供可靠的结果。
为了提高模型的鲁棒性,研究提出了一个分组策略,将基于心率的异常与基于传导的异常分别进行训练。这一策略使得模型在处理不同类型的异常时能够更有效地分配资源,从而在多种导联缺失情况下实现更高的分类准确率和稳定性。结果表明,经过分组训练后,模型的总体分类准确率达到95.12%,F1分数达到95.79%。这表明,通过分组训练,模型能够更好地适应不同导联缺失情况,从而在临床实践中提供更可靠的结果。
ECG年龄的预测结果也显示了模型的潜力。对于正常ECG信号,预测的ECG年龄与实际年龄之间的偏差较小,而异常ECG信号则显示出较大的偏差。这一偏差可能反映了心脏的生理老化或潜在的心血管疾病,从而为早期干预提供依据。通过将预测的ECG年龄与实际年龄进行比较,模型能够识别出那些心脏年龄显著高于实际年龄的个体,这些个体可能面临更高的心血管风险。
在实际应用中,模型的推理延迟被评估为在NVIDIA P100 GPU上约为3秒,对应每样本约0.914毫秒的延迟和每秒约1094样本的吞吐量。这一延迟水平表明模型能够在接近实时的情况下进行ECG分析,这对于需要连续监测的可穿戴设备来说是一个重要的优势。然而,为了进一步验证模型在资源受限设备上的可行性,未来的研究可能会专注于评估其在嵌入式GPU和神经处理单元(NPUs)上的性能,以及仅使用CPU的部署情况。
研究还探讨了模型在实际应用中的临床意义和潜在用途。由于模型在多标签分类任务中表现出高召回率和精确度,它可以在可穿戴设备中作为早期预警和筛查工具,特别适用于高风险人群,如老年人和专业运动员。此外,ECG年龄的偏差可能成为心血管风险的早期标志,提示医生对可能面临心血管疾病风险的个体进行进一步评估。结合异常检测和ECG年龄分析,模型为预防性心脏护理提供了一条可行的路径。
为了增强模型的评估,研究还分析了单异常和多异常情况下的表现。结果显示,模型在单异常ECG中的微平均F1分数达到98.65%,而在多异常ECG中的微平均F1分数为95.16%,表明模型能够有效地处理重叠的病理情况。此外,通过按人口统计学因素进行进一步分层,研究发现模型在不同年龄组和性别中的表现保持一致,说明其预测性能不受特定人群的影响。
研究还探讨了模型在实际应用中的挑战和未来方向。尽管模型在处理缺失导联情况时表现出一定的鲁棒性,但在实际部署中,如何应对这种情况仍然是一个关键问题。未来的工作可能包括开发基于深度学习的信号重建模型、优先使用最可靠导联的信息,或训练专门的分类器以在减少导联的情况下有效工作。此外,设计一个备用机制,当关键导联信息缺失时能够标记不确定的预测,并提示重新采集或进行确认性检测,将有助于提高系统的可靠性和适用性。
最后,研究强调了将自动化ECG模型整合到远程医疗平台和可穿戴健康监测系统中的潜力。通过在这些平台中嵌入自动ECG分析模型,可以实现即时的诊断反馈和实时警报生成,从而支持医生并赋予患者早期检测的能力。这些进展不仅提高了自动ECG分析的实用性,还加速了其在常规临床实践中的应用,使技术进步与医疗需求相辅相成。
总之,本研究提出了一种基于ResNet的深度学习框架,用于心脏异常的检测和ECG年龄的估计。通过引入改进的信号处理技术和分组训练策略,模型在处理数据缺失和类别不平衡方面表现出色。研究结果表明,该模型不仅在多标签分类任务中具有较高的准确率和稳健性,还能够通过ECG年龄的预测提供额外的临床见解。未来的工作将集中在优化模型在资源受限设备上的性能,开发更高效的实时处理方法,并探索将模型整合到更广泛的医疗系统中,以提高心脏健康监测的准确性和实用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号