
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于跨注意力多模态CNN-LSTM网络的心律失常分类与临床诊断支持研究
【字体: 大 中 小 】 时间:2025年09月25日 来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
本文提出一种融合跨注意力机制(Cross Attention)的多模态CNN-LSTM模型,整合心电信号时域与频域特征,有效提升心律失常分类准确率(达98.97%)。研究采用SMOTE与Tomek Links技术解决数据不平衡问题,并开发了临床辅助诊断工具,推动人工智能在心血管疾病诊断中的实际应用。
Section snippets
Proposed CNN-LSTM model with cross attention for arrhythmia classification
本节提出一种用于智能心律失常分类的多模态模型,融合了CNN-LSTM架构与跨注意力层(Cross Attention Layer)。该模型设计用于快速分类单心跳周期的心律失常,采用双通道输入:通道1为ECG片段,通道2为对应ECG片段的频域特征。通过跨注意力机制,模型能够从时域和频域信号中捕捉互补信息,提升分类性能。
ECG dataset
我们的模型训练、验证及测试集均来源于PhysioNet平台的MIT-BIH心律失常数据集与PTB诊断心电图数据库。这些数据集涵盖多种心律失常类型,被广泛用于心律失常分类研究,为模型训练提供了可靠且全面的数据基础。
Evaluation metrics
为评估模型性能,我们采用了混淆矩阵、受试者工作特征曲线(ROC曲线)及多种性能指标,包括准确率(Accuracy)、召回率(Recall)、精确率(Precision)和F1分数(F1-Score)。计算公式如下:
Accuracy = (TP + TN) / (TP + FP + FN + TN)
Precision = TP / (TP + FP)
Recall = TP / (TP + FN)
F1-Score = 2 × Precision × Recall / (Precision + Recall)
Conclusion
本研究提出了一种基于ECG信号时域与频域特征双信息融合的CNN-LSTM模型。通过跨注意力机制整合时域与频域特征,并计算相应权重以增强模型鲁棒性。为缓解ECG深度学习中普遍存在的数据不平衡问题,我们采用了Tomek Link与SMOTE技术,并随机删除了部分多数类(N类)样本。实验结果表明,所提出模型在心律失常分类任务中表现出色。
Declaration of Generative AI and AI-assisted technologies in the writing process
在本文撰写过程中,作者使用ChatGPT进行语言编辑与校对,未使用该工具生成任何内容。作者对全部内容进行审阅与编辑,并对出版物内容全权负责。
CRediT authorship contribution statement
董若望(Ruowang Dong): 撰写初稿、软件开发、方法论设计、研究实施与概念化。
谢立(Li Xie): 审阅与编辑、资源提供、研究指导。
Declaration of competing interest
作者声明不存在任何已知的竞争性财务利益或个人关系影响本研究报告。
Acknowledgments
本研究得到国家自然科学基金(92373205)、国家重点研发计划(2023YFB4404404)、浙江省重点研发计划(2022C03038)及浙江大学工业控制技术国家重点实验室开放课题(ICT2024B10)的资助。
生物通微信公众号
知名企业招聘