基于深度学习的脑卒中后肌电解码:从特征构建到网络设计的系统性研究
《IEEE Transactions on Neural Systems and Rehabilitation Engineering》:Deep Learning-Based Post-Stroke Myoelectric Gesture Recognition: From Feature Construction to Network Design
【字体:
大
中
小
】
时间:2025年11月19日
来源:IEEE Transactions on Neural Systems and Rehabilitation Engineering 5.2
编辑推荐:
本刊推荐:为解决脑卒中患者上肢功能障碍康复训练强度不足的问题,研究人员开展了基于表面肌电信号(sEMG)和深度学习(DL)的手势识别研究。通过系统评估3种特征域(时域、频域、小波域)、2种数据结构(一/二维)和3种神经网络架构(CNN、CNN-LSTM、CNN-LSTM-Attention)组成的18个DL模型,发现频域特征在脑卒中后手势识别中具有显著优势(CNN-LSTM模型在受试者内测试中准确率达72.95%)。研究还验证了迁移学习和后处理算法(模型投票和贝叶斯融合)可进一步提升识别效果,为机器人辅助康复提供了新技术方案。
当脑卒中患者试图重新获得对手部的控制时,他们的康复之路往往充满挑战。传统的康复治疗需要治疗师一对一辅助训练,不仅人力成本高,而且难以保证训练强度的一致性。随着社会老龄化加剧,这种劳动力密集型的康复模式愈发难以满足临床需求。机器人辅助康复技术的出现为这一困境带来了转机,特别是"按需辅助"(AAN)训练模式,能够在患者尝试运动时提供恰到好处的助力,既鼓励主动参与,又能保证训练强度。
然而,要实现真正意义上的AAN训练,核心在于如何准确识别患者的运动意图。在众多生理信号中,表面肌电信号(sEMG)因其富含神经控制信息、便携性好且 electromechanical latency(电机械延迟)较低等优势,成为人机交互的理想控制源。尽管机器学习方法在sEMG模式识别中已取得一定进展,但这些方法严重依赖特征工程的 expertise(专业知识)。近年来,深度学习(DL)技术为这一问题提供了新的解决思路,它能够自动学习特征并完成分类,在许多情况下可以更好地发挥神经网络的拟合能力。
尽管深度学习在健康受试者的肌电控制研究中展现出巨大潜力,但针对脑卒中患者的相关研究仍较为缺乏。脑卒中患者的sEMG信号具有其特殊性:肌肉萎缩、异常协同运动和疲劳等因素都会影响信号质量。此外,患者个体间功能差异显著,为模型泛化带来挑战。正是这些未解问题,促使中国康复工程领域的研究团队开展了这项系统性研究。
研究人员首先采集了8名慢性脑卒中患者执行6种手部动作时的sEMG信号,这些患者的功能状况覆盖了从轻度到重度的不同障碍水平(Fugl-Meyer评估得分16-57分)。团队创新性地从三个维度构建研究框架:特征域(时域、频域、小波域)、数据结构(一维或二维)和神经网络架构(CNN、CNN-LSTM、CNN-LSTM-Attention)。通过组合这些因素,共开发了18个不同的深度学习模型。
在技术方法层面,研究团队主要采用了以下关键技术:sEMG信号预处理(20-450Hz带通滤波和零漂校正)、多域特征构建(时域、频域FFT和小波域AveWT特征)、深度学习模型构建(CNN、CNN-LSTM、CNN-LSTM-Attention三种网络结构)、双维度数据表示(一维和二维sEMG图像)、受试者内测试与受试者间迁移学习验证、贝叶斯超参数优化以及后处理算法(模型投票和贝叶斯融合)。所有sEMG数据均来自8名慢性脑卒中患者的前臂7个肌肉采集。
研究表明,不同深度学习模型在识别准确率上存在显著差异。最佳表现的DL模型比最差模型平均准确率高出约15%,凸显了深度学习设计优化的重要性。特别值得注意的是,所有采用频域特征的模型(M2、M5、M8、M11、M14、M17)都表现出色,其中CNN-LSTM结合二维频域特征的模型(M11)达到了72.95%的最高平均准确率。
统计分析显示,混合网络结构(CNN-LSTM和CNN-LSTM-Attention)普遍优于单一CNN结构,而注意力机制在当前设计中并未显著提升CNN-LSTM的性能。最重要的是,频域特征的表现显著优于时域和小波域特征(p<0.05),而数据维度(一维或二维)则未引起显著差异。
在更具挑战性的受试者间迁移学习任务中,研究采用了循环迁移学习策略。每个受试者依次作为预训练数据集,其余受试者的数据用于微调和测试。结果显示,CNN-LSTM-Attention结合一维频域特征的模型(M14)取得了68.38%的最高平均准确率。
迁移率(用于微调的数据比例)的影响也被系统评估。当迁移率从10%增加到30%时,识别准确率呈现上升趋势,但增长率逐渐放缓。这一发现为实际应用中如何平衡数据收集成本和模型性能提供了重要参考。
针对sEMG信号的非平稳特性,研究团队进一步引入了两种后处理算法:模型投票和贝叶斯融合。这些算法基于多个频域模型的输出进行决策优化。结果显示,后处理能进一步提升识别性能,其中模型投票使识别准确率平均提高2.03%,贝叶斯融合提高1.65%。
本研究系统探讨了深度学习在脑卒中后肌电手势识别中的应用,揭示了特征域对模型性能的关键影响。频域特征被证明是最具信息量的表示形式,其优势在受试者内测试和受试者间迁移学习任务中均得到验证。这一发现具有重要意义,因为频域特征的计算相对简单,有利于在资源受限的嵌入式系统中实现。
研究还观察到不同患者间的识别性能存在较大变异,这主要源于脑卒中患者个体间的功能差异。严重程度不同的患者其肌肉激活模式、协同收缩水平和疲劳特性都有所不同,这些因素直接影响sEMG信号质量和模型识别效果。
尽管取得了上述进展,研究团队也指出了几个重要限制:首先,研究仅关注了sEMG在时域、频域和小波域的信息价值,未来可探索特征组合和多模态融合策略;其次,长期识别性能对实际康复应用至关重要,需要进一步研究;最后,可扩展后处理策略,如基于历史决策流的可接受性评估或低置信度预测的拒绝机制。
这项发表于《IEEE Transactions on Neural Systems and Rehabilitation Engineering》的研究,为脑卒中康复领域提供了深度学习技术应用的系统性框架。通过明确频域特征的核心价值,并为迁移学习和后处理算法提供实证支持,该研究为开发更可靠、实用的机器人辅助康复系统奠定了重要基础。随着深度学习技术的不断成熟和优化,我们有理由相信,基于sEMG的智能康复设备将为更多脑卒中患者带来福音。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号