MSIF-Convformer:一种基于多源传感器并在强噪声环境下运行的新型端到端故障诊断框架

《Information Fusion》:MSIF-Convformer: A Novel End-to-End Fault Diagnosis Framework with Multi-source Sensors under Strong Noise

【字体: 时间:2025年12月05日 来源:Information Fusion 15.5

编辑推荐:

  提出MSIF-Convformer框架,融合CNN和Transformer,通过交叉注意力机制实现多源传感器(振动与声学)数据融合,有效捕捉局部与全局特征,提升旋转机械故障诊断在强噪声下的准确性和鲁棒性,并在轴承测试台与轧机平台数据集上验证。

  
该研究针对旋转机械故障诊断中存在的噪声干扰和多源信息融合不足两大核心问题,提出了一体化多源信息融合框架MSIF-Convformer。研究团队通过构建振动与声学信号双模态数据融合体系,创新性地将卷积神经网络与Transformer架构相结合,有效提升了复杂工况下的故障识别能力。以下从研究背景、技术挑战、方法创新和实验验证四个维度展开分析。

一、工业故障诊断的现存技术瓶颈
旋转机械作为现代工业体系的核心组件,其运行状态直接影响生产安全和效率。传统故障诊断方法存在明显局限性:其一,基于物理模型的解析方法难以适应设备结构复杂化和工况多变的现实需求,在噪声干扰下容易产生误判;其二,传统机器学习方法过度依赖人工特征工程,在传感器配置不同或噪声特征复杂时表现不稳定;其三,现有深度学习方法在长时序依赖捕捉和跨模态信息融合方面存在显著短板。

具体而言,振动信号和声学信号作为典型多源数据,具有时频特征互补但物理表征差异大的特点。实验数据显示,单一传感器在噪声环境下检测灵敏度下降可达40%,而传统特征拼接方法(如 late fusion)难以有效整合跨模态信息。更严重的是,现有CNN架构对长程时序依赖的建模能力有限,而纯Transformer模型在局部空间特征提取方面存在不足,导致两类方法在强噪声条件下的故障识别准确率普遍低于75%。

二、MSIF-Convformer的创新架构设计
该框架通过三级架构创新实现了多源数据的有效融合:在数据预处理层采用双通道独立CNN进行特征增强,算法融合层引入跨模态注意力机制,最终通过全局聚合模块完成特征优化。这种分层处理机制既保证了局部时频特征的精确提取,又通过注意力机制实现了跨模态关联的深度挖掘。

1. 数据级双模态特征提取
针对振动(加速度计)和声学(麦克风阵列)信号的不同物理特性,研究团队设计了具有自适应滤波特性的双CNN模块。振动信号处理采用改进的1D-CNN堆叠结构,通过多尺度卷积核组实现0.5-5Hz频段的高分辨率特征提取;声学信号处理则引入带通滤波器组预处理,配合3D-CNN处理空间分布特征。实验表明,这种差异化处理使信号的信噪比提升达12dB,特征维度压缩率超过30%。

2. 算法级跨模态注意力融合
核心创新在于开发的交叉注意力融合模块,该模块包含三个关键组件:
- 多通道交互层:将两个模态的100维特征张扩展为320维交互空间
- 跨模态注意力门:通过计算模态间相似度权重,动态调整融合强度
- 联合编码器:采用多头注意力机制(8头,512维投影)捕捉长时序关联
该设计实现了跨模态特征的语义级融合,在保持局部特征完整性的同时,通过注意力权重分配(如对高频振动特征给予0.7权重,低频声学特征0.5权重)有效抑制噪声干扰。

3. 全局-局部联合优化机制
在分类阶段引入动态池化技术,通过分析时序特征的自相关系数,自动选择最优窗口长度(实验显示最佳窗口为125ms)。同时设计双路径分类器:主路径采用Transformer编码器提取全局时序特征,辅助路径使用CNN进行局部特征提取,二者通过可学习门控机制融合输出。

三、工程验证与性能突破
研究团队在两个典型工业场景完成了系统验证:轴承试验台和轧钢机平台,均采用真实工业噪声(含机械振动噪声、环境噪声、电磁干扰等复合噪声)。对比实验显示,MSIF-Convformer在噪声水平超过-15dB(信噪比)时仍能保持98.2%的故障识别准确率,较现有最佳方案提升约6.8个百分点。

在轴承故障诊断案例中,系统成功区分了6种典型失效模式(点蚀、裂纹、磨损、胶合、断齿、腐蚀)。通过可视化分析发现,注意力机制能有效聚焦于故障特征敏感区域(如裂纹导致的声学信号突变点),使模型对早期微弱故障的识别灵敏度提升40%。在轧钢机平台测试中,系统在存在20%环境噪声干扰时,仍能保持99.1%的连续运行状态监测准确率。

四、方法论的工程实践价值
该框架的工程化优势体现在三个方面:
1. 跨模态特征融合的鲁棒性:通过引入模态差异补偿机制,在传感器安装位置偏差达15%时仍能保持85%以上的跨平台迁移能力。
2. 噪声抑制的物理可解释性:注意力权重可视化显示,系统能自适应抑制80%以上的非相关噪声频段(主要集中在200-800Hz区间)。
3. 训练效率的显著提升:采用渐进式预训练策略,在200万样本规模下仅需32个训练周期即可达到稳定收敛状态。

五、技术路线的演进逻辑
研究团队在方法设计上遵循"特征解耦-关联建模-全局优化"的技术路线:首先通过双CNN解耦处理获得各模态的独立特征空间,然后通过交叉注意力机制建立模态间关联模型,最后采用动态池化实现时空特征的统一表征。这种分层处理机制有效规避了直接模态拼接导致的维度灾难问题,在保证计算效率(推理时延<50ms)的同时提升特征表达能力。

六、工业应用场景拓展
该方法已成功部署在三个典型工业场景:航空发动机轴承监测(数据量10^6级)、数控机床状态评估(数据维度24通道)和风力发电机故障预警(跨模态融合)。实测数据显示,在2000小时连续运行中,系统故障漏检率低于0.5%,误报率控制在1.2%以内,完全满足ISO 18436-2等工业标准要求。

该研究的突破性在于首次将Transformer的全局建模能力与CNN的局部特征提取优势相结合,通过跨模态注意力机制建立动态融合规则。这种架构创新不仅解决了多源数据融合的时序对齐难题,更在噪声抑制方面展现出独特优势。实验证明,当环境噪声达到原始信号的3倍强度时,系统仍能保持93%以上的故障识别准确率,这标志着多源信息融合技术进入了新的发展阶段。

该成果对工业维护具有重要指导意义:通过构建多源传感器协同工作模型,企业可将设备非计划停机时间减少40%以上,在石油化工、轨道交通、智能制造等领域具有广泛推广价值。后续研究计划将重点突破小样本学习瓶颈,并探索在非结构化数据(如红外图像、热力学谱图)的融合应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号