基于图神经网络的源分离方法用于具有较大组分浓度差异的气体混合物分析

《Sensors and Actuators B: Chemical》:Graph Neural Network-Based Source Separation for Gas Mixture Analysis with Large Inter-Component Concentration Disparities

【字体: 时间:2025年11月24日 来源:Sensors and Actuators B: Chemical 7.7

编辑推荐:

  电子鼻中气体浓度差异大时的准确估计方法,提出基于图神经网络(GNN)的GACA模型,通过构建传感器-气体图实现混合信号分离,结合多任务学习与辅助任务优化,显著提升高浓度背景下的痕量气体(10ppm)和主要气体(100ppm)的R2值至0.9957和0.9993。

  电子鼻技术近年来在多个领域得到了广泛应用,其核心功能之一是对混合气体中各组分浓度的准确估计。然而,在实际应用中,化学传感器阵列不可避免地会出现交叉干扰,这使得在存在高浓度背景气体的情况下,对低浓度伴随气体的浓度估计尤为困难。为了克服这一挑战,本文提出了一种基于图神经网络(GNN)的图注意力类别辅助学习(GACA)模型,旨在通过有效的信号分离策略,提高混合气体中各组分浓度估计的准确性。

在电子鼻系统中,传感器阵列通常由多种不同类型的化学传感器组成,这些传感器对不同气体的响应特性各异。然而,当多种气体同时存在时,它们的响应信号会相互影响,导致难以区分各组分的浓度。这种交叉干扰在高浓度背景气体存在时尤为显著,因为低浓度气体的信号容易被高浓度气体所掩盖。因此,为了实现更精确的浓度估计,需要一种能够有效分离混合气体信号的方法。传统的信号处理方法,如独立成分分析(ICA)和稀疏成分分析(SCA),在面对复杂且非线性的混合信号时表现有限。此外,基于统计假设的方法往往难以适应实际环境中气体成分之间的复杂关系。

本文提出的GACA模型通过引入图结构来建模传感器与气体之间的关系,从而解决了这一问题。具体而言,该模型首先构建了一个新型的传感器-气体图,将混合气体信号的分离过程转化为图神经网络中的边特征传播。这一过程不仅能够捕捉到传感器与气体之间的相互作用,还能通过图结构的拓扑关系,更全面地表示各组分的特性。接下来,模型引入了通道图注意力机制(CGAT),通过多头图注意力机制从多个角度提取气体成分的信息,从而增强各组分特征的表示能力。这一机制能够在不依赖于复杂数学公式的情况下,有效地处理传感器数据中的非线性关系和交互作用。

为了进一步提升模型的性能,GACA还采用了辅助学习策略。在传统的多任务学习中,辅助任务通常用于增强主任务的泛化能力,而本文的辅助任务则通过提供额外的监督信号,帮助模型更高效地学习气体成分的特征。实验结果显示,这种辅助学习策略不仅提高了主任务的浓度估计精度,还加快了模型的收敛速度。通过这种设计,GACA能够在处理具有显著浓度差异的混合气体时,实现对高浓度和低浓度组分的准确估计。

为了验证GACA模型的有效性,研究团队使用了一个来自UCI机器学习仓库的公开时间序列数据集。该数据集包含了在受控环境下,化学传感器阵列对动态变化的气体混合物进行长期测量的结果。数据集的实验设置包括一个60毫升的测量室,气体混合物以每分钟300毫升的恒定流速引入。通过这一数据集,研究人员能够全面评估模型在实际应用中的表现。

实验结果表明,GACA模型在处理具有显著浓度差异的混合气体时,表现出了卓越的性能。对于浓度在100 ppm级别的两种高浓度气体组分,模型的R2值分别达到了0.9982和0.9993,显示出极高的估计精度。而对于浓度在10 ppm级别的低浓度气体组分,模型同样取得了优异的结果,R2值为0.9957。这一结果表明,GACA模型不仅能够有效处理高浓度气体的信号,还能准确捕捉低浓度气体的细微变化,从而实现对混合气体中各组分的全面分析。

在实际应用中,混合气体的浓度差异往往非常显著。例如,在糖尿病患者的呼出气体检测中,丙酮的浓度通常在0到8.62 ppm之间,而乙醇的浓度可能高达0到570 ppm。在锂离子电池过充故障检测中,乙烯的浓度可能在0到50 ppm之间,而挥发性有机化合物(VOCs)的浓度可能接近200 ppm。这些案例表明,混合气体中存在明显的浓度差异,而传统方法在处理这种差异时往往效果不佳。GACA模型通过引入图结构和注意力机制,能够更准确地捕捉各组分的特征,从而提高浓度估计的精度。

在模型构建过程中,研究人员首先对传感器数据进行了预处理,以增强输入结构并提高学习效率。预处理模块包括数据清洗、归一化和特征提取等步骤,这些步骤有助于去除噪声并突出关键特征。随后,模型通过图注意力机制对混合气体信号进行分离,这一过程模拟了气体与传感器之间的相互作用,并通过图结构的传播机制,实现了对各组分信号的准确提取。最后,模型利用提取的特征进行浓度估计,通过端到端的训练过程,直接学习从混合信号到各组分浓度的映射关系。

为了进一步验证模型的性能,研究人员对多个实验场景进行了测试。在这些测试中,GACA模型不仅在高浓度气体的估计上表现出色,而且在低浓度气体的估计上也取得了良好的效果。这种性能的提升得益于模型在信号分离和浓度估计过程中对多尺度信息的捕捉能力。通过引入图结构,模型能够更全面地表示传感器与气体之间的关系,而通过注意力机制,模型能够动态调整各组分特征的重要性,从而实现更精确的浓度估计。

此外,GACA模型还具有较强的泛化能力。在不同浓度范围和不同气体混合物的情况下,模型能够保持较高的估计精度。这种泛化能力使得GACA模型不仅适用于特定的实验数据集,还能广泛应用于其他气体检测场景。例如,在环境监测中,模型可以用于检测空气中的多种污染物;在工业监控中,模型可以用于分析生产过程中的气体排放;在食品工程中,模型可以用于检测食品中的挥发性成分;在医疗诊断中,模型可以用于分析患者呼出气体中的生物标志物。

值得注意的是,GACA模型在设计上充分考虑了实际应用中的各种挑战。例如,在处理大规模数据时,传统的数学公式和统计假设方法可能无法准确描述气体与传感器之间的复杂关系。而GACA模型通过图结构和注意力机制,能够灵活适应不同的数据分布和传感器配置,从而提高模型的适用性和鲁棒性。此外,模型的结构设计使得其在部署时能够减少计算开销,提高实际应用中的效率。

在实验过程中,研究人员还对模型的收敛速度进行了评估。与传统的多任务学习方法相比,GACA模型通过引入辅助任务,不仅提高了浓度估计的精度,还加快了模型的训练过程。这一优势在实际应用中尤为重要,因为快速收敛意味着模型能够在较短的时间内完成训练,从而提高整体的工作效率。

总的来说,GACA模型通过结合图神经网络和辅助学习策略,为混合气体浓度估计提供了一种新的解决方案。该模型能够有效处理高浓度和低浓度气体之间的交叉干扰,提高浓度估计的准确性。此外,模型的结构设计使其在大规模数据处理和实际部署中具有较高的效率和适用性。未来,随着电子鼻技术的不断发展,GACA模型有望在更多领域中得到应用,为气体检测和分析提供更可靠的技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号