基于掩码自编码器的视觉Transformer框架在复杂环境下实现鲁棒性火灾检测
【字体:
大
中
小
】
时间:2025年10月19日
来源:Process Safety and Environmental Protection 7.8
编辑推荐:
本文提出一种基于掩码自编码器(ImageMAE)和视觉Transformer(ViT)的创新火灾检测框架,通过自监督重建任务增强对复杂环境中细粒度火焰特征的捕捉能力,在多个基准数据集上实现1.10%-2.50%的精度提升,为实时监控系统提供兼顾精度与效率的解决方案。
• 提出基于图像掩码自编码器(ImageMAE)的火灾检测框架,通过自监督重建任务高效学习判别性特征
• 采用非对称编码器-解码器设计,编码器仅处理可见图像块,显著降低计算开销
• 利用视觉Transformer(ViT)编码器捕获长程依赖关系,有效区分真实火焰与类火物体
• 重建模块引入像素级重建损失与归一化像素目标,增强对光照变化和烟雾遮挡的鲁棒性
视觉传感器驱动的早期精准火灾检测技术主要分为传统机器学习(TML)和深度学习(DL)方法。TML方法依赖手工设计的火焰纹理、颜色和运动特征,但其性能易受环境变异影响。DL方法通过端到端学习自动提取特征,在泛化能力和准确性方面展现显著优势,尤其在可变和不确定条件下表现突出。
4.方法论(Proposed methodology)
本研究基于掩码自编码器(MAE)架构构建火灾检测框架,利用其对监控图像中判别性特征的提取能力。通过重建被遮蔽的图像区域,模型学会在存在可变光照、烟雾遮挡和类火图案干扰的场景中捕捉鲁棒特征。编码器采用ViT结构处理局部可见图像块,解码器则基于潜在特征重建被遮蔽区域,最终通过重建损失优化特征表示。
5.实验结果(Experimental results)
在三个公开火灾检测基准及自建数据集上的实验表明:所提模型在实现高精度的同时保持计算效率,消融实验验证了各模块贡献,跨场景评估显示优异泛化能力,可视化结果证实其对细微火焰特征的捕捉优势。
本研究提出的Transformer火灾检测框架通过掩码自编码机制增强对局部观测的视觉理解,结合ViT编码器和分层上下文建模,显著提升复杂场景下的细粒度火焰判别能力。模型在多个数据集上超越现有方法,为实时监控系统提供可扩展的解决方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号