基于双流协作与多模态注意力的精准息肉分割网络BiCoMA:实现结肠镜图像中结直肠癌早期诊断的新突破

【字体: 时间:2025年10月02日 来源:Scientific Reports 3.9

编辑推荐:

  为解决结肠镜图像中息肉呈现多样性导致的准确分割难题,研究人员开展双流卷积多注意力网络(BiCoMA)研究,结合ConvNeXt V2 Large和Pyramid Vision Transformer优势,通过空间细化(SR)、通道细化(CR)和非局部注意力(NLA)等机制,在五个基准数据集上实现最先进性能,显著提升Dice和IoU指标,为结直肠癌早期检测提供高效可靠的自动化解决方案。

  
结直肠癌作为全球第三大常见癌症和第二大癌症相关死亡原因,其早期检测主要依赖于结肠镜检查中息肉的有效识别与分割。然而,息肉在大小、形态和纹理上表现出显著多样性,加之结肠镜图像中复杂背景、光照变化和黏膜褶皱的干扰,使准确分割面临巨大挑战。现有深度学习方法往往难以同时兼顾局部边界细节和全局上下文信息,且计算效率难以满足临床实时应用需求,导致息肉漏检率高达6%-27%。这些局限性凸显了开发高性能自动化分割工具的紧迫性。
在这项发表于《Scientific Reports》的研究中,Rahim Khan、Nada Alzaben、Yousef Ibrahim Daradkeh、MiYoung Lee和Inam Ullah团队提出了一种新颖的双流架构——双边卷积多注意力网络(Bilateral Convolutional Multi-Attention Network, BiCoMA),通过整合卷积神经网络(CNN)和视觉Transformer(Vision Transformer)的互补优势,实现了息肉分割精度与效率的突破性提升。
研究人员采用多项关键技术方法:使用ConvNeXt V2 Large和Pyramid Vision Transformer(PVT)构建双流骨干网络分别提取空间特征和全局依赖;设计空间细化(SR)模块处理高分辨率卷积特征,通道细化(CR)和非局部注意力(NLA)模块优化Transformer特征;采用金字塔注意力块(PAB)进行多尺度特征处理和卷积块注意力模块(CBAM)增强特征判别;使用包含加权Dice和二元交叉熵损失的多尺度监督策略进行优化。实验基于Kvasir-SEG、ClinicDB、ColonDB、ETIS和Endoscene五个公共数据集进行验证。
Hybrid dual-stream backbone
研究通过并行处理流同时捕获局部空间细节和全局语义关系。卷积流利用ConvNeXt V2 Large生成高分辨率特征C1和C2,专注于边界敏感的空间信息提取;Transformer流采用PVT生成特征P3和P4,建立长程依赖关系。这种设计有效解决了单一架构无法兼顾局部精度和全局理解的矛盾。
Spatial refinement module
通过双分支非对称卷积处理卷积特征,生成空间注意力图并残差连接原始特征,显著增强了边界检测能力。实验表明该模块对微小息肉和模糊边界的识别效果尤为突出。
Channel refinement module
采用压缩激励机制对Transformer特征进行通道重校准,通过自适应平均池化和全连接层生成通道注意力权重,有效提升了息肉相关通道的判别能力并减少背景干扰。
Non-local attention module
通过自注意力机制计算空间位置间的相关性,结合相对位置编码捕获全局上下文关系。该模块在处理被黏膜褶皱部分遮挡的息肉时表现出显著优势。
Pyramidal attention block(PAB)
作为核心集成模块,PAB包含双密集空洞空间金字塔池化(DASPP)块和多头自注意力(MHSA)块,实现了多尺度特征处理和长程依赖建模的有机结合。
Convolutional block attention module(CBAM)
在解码器每个融合阶段依次应用通道注意力和空间注意力,通过顺序优化显著提升了特征相关性和抑制了背景噪声。
Progressive feature fusion and hierarchical decoding
通过系统上采样和横向连接逐步整合双流特征,保持分辨率和语义内容的一致性。最终通过1×1卷积和Sigmoid激活生成二值分割掩码。
研究结论表明,BiCoMA在五个基准数据集上均实现了最先进的性能表现,特别是在最具挑战性的ETIS数据集上获得了0.810的mDice值,较现有最佳方法提升2.1%。该方法在保持计算效率的同时,显著提高了对大小不一、形态多样、边界模糊息肉的分割精度,解决了临床部署中的实际需求。讨论部分强调,双流架构与多注意力机制的协同设计为医学图像分割提供了新范式,其强大的泛化能力使其能够适应不同设备、成像协议和患者群体的变异,为结直肠癌的早期诊断和预防提供了可靠的技术支撑。未来工作将聚焦于实时视频分析、不确定性量化和更广泛内镜成像应用的适配。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号