通过指导性特征学习提升医学图像分割的性能

《Medical Image Analysis》:Improving the performance of medical image segmentation with instructive feature learning

【字体: 时间:2025年09月29日 来源:Medical Image Analysis 11.8

编辑推荐:

  医学图像分割中,针对复杂样本存在特征提取不足的问题。本文提出EE-Net框架,包含特征增强模块(IFEM)和特征融合模块(IFIM),结合轻量化不对称架构(EESF),通过灵活分辨率缩放与注意力机制优化,有效提升分割精度与计算效率。实验表明EE-Net在六个医学任务中均优于现有方法,兼具低资源消耗和高泛化能力。

  近年来,医学图像分割作为计算机视觉的重要分支,已被广泛应用于临床实践中。例如,皮肤病变的分割在皮肤镜检查中、乳腺癌在超声成像中的分割、细胞核在显微镜下的分割、肺部在胸部X光片中的分割、脑肿瘤在磁共振成像(MRI)中的分割以及腹部多器官在CT扫描中的分割。这些分割结果为理解复杂的解剖结构提供了宝贵的信息,有助于临床医生在创伤评估、疾病进展监测和治疗计划制定等方面做出更精准的决策。随着对智能医学图像分析需求的不断增长,开发准确且自动化的分割方法显得尤为重要。

面对这一需求,研究者们已经提出了许多基于深度学习的分割网络。其中,编码器-解码器架构因其在图像特征提取和重建方面的出色表现,成为当前最常用的设计。编码器部分通常负责从输入图像中提取高阶语义特征,而解码器则通过逐步恢复这些特征,生成与原始输入空间维度相匹配的分割掩膜。作为最早的编码器-解码器网络之一,全卷积网络(FCN)通过将传统卷积神经网络(CNN)中的全连接层替换为反卷积层,实现了像素级的分类,并输出相应的分割结果。在此基础上,Ronneberger等人提出了U-Net,这是一种对称的编码器-解码器框架,其引入的跳跃连接机制极大地提升了医学图像分割的性能,并在多个任务中获得了广泛应用。

受到这些成功案例的启发,研究者们进一步提出了多种增强策略,以提升分割性能。这些策略主要分为三类:(1)引入先进的特征提取器以增强图像表征学习能力;(2)优化跳跃连接机制以提高编码器和解码器之间特征融合的效率;(3)开发新的网络架构以优化信息流动路径。虽然这些方法在医学图像分割的自动化方面取得了显著进展,但它们在处理复杂样本时仍面临挑战,尤其是那些具有不规则形状、显著尺度变化或模糊边界的情况。

为了解决这些问题,我们提出了两个创新的模块:指导性特征增强模块(IFEM)和指导性特征融合模块(IFIM)。IFEM通过灵活的分辨率缩放和广泛的信息交互,在统一的卷积模块中协同捕捉丰富的细节信息和局部上下文特征,从而增强网络的特征提取能力。IFEM由两个异质但相互依赖的分支组成:一个扩展分支负责扩展空间维度,以捕捉纹理和边界等细节特征;另一个压缩分支则负责压缩空间维度,以提炼关键的局部上下文信息,如形状和布局。上下文信息有助于理解整体结构和布局,从而引导细节特征的提取;而细节信息则通过深入分析细粒度特征,帮助验证和校准上下文信息。这种协同效应使IFEM能够捕捉更加全面和有深度的特征表示。

IFIM则专注于通过敏感的中间预测和全局注意力机制,明确引导编码器和解码器特征的融合,从而优化上下文特征的传输。IFIM的输入包括当前编码器的特征和前一层解码器的特征,其执行三个关键步骤:(1)基于解码器的中间预测,生成与模糊像素丰富的不确定区域相关的前景、背景和边界注意力图;(2)将这些注意力图与编码器和解码器特征相乘,生成六种不同且互补的注意力特征;(3)将这些六种专门化的注意力特征进行合并和优化,生成更精准和更具区分性的当前解码器表示。值得注意的是,IFEM和IFIM均被设计为轻量级插件,能够无缝集成到现有的分割框架中,同时在合理可控的模型复杂度增加下显著提升性能。

为了进一步实现高性能与低计算成本的平衡,我们还开发了一种高效的分割框架,称为EESF。与传统的U-Net相比,EESF采用了一种更浅且更宽的非对称结构。这种设计不仅减少了因频繁下采样导致的细节信息丢失,还充分挖掘了图像中嵌入的高阶语义信息,使得EESF在使用更少的学习参数的情况下,仍能实现与传统模型相当的分割性能。此外,EESF避免了在每次下采样操作后需要将特征通道数量翻倍的常见做法,从而有效降低了网络的复杂度,同时保持了分割的准确性。

最终,我们将IFEM和IFIM集成到EESF框架中,构建了一个新型的医学图像分割网络,命名为EE-Net。在六个不同的分割任务上的广泛实验表明,EE-Net在分割精度和泛化能力方面均优于其他最先进的方法。此外,EE-Net还具有计算复杂度低、数据依赖性小以及收敛速度快等优势,使其成为医学图像分割领域的一个有前景的解决方案,特别是在资源有限的环境中。

总的来说,本研究的主要贡献包括以下几个方面:首先,我们提出了指导性特征增强模块(IFEM),该模块通过灵活的分辨率缩放和广泛的信息交互,在统一的卷积模块中协同捕捉丰富的细节信息和局部上下文特征,从而显著提升网络的特征提取能力。其次,我们提出了指导性特征融合模块(IFIM),这是一种专门设计的特征融合引擎,能够通过敏感的中间预测和全局注意力机制,明确引导编码器和解码器特征的融合,从而优化上下文特征的传输。第三,我们开发了EESF,这是一种高效且低计算成本的分割框架,其采用的更浅且更宽的非对称结构有效降低了网络复杂度,同时保持了良好的分割性能。最后,我们将IFEM和IFIM无缝集成到EESF框架中,构建了EE-Net这一新型分割网络,并在多个任务中验证了其优越的性能。

本研究的结构安排如下:第二部分将简要回顾相关工作;第三部分将详细描述所提出的EE-Net网络;第四部分将对EE-Net与其他竞争方法进行全面比较;第五部分将讨论研究中的关键发现;第六部分将总结全文。通过这种方式,我们希望为医学图像分割领域提供一个系统且具有创新性的解决方案,同时推动该领域的进一步发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号