MAF-Net:融合多感受野注意力与双路径SE增强模块的子宫肌瘤超声精准分割网络

【字体: 时间:2025年09月18日 来源:Frontiers in Physiology 3.4

编辑推荐:

  本文提出了一种创新的多感受野注意力融合网络(MAF-Net),通过引入多感受野注意力融合模块(MAFM)、双尺度注意力增强模块(DAEM)和双路径压缩激励增强模块(DSEEM),显著提升了子宫肌瘤超声图像的分割精度。该网络在编码器深层嵌入MAFM以增强上下文表征,在解码器采用DAEM融合多分辨率特征,并通过DSEEM优化跳跃连接中的特征传递。实验表明,MAF-Net在子宫肌瘤数据集上Dice系数达0.9126,在ISIC-2018皮肤病变数据集上也展现强大泛化能力(Dice=0.8624),为超声辅助诊断提供了可靠解决方案。

  

1 引言

子宫肌瘤是女性生殖系统最常见的良性肿瘤,在育龄妇女中发病率高达70%–80%。超声成像因其无创性和可及性成为临床检测与监测的主要手段,但存在斑点噪声、低对比度和伪影等固有局限,给精准分割带来挑战。近年来,高强度聚焦超声(HIFU)等非侵入性疗法的发展,使得术前精准评估肌瘤特征(大小、数量和位置)变得尤为关键。当前分割主要依赖经验丰富的医师手动完成,存在主观性强、耗时费力等问题。深度学习技术的发展为自动分割提供了新途径,注意力机制、多尺度特征提取器和混合编码器-解码器框架等架构在捕捉复杂解剖结构和细微边界方面展现出显著潜力。

2 方法

2.1 MAF-Net整体架构

MAF-Net基于经典U-Net架构,包含编码器、解码器和改进的跳跃连接。编码器前两层采用双层3×3卷积提取边缘轮廓等基础特征,在第三和第四层引入多感受野注意力融合模块(MAFM),通过不同尺度感受野组合与注意力加权融合增强对复杂结构和模糊边界的感知能力。解码器设计双尺度注意力增强模块(DAEM),并行建模高分辨率和低分辨率图像特征,保留细节特征的同时融入宏观语义上下文。传统跳跃连接存在信息利用率低和语义一致性差的问题,因此引入双路径压缩激励增强模块(DSEEM),通过双路径注意力机制自适应调整通道和空间维度的特征响应,增强深浅层特征耦合。最终输出经1×1卷积层和Sigmoid激活函数生成二值分割图。

2.2 多感受野注意力融合模块(MAFM)

为克服传统卷积方法感受野有限和难以捕获全局上下文信息的问题,MAFM首先对输入特征进行1×1卷积降维和通道统一,随后通过三个并行分支进行扩张率分别为1、3、5的3×3卷积操作。第一和第三分支引入空间注意力机制,第二分支引入通道注意力机制以探索通道间依赖性并生成通道重要性权重图。模块采用跨分支连接策略,第二分支开始前与第一分支输出融合,第三分支融合前两个分支输出,增强特征间相关性并改善梯度消失等问题。所有分支输出与主路径原始输入特征通过统一融合操作聚合,最后应用额外空间注意力模块进一步细化特征图。相比卷积块注意力模块(CBAM),MAFM以互补方式同时利用空间和通道注意力,通过多尺度扩张卷积有效扩大感受野,捕获不同分辨率的丰富语义信息。

2.3 双尺度注意力增强模块(DAEM)

为增强解码阶段特征恢复能力和语义表达效果,DAEM以两种不同尺度的特征图为输入:原始分辨率特征图及其上采样版本。两者分别输入并行3×3卷积操作,后引入通道注意力机制探索特征图不同通道间的依赖关系,处理前后的特征图进行融合以保留原始结构信息并融入注意力增强的语义特征。两个尺度的特征进一步融合,实现高分辨率图像局部细节信息与低分辨率图像全局上下文信息的协同建模。融合后的特征图经过两个卷积-注意力阶段组合,第一阶段采用通道注意力机制,第二阶段引入空间注意力机制,最终输出集成多尺度、通道维和空间维语义信息的高质量特征图用于指导分割预测。DAEM源于CBAM概念,但通过并行处理多分辨率输入实现显著进步,同时捕获细粒度局部纹理细节和更广泛的全局上下文线索。

2.4 双路径压缩激励增强模块(DSEEM)

为克服传统U-Net跳跃连接在语义一致性和特征传输方面的局限性,DSEEM以编码器下采样特征(Input1)和解码器上采样特征(Input2)为输入。编码器输出特征图下采样统一尺度,解码器输出特征图上采样匹配编码器尺寸,两者在通道维度融合形成模块基础特征表示。融合特征输入两个级联压缩激励(SE)模块引入通道注意力机制,通过全局平均池化压缩空间维度建立通道间依赖关系,并使用全连接层和激活函数生成精确通道权重。第一次SE模块处理后权重图与基础特征逐通道相乘完成首次注意力增强,增强后的注意力特征输入第二个SE模块进行深度细化完成第二阶段通道注意力建模。为避免注意力操作中信息衰减和梯度传输障碍,每次注意力处理后引入残差连接。最终融合特征图通过3×3卷积层进一步提取局部特征,并与第一次SE特征、第二次SE特征和卷积提取特征深度集成。相比传统仅捕获通道依赖的SE模块和关注空间相关性的注意力门机制,DSEEM在双路径不同分辨率上集成两类注意力,并通过密集连接实现更深语义特征重用,确保鲁棒且判别性强的特征表示。

2.5 损失函数

为评估预测分割结果与真实标签的一致性,采用Dice作为损失函数,其数学公式为:

Ldice(y,p) = 1 - (2∑i=1Npiyi) / (∑i=1Nyi + ∑i=1Npi)

其中N为像素数,pi和yi分别为真实标签和预测结果。

3 实验与结果

3.1 数据集

为全面评估MAF-Net的分割性能和泛化能力,在两个数据集上进行实验:衢州市中医医院收集的子宫肌瘤临床超声数据集和公开ISIC-2018皮肤病变分割数据集。所有输入图像统一调整为256×256像素,实验在相同设置下进行。子宫肌瘤数据集包含1,484张高分辨率超声图像,由经验医学专业人员精细标注,891张用于训练,297张用于验证,296张用于独立测试。ISIC-2018数据集包含3,694张皮肤镜图像,2,594张用于训练,100张用于验证,1,000张用于测试。

3.2 实现细节

MAF-Net训练使用TensorFlow框架在GeForce RTX 4090 GPU(24 GB内存)上实现,采用Adam优化器,初始学习率0.001,训练200轮,批量大小16。训练和验证过程中的损失和准确度曲线显示,子宫肌瘤数据集上损失曲线初始快速下降后稳定在低值,训练与验证损失紧密对齐表明模型保持良好泛化无过拟合证据,准确度曲线早期急剧上升最终稳定在0.95以上。ISIC-2018数据集呈现类似趋势,损失值因数据集复杂性不同但整体轨迹显示稳定改进,平滑收敛和稳定验证行为,准确度曲线持续上升保持0.9以上高水平,再次确认模型跨不同分割领域的鲁棒性和适应性。

3.3 评价指标

采用五个广泛指标全面评估分割性能:Dice、Mcc、Jaccard、准确度(Accuracy)和召回率(Recall)。Dice公式为:Dice = 2TP / (2TP + FN + FP);Mcc公式为:Mcc = (TP×TN - FP×FN) / √((TP+FN)(TP+FP)(TN+FN)(TN+FP));Jaccard公式为:Jaccard = TP / (TP + FN + FP);准确度公式为:Accuracy = (TP + TN) / (TP + TN + FN + FP);召回率公式为:Recall = TP / (TP + FN)。

3.4 消融实验

在子宫肌瘤数据集上进行消融实验验证各模块有效性。基线模型(排除所有增强模块)Dice为0.8993,Mcc为0.8957,Jaccard为0.8178,准确度0.9912,召回率0.8712。加入MAFM后所有指标显著改善,Dice增至0.9076,Mcc增至0.9038,Jaccard达0.8311,准确度0.9919,召回率0.9014。加入DAEM带来适度性能提升,Dice达0.9044,Mcc达0.9003,Jaccard达0.8259,准确度0.9916,召回率0.8956。加入DSEEM也带来明显性能提升,Dice为0.9071,Mcc为0.9031,Jaccard为0.8301,准确度0.9918,召回率0.8956。当所有三个模块(MAFM + DAEM + DSEEM)组合时,模型所有指标达到最高性能:Dice为0.9126,Mcc为0.9089,Jaccard为0.8394,准确度0.9924,召回率0.9016。参数和运行时间方面,基线模型参数2.06M,每步推理时间45ms;加入MAFM后参数增至2.41M,时间增至49ms;加入DAEM参数增至2.62M,时间增至103ms;加入DSEEM参数增至3.01M,时间增至52ms;完整模型参数3.56M,每步时间54ms,相对基线仅增加9ms,显示整体架构在实现更强特征学习的同时保持高计算效率。

3.5 对比实验

3.5.1 子宫肌瘤数据集实验

与SE-U-Net、CLNet、RMAU-Net、SegNet、SSA-UNet和AttUNet等方法比较,MAF-Net在所有评价标准上取得最高分割精度:Dice为91.26%,Mcc为90.89%,Jaccard为83.94%,准确度0.9924,召回率0.9016。定性比较结果显示,SE-U-Net和CLNet性能最不理想,预测常不完整、碎片化且欠分割;SSA-UNet和SegNet显示适度改进但分割仍受噪声、不连续和对齐轮廓影响;RMAU-Net和AttUNet产生更连贯结果,具有更好整体形状符合性和部分边界准确性;MAF-Net始终实现最准确和完整分割,在所有测试样本中清晰、平滑勾勒肌瘤区域轮廓,紧密匹配真实标签。

3.5.2 ISIC-2018数据集实验

MAF-Net在所有指标上取得最高性能:Dice为86.24%,Mcc为81.56%,Jaccard为76.52%,准确度0.9251,召回率0.8304。SegNet性能最低,Dice为81.73%,Mcc为75.02%,Jaccard为69.50%,准确度91.07%,召回率82.97;SE-U-Net、CLNet和RMAU-Net提供略好结果,Dice值接近83.5%,Jaccard分数介于72.17%–72.27%;SSA-UNet达到稍改进结果,Dice为84.00%,Mcc为78.08%,Jaccard为73.03%,准确度91.51%,召回率82.93%;AttUNetDice仅82.88%,未达到竞争性Jaccard、Mcc、准确度和召回率。定性比较视觉检查显示,SegNet频繁产生粗糙或过度平滑掩模;SE-U-Net、CLNet和RMAU-Net预测更精细但在 several cases仍表现噪声和部分欠分割;SSA-UNet和AttUNet可生成更清晰分割图,但在边界清晰度和对小或不规则结构敏感性方面存在短板;MAF-Net始终产生精确完整掩模,紧密匹配标注区域。

3.5.3 MAFM中扩张率实验

测试不同扩张率组合影响,(1,3,5)实现最高整体性能:Dice为0.9126,Mcc为0.9089,Jaccard为0.8394,准确度0.9924。扩张率1使模型捕获细粒度空间细节,扩张率3和5有效扩大感受野聚合多尺度上下文信息而不导致网格伪影或特征图中过度稀疏。较大扩张组合(如(1,3,8)或(1,4,8))性能分数较低,避免过度扩张卷积可能丢失关键结构边界。

3.5.4 DSEEM中路径选择实验

双路径变体实现最佳整体性能:Dice为0.9126,Mcc为0.9089,Jaccard为0.8394,准确度0.9924,召回率0.9016。单路径(Input1)配置所有指标性能显著降低,Dice降至0.7474,Jaccard降至0.5979,表明该路径 alone缺乏足够上下文或语义信息准确定位病灶区域。单路径(Input2)设置性能中等更好,Dice为0.8888,Jaccard为0.8005,但仍未匹配双路径设计性能,表明Input2虽比Input1携带更多信息或更高级特征,仍显著受益于另一路径补充支持。

3.5.5 优化器选择实验

Adam表现最佳:Dice为91.26%,Mcc为90.89%,Jaccard为83.94%,准确度99.24%,召回率90.16%。RMSprop性能优异,Dice为90.74%,Mcc为90.35%,Jaccard为83.09%,准确度99.19%,召回率89.44%。Adamax基于无穷范数的Adam变体,Dice为89.39%,Mcc为88.98%,Jaccard为80.92%,准确度99.08%,召回率88.00%。Adagrad性能显著较差,Dice为79.34%,Mcc为79.68%,Jaccard为66.42%,准确度98.37%,召回率67.90%。SGD结果最差,Dice为31.05%,Mcc为29.10%,Jaccard仅18.48%。

3.5.6 计算效率实验

SE-U-Net参数最少(1.87M),推理速度最快(42ms/步);CLNet参数最多(7.73M),推理时间相对高效(50ms/步);AttUNet模型尺寸更大(8.49M),推理时间较慢(61ms/步);RMAU-Net和SSA-UNet参数尺寸适中(2.27M和2.33M),RMAU-Net推理时间达62ms/步,SSA-UNet保持更平衡运行时48ms/步;MAF-Net参数3.56M,推理时间54ms/步,显著低于AttUNet和RMAU-Net,展示竞争性计算效率。

3.6 局限性

失败案例显示,某些情况下预测掩模明显大于真实标注,指示过分割,可能归因于超声图像中模糊病灶边界或低对比度区域,使模型误包周围正常组织。欠分割 evident在列1和4,模型仅识别病灶一小部分或几乎完全未能检测,通常发生在病灶小、与背景 indistinct或对比度差时,使网络难以捕获完整上下文信息。误分割 observed在列5、6和7等情况,预测区域与实际病灶位置显著错位,这些失败可能由具有相似纹理或强度结构存在引起,误导模型分割解剖无关区域。这些案例突出低对比度病灶、边界模糊性和解剖变异性在超声图像中带来的挑战。

4 结论

MAF-Net深度学习框架专为超声成像中子宫肌瘤精准分割设计,通过统一编码器-解码器架构结合MAFM、DSEEM和DAEM模块,有效处理临床超声数据固有噪声、边界模糊和尺度变化。在真实子宫肌瘤数据集上广泛验证表明,MAF-Net在关键性能指标上始终优于现有模型,ISIC-2018数据集评估进一步确认其强大泛化能力。消融研究强调各架构模块协同作用,共同增强准确性和鲁棒性。总体而言,MAF-Net为超声诊断工作流程提供可靠、准确和临床适用的自动分割解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号