PSFS-Net:一种基于动态频域-空间协同感知的网络,用于通过分层上下文细化和频域解耦来实现息肉分割
《Biomedical Signal Processing and Control》:PSFS-Net: Dynamic frequency-spatial synergistic perception network for polyp segmentation via hierarchical context refinement and frequency-domain decoupling
【字体:
大
中
小
】
时间:2025年10月10日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
精准结肠镜息肉分割方法通过动态频率-空间协同感知框架,结合傅里叶变换与自适应高斯滤波分离高低频特征,全局-局部交互模块实现语义与细节协同优化,双注意力机制有效整合多级特征,显著提升分割精度和鲁棒性,在五个公共数据集上验证其有效性。
在医学影像分析领域,尤其是结肠镜图像中息肉的分割任务,一直是早期发现结直肠癌(CRC)的关键环节。这项任务的准确性直接关系到临床诊断的效率和可靠性。尽管近年来研究者们在这一方向取得了显著进展,但现有方法仍然面临两个主要挑战:(1)在频率和空间特征表示方面存在不足,多数方法倾向于依赖空间域的学习,即使引入了频率信息,也往往忽视了频率分布在不同特征层级上的层次性变化,导致频率线索的利用不充分;(2)在跨层级特征整合方面表现欠佳,限制了模型对全局语义和细节边界信息的有效捕捉。为了解决这些问题,我们提出了一种名为PSFS-Net的新颖动态频率-空间协同分割框架,该框架通过联合利用空间域和频率域信息,实现了层次化上下文细化与跨层级特征融合。
PSFS-Net主要由三个核心模块组成:频率感知的跨尺度融合模块(FACFM)、双流全局-局部交互模块(DGIM)以及双注意力跨模态融合模块(DCM)。其中,FACFM的设计目标是提取频率域信息,并通过动态高斯滤波器从全频谱数据中自适应地分离高/低频率成分。这一模块结合了离散傅里叶变换(DFT)与可学习的动态高斯滤波器(DGF),使得频率特征的处理更加灵活,能够根据特征层级的不同动态调整其标准差,从而更有效地分离和融合高/低频率成分,缓解频率耦合问题,增强特征表示的区分性。
DGIM模块则旨在通过专门的全局和局部处理分支,实现高层次语义表示与低层次空间细节之间的相互细化。在解码过程中,该模块充分利用了跨层级特征之间的互补性。具体而言,全局分支通过大卷积核处理高层次特征,以抑制背景干扰,同时结合通过通道和空间注意力机制优化的低层次特征,实现跨层级的增强。与此同时,局部分支则通过多尺度差分操作从高层次特征中提取边界线索,并利用这些线索来优化低层次特征表示,从而提升结构细节的分割精度。
为了进一步促进全局-局部信息的有效融合,我们引入了双注意力跨模态融合模块(DCM)。该模块通过双注意力机制对DGIM模块的输出进行处理,动态调节不同层级之间的融合过程,从而减少语义差异,抑制冗余信息,并进一步提升分割精度。DCM的引入不仅增强了特征之间的协同作用,还为模型提供了更丰富的上下文信息,有助于更准确地识别息肉区域。
在实际应用中,息肉的形态和边界特征往往呈现出高度的复杂性和多样性。例如,某些息肉可能具有模糊的边界或不规则的形状,这使得传统的分割方法难以准确识别。PSFS-Net通过结合频率域和空间域信息,克服了这些挑战。频率域信息能够提供更丰富的上下文信息,有助于模型在不同光照条件下保持较高的分割性能,而空间域信息则能够保留息肉的边界细节,确保分割结果的精确性。
此外,PSFS-Net还针对跨层级特征融合的不足进行了优化。传统方法通常采用高层语义主导的融合策略,虽然能够有效建模全局语义,但会牺牲局部细节的清晰度。相反,一些方法则过度依赖低层特征,虽然能够提升边界锐度,但缺乏全局语义的整合,导致分割结果出现局部伪影。PSFS-Net通过引入双流交互机制,使得全局和局部信息能够相互补充,从而实现更精确的分割结果。
在数据集方面,我们对PSFS-Net进行了广泛的评估,涵盖了五个公开的息肉分割数据集:EndoScene、Kvasir-SEG、CVC-ClinicDB、CVC-ColonDB以及ETIS-LaribPolypDB。这些数据集提供了丰富的结肠镜图像,涵盖了不同息肉形态和成像条件。其中,EndoScene数据集包含了912张结肠镜图像,分辨率在384×288像素之间,来源于44个视频序列,涉及36名患者,构成了一个平衡多样息肉形态和成像条件的复合数据集。Kvasir-SEG数据集则包含1000张胃肠道息肉图像,分辨率范围在332×487到1920×1072像素之间,为模型提供了广泛的训练和测试样本。
在实际临床应用中,息肉分割的准确性和可靠性对医生的诊断至关重要。由于息肉在早期阶段通常具有较小的尺寸、形态多样性以及较低的与背景的对比度,因此,传统的分割方法往往依赖于操作者的经验,导致息肉漏诊率较高。PSFS-Net通过引入频率域和空间域的协同处理机制,提高了模型在复杂形态和成像条件下的鲁棒性,使得分割结果更加稳定和准确。
此外,PSFS-Net还针对模型泛化能力不足的问题进行了优化。许多现有方法在特定数据集上训练后,当应用于不同医院或不同内窥镜设备获取的图像时,往往会出现显著的性能下降。这种现象主要是由于成像协议和光照条件的差异导致的。PSFS-Net通过自适应频率感知机制,能够根据特征层级的不同动态调整频率过滤参数,从而提高模型在不同数据集上的泛化能力,使其在临床应用中更加适用。
在技术实现上,PSFS-Net采用了金字塔视觉变换器(PVT)作为编码器,以捕捉长距离的语义依赖关系和多尺度的全局上下文信息。同时,为了增强频率域的表示能力,我们设计了频率感知的跨尺度融合模块(FACFM),该模块结合了离散傅里叶变换(DFT)与可学习的动态高斯滤波器(DGF),实现了对频率成分的自适应分离和融合。这一机制不仅缓解了频率耦合问题,还增强了特征表示的区分性,提高了模型对息肉形态变化的适应能力。
在解码过程中,PSFS-Net采用了双流全局-局部交互模块(DGIM),通过专门的全局和局部处理分支,实现了高层次语义信息与低层次空间细节的相互优化。全局分支通过大卷积核处理高层次特征,以抑制背景干扰,同时结合通过通道和空间注意力机制优化的低层次特征,实现跨层级的增强。局部分支则通过多尺度差分操作从高层次特征中提取边界线索,并利用这些线索来优化低层次特征表示,从而提升结构细节的分割精度。
为了进一步促进全局-局部信息的有效融合,我们引入了双注意力跨模态融合模块(DCM),该模块通过双注意力机制对DGIM模块的输出进行处理,动态调节不同层级之间的融合过程,从而减少语义差异,抑制冗余信息,并进一步提升分割精度。DCM的引入不仅增强了特征之间的协同作用,还为模型提供了更丰富的上下文信息,有助于更准确地识别息肉区域。
总的来说,PSFS-Net通过引入频率域和空间域的协同处理机制,有效解决了现有方法在特征表示和跨层级融合方面的不足。该框架不仅提高了模型在复杂形态和成像条件下的鲁棒性,还增强了其在不同数据集上的泛化能力,使得分割结果更加稳定和准确。此外,PSFS-Net的结构设计使得全局和局部信息能够相互补充,从而实现了更精确的息肉分割。这些改进使得PSFS-Net在实际临床应用中具有更高的实用价值,为结直肠癌的早期筛查提供了更加可靠的辅助工具。
在临床实践中,结直肠癌的早期筛查和诊断对于提高患者的生存率至关重要。息肉的识别和分割是这一过程中的关键步骤,因为大多数结直肠癌病例源于良性腺瘤性息肉的恶性转化。通过精准的息肉分割,医生可以更早地发现潜在的癌变病变,并进行相应的治疗。然而,传统的分割方法往往受到操作者经验的影响,导致分割结果的不一致性和准确性不足。PSFS-Net通过引入频率域和空间域的协同处理机制,减少了对操作者经验的依赖,使得分割结果更加客观和稳定。
此外,PSFS-Net的结构设计使得模型能够适应不同的成像条件和数据集。这在实际临床应用中尤为重要,因为不同医院或不同内窥镜设备获取的图像可能存在显著的差异。通过自适应频率感知机制,PSFS-Net能够根据特征层级的不同动态调整频率过滤参数,从而提高模型在不同数据集上的泛化能力,使其在临床应用中更加适用。这种适应性不仅提高了模型的鲁棒性,还增强了其在不同成像条件下的分割性能。
在技术实现上,PSFS-Net采用了金字塔视觉变换器(PVT)作为编码器,以捕捉长距离的语义依赖关系和多尺度的全局上下文信息。这一选择使得模型能够更全面地理解息肉的形态特征,从而提高分割的准确性。同时,为了增强频率域的表示能力,我们设计了频率感知的跨尺度融合模块(FACFM),该模块结合了离散傅里叶变换(DFT)与可学习的动态高斯滤波器(DGF),实现了对频率成分的自适应分离和融合。这一机制不仅缓解了频率耦合问题,还增强了特征表示的区分性,提高了模型对息肉形态变化的适应能力。
在解码过程中,PSFS-Net采用了双流全局-局部交互模块(DGIM),通过专门的全局和局部处理分支,实现了高层次语义信息与低层次空间细节的相互优化。全局分支通过大卷积核处理高层次特征,以抑制背景干扰,同时结合通过通道和空间注意力机制优化的低层次特征,实现跨层级的增强。局部分支则通过多尺度差分操作从高层次特征中提取边界线索,并利用这些线索来优化低层次特征表示,从而提升结构细节的分割精度。
为了进一步促进全局-局部信息的有效融合,我们引入了双注意力跨模态融合模块(DCM),该模块通过双注意力机制对DGIM模块的输出进行处理,动态调节不同层级之间的融合过程,从而减少语义差异,抑制冗余信息,并进一步提升分割精度。DCM的引入不仅增强了特征之间的协同作用,还为模型提供了更丰富的上下文信息,有助于更准确地识别息肉区域。
PSFS-Net的结构设计不仅提高了模型的分割性能,还增强了其在不同应用场景下的适应性。通过结合频率域和空间域信息,PSFS-Net能够更全面地捕捉息肉的形态特征,从而提高分割的准确性。此外,该框架还能够适应不同的成像条件和数据集,使得模型在临床应用中更加实用。
在实际应用中,PSFS-Net的结构设计使得模型能够有效处理复杂的息肉形态和成像条件。例如,在低对比度的息肉区域,PSFS-Net能够通过频率域信息的引入,提高对背景干扰的抑制能力,从而确保分割结果的准确性。在模糊或粘连的息肉边界区域,PSFS-Net能够通过空间域信息的优化,提升边界细节的识别能力,从而确保分割结果的精确性。
PSFS-Net的结构设计还使得模型能够有效平衡全局和局部特征的融合,同时保持较高的计算效率和泛化能力。这在实际临床应用中尤为重要,因为计算效率直接影响到模型的实时性和实用性。通过引入频率感知的跨尺度融合模块(FACFM)和双注意力跨模态融合模块(DCM),PSFS-Net能够在保证计算效率的同时,实现更精确的分割结果。
在临床实践中,PSFS-Net的应用将有助于提高息肉识别的准确性和可靠性。通过精准的息肉分割,医生可以更早地发现潜在的癌变病变,并进行相应的治疗。此外,PSFS-Net的结构设计还能够适应不同的成像条件和数据集,使得模型在临床应用中更加实用。
综上所述,PSFS-Net通过引入频率域和空间域的协同处理机制,有效解决了现有方法在特征表示和跨层级融合方面的不足。该框架不仅提高了模型的分割性能,还增强了其在不同应用场景下的适应性。通过结合频率域和空间域信息,PSFS-Net能够更全面地捕捉息肉的形态特征,从而提高分割的准确性。此外,该框架还能够适应不同的成像条件和数据集,使得模型在临床应用中更加实用。这些改进使得PSFS-Net在实际临床应用中具有更高的实用价值,为结直肠癌的早期筛查提供了更加可靠的辅助工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号