MedVKAN:利用Mamba和KAN算法实现高效的特征提取,用于医学图像分割

《Biomedical Signal Processing and Control》:MedVKAN: Efficient feature extraction with Mamba and KAN for medical image segmentation

【字体: 时间:2025年10月10日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  医学图像分割中传统CNN和Transformer存在局限性,本研究提出MedVKAN模型,通过VSS-Enhanced KAN模块结合U-Net架构,有效提升特征提取能力,实验表明其在五个数据集上表现优异,四项最优,一项第二。

  医学图像分割在现代临床实践中扮演着至关重要的角色,广泛应用于辅助诊断、治疗计划制定以及治疗效果评估等领域。这项技术的核心在于准确识别和量化病灶区域,为外科手术规划和治疗监测提供关键依据。然而,传统的图像分割方法高度依赖于人工标注和专家解读,这不仅耗时费力,还容易受到不同观察者之间主观差异的影响,从而影响诊断的一致性。为了解决这些问题,基于深度学习的自动化分割方法逐渐兴起,它们在效率、准确性和可重复性方面表现出显著优势。

近年来,卷积神经网络(CNNs)和基于Transformer的模型在医学图像分割领域取得了重要进展。CNNs因其权重共享和池化机制,能够高效地提取局部特征,这使其在处理医学图像时具有良好的适应性。然而,由于卷积核本身的局限性,CNNs在捕捉全局上下文信息方面存在不足。尽管可以通过扩张卷积或增加网络深度来扩大感受野,但实际应用中,有效感受野往往远小于理论值。相比之下,基于Transformer的模型,如Swin Transformer、UNETR和SwinUNETR,利用多头自注意力(MHSA)机制有效地建模全局依赖关系。然而,显式计算所有token之间的注意力关系导致了二次计算复杂度,这使得在高分辨率医学图像上进行处理时,对内存和计算资源的需求大幅增加。

为了解决上述问题,研究者们开始探索其他架构。其中,状态空间模型(SSMs)因其在处理长距离依赖关系和保持线性计算复杂度方面的潜力,受到了广泛关注。Mamba作为一种新型的SSM,其硬件感知设计和选择性扫描机制使其在全局特征提取方面表现出色,同时计算复杂度保持在接近线性水平,这为替代Transformer架构提供了新的可能性。随后,视觉状态空间(VSS)模型在Mamba的基础上引入了二维选择性扫描(SS2D)模块,通过沿四个方向扫描图像,增强了对上下文信息的捕捉能力。此外,一些研究将Mamba与图像预训练相结合,如Swin-UMamba,以融合通用的视觉表示和高效的全局建模能力。另一些研究则提出了三维空间Mamba模块,如SegMamba,以优化3D序列建模。

与此同时,Kolmogorov-Arnold网络(KANs)因其在非线性表达方面的卓越能力,也在计算机视觉领域引起了研究者的兴趣。KANs基于Kolmogorov-Arnold表示定理,通过参数化B样条函数来提升模型的表达能力。在数据拟合和求解偏微分方程等任务中,KANs显著优于多层感知机(MLPs),同时所需参数数量也远少于传统模型。在医学图像分割任务中,KANs的潜力同样得到了验证。例如,UKAN将Tok-KAN作为特征提取器引入U-Net框架,初步展示了KAN在医学图像分割中的有效性。KAT则引入了GR-KAN,将B样条函数替换为有理函数,并将KAN与Transformer结合,有效缓解了KAN的计算效率问题。Conv-KAN提出了基于KAN的卷积层,通过可学习的B样条插值函数参数化卷积核,实现了参数复杂度的降低同时保持高精度。TransUKAN则引入了EfficientKAN,将KAN与Transformer结合,进一步优化了Transformer架构的性能。

基于Mamba和KAN在特征提取方面的显著优势,已有研究尝试将MHSA块替换为Mamba块,或将MLP块替换为KAN块,以提升模型的表现。然而,将Mamba与KAN进行有效结合,以增强特征提取和整体模型性能的研究仍较为有限。为填补这一研究空白,本文提出了一种新的模块——VSS-Enhanced KAN(VKAN),该模块融合了VSS模型与扩展场卷积KAN(EFC-KAN),并将其作为Transformer模块的替代方案。随后,我们将VKAN模块嵌入到一个受U-Net启发的框架中,构建了MedVKAN模型,这是一种高效的医学图像分割模型。

MedVKAN采用了一个多阶段的编码器-解码器结构,并通过跳接连接整合不同层次的特征信息。在编码器的前三个阶段,我们使用了传统的卷积层来有效捕捉局部特征,而在最后两个阶段,我们引入了VKAN模块,以提取全局特征。这种设计在分割精度和计算效率之间实现了良好的平衡。具体而言,卷积层负责处理图像的局部细节,而VKAN模块则通过其高效的全局建模能力,捕捉更广泛的上下文信息。这种结合不仅提升了模型的特征表达能力,还显著降低了计算成本,使得模型在处理高分辨率医学图像时更加高效。

为了验证MedVKAN的有效性,我们在五个公开的医学图像分割数据集上进行了广泛的实验。这些数据集涵盖了多种分割任务,包括细胞实例分割、多器官腹部分割、乳腺癌病灶分割、多类心脏分割以及新冠感染分割。数据集包含了不同的成像模态,如显微镜成像、磁共振成像(MRI)、超声成像和计算机断层扫描(CT)。实验结果表明,MedVKAN在四个数据集上取得了当前最先进的性能,而在另一个数据集上排名第二,这充分证明了其在不同模态和任务中的广泛适用性和有效性。此外,MedVKAN在计算效率方面也表现出色,其训练内存消耗和训练时间与基于CNN的模型相当,而推理时间则显著优于传统的Transformer架构,如UNETR和SwinUNETR。

本研究的主要贡献包括以下三个方面。首先,我们将Mamba和KAN结合到VKAN模块中,作为Transformer架构的替代方案。这一设计充分利用了Mamba在全局特征提取方面的高效性以及KAN在非线性表达方面的强大能力,从而提升了图像特征提取的综合表现。其次,为了增强相邻像素之间的信息交互,我们在KAN模块之前引入了两个额外的3×3卷积层。这一改进有效地增强了模型内部的特征表示能力,使其能够更好地捕捉图像中的局部细节和全局上下文。最后,通过在多个公开数据集上的实验验证,我们展示了MedVKAN在不同医学图像分割任务中的优越性能,证明了其在实际应用中的潜力。

在实际应用中,医学图像分割的高效性和准确性对于临床诊断和治疗具有重要意义。传统的分割方法由于依赖人工标注,不仅耗费大量时间和人力,还容易受到主观因素的影响,导致结果的不一致。而基于深度学习的自动化分割方法则能够在较短时间内处理大量图像,并提供更加一致和可靠的结果。然而,这些方法在处理高分辨率图像时,往往面临计算资源消耗大、训练时间长等问题。因此,如何在保持分割精度的同时,提升模型的计算效率,成为当前研究的一个重要方向。

MedVKAN的提出正是基于这一目标。通过将VSS模型与EFC-KAN模块相结合,我们构建了一个新型的特征提取框架,该框架在保持高效计算的同时,能够捕捉更丰富的上下文信息。此外,通过在编码器的不同阶段引入不同的模块,我们实现了对局部和全局特征的平衡提取,从而提升了模型的整体性能。实验结果表明,MedVKAN在多个数据集上均表现出色,其性能不仅优于传统的CNN和Transformer模型,还展现出良好的泛化能力。

值得注意的是,MedVKAN的结构设计具有较强的灵活性和可扩展性。通过调整编码器和解码器的层数以及VKAN模块的参数,可以适应不同类型的医学图像和分割任务。这种模块化设计不仅有助于模型的优化,还为未来的研究提供了更多的可能性。例如,可以进一步探索VKAN模块在其他任务中的应用,或者结合其他先进的神经网络架构,以提升模型的性能。

此外,本文还对MedVKAN的计算效率进行了详细分析。通过与传统的Transformer模型进行对比,我们发现MedVKAN在训练和推理过程中均表现出更高的效率。这主要得益于其线性计算复杂度的设计,使得模型能够在不牺牲性能的前提下,更高效地处理高分辨率图像。这种高效的计算能力对于实际医疗场景尤为重要,因为临床环境中往往需要快速处理大量医学图像,以支持医生的决策过程。

在实验过程中,我们还注意到,MedVKAN在不同数据集上的表现具有良好的一致性。这表明该模型不仅适用于特定的医学图像分割任务,还能够在不同的成像模态和数据分布下保持稳定的性能。这种鲁棒性使得MedVKAN在实际应用中更具优势,因为它能够适应多样化的数据环境,从而提高其在临床中的实用性。

总的来说,MedVKAN的提出标志着医学图像分割领域的一项重要进展。通过将Mamba和KAN的优势结合起来,我们构建了一个高效且强大的特征提取框架,为医学图像分割提供了一种新的解决方案。实验结果表明,该模型在多个数据集上均取得了优异的性能,证明了其在医学图像分割任务中的有效性。未来的研究可以进一步探索该模型在其他医学任务中的应用,或者结合其他先进的神经网络技术,以提升其性能和适用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号