基于掩膜提示引导的多阶段网络在脊柱CT图像椎体精准识别中的应用

【字体: 时间:2025年06月09日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  针对脊柱CT图像视野多变导致的椎体识别难题,研究人员提出掩膜提示引导的多阶段网络(MPGMSN),通过密度聚类定位、多尺度分割和SAM-Med3D驱动的序列化识别三阶段协同,在VerSe20和VerSe19数据集上分别实现1.94%和1.42%的识别准确率提升,为临床椎体自动化分析提供高效解决方案。

  

在医学影像分析领域,脊柱椎体的精准识别犹如"拼图游戏"——当CT扫描视野(Field of View, FOV)随机截取1到24节不等的椎体片段时,传统方法往往陷入"盲人摸象"的困境。这种视野变异不仅使椎体数量成为未知数,更让特定椎体类型的先验信息失效。更棘手的是,过渡椎体和病理变化的存在,使得基于标准数据集训练的深度网络性能骤降,而现有多模块串联方法又面临误差传导的"多米诺效应"。

针对这一挑战,东南大学的研究团队在《Biomedical Signal Processing and Control》发表创新成果,提出掩膜提示引导的多阶段网络(MPGMSN)。该研究通过三阶段"接力赛":密度聚类定位→多尺度分割→SAM-Med3D驱动的序列化识别,在VerSe20和VerSe19测试集上分别实现98.34%和97.82%的识别准确率,较现有技术提升1.94%和1.42%。尤为关键的是,该方法通过阶段间信息闭环传递,将传统方法中"各自为政"的定位、分割、识别任务转化为协同作战的有机整体。

技术方法上,研究团队首先采用密度聚类算法建立椎体邻域包络密度模型;继而构建含跳跃连接(Skip Connection)和Inception块的轻量化U-Net变体;最终基于SAM-Med3D编码器开发序列化掩膜提示识别模块(SMPSAM),通过双向长短期记忆网络(BiLSTM)处理特征序列。实验数据来自VerSe19(160例)、VerSe20(319例)及私有数据集。

【Single-stage segmentation and identification method】
通过分析传统单阶段方法的局限性,指出迭代回归的FCN网络和基于邻接矩阵的后处理难以适应视野变异,为多阶段设计提供理论依据。

【Overview of the framework】
三阶段架构中,前阶段输出作为后阶段输入形成信息闭环:密度聚类定位模块通过自适应阈值处理应对形态异常;多尺度分割网络参数量减少23%但保持Dice系数0.912;SMPSAM模块通过掩膜对齐使特征维度压缩至1/8。

【Dataset and preprocessing】
在数据增强方面,采用随机旋转(±15°)和灰度抖动(±10%)策略,VerSe20数据集被划分为训练集(113例)、测试集(103例)和验证集(103例),所有数据均进行isotropic resampling至1mm3
分辨率。

【Discussion and conclusion】
该研究的突破性体现在三方面:密度聚类使定位误差降低至1.2mm;Inception块与跳跃连接的组合使分割参数量控制在8.7M;SMPSAM的序列化处理使长程依赖识别准确率提升6.3%。临床价值在于,该方法对金属植入物和病理改变的鲁棒性较基线模型提高31.5%。

这项研究开创性地将提示学习(Prompt Learning)理念引入医学图像分析,其阶段间信息传递机制犹如"考古学的地层标记法"——前一阶段的"发掘成果"成为后阶段的研究基础。这种设计不仅降低62%的计算复杂度,更建立起椎体识别领域首个可解释的多阶段协同范式,为其他解剖结构分析提供普适性框架。国家重点研发计划(2022YFE0116700)和国家自然科学基金(62171125)的支持,预示着该技术向临床转化的广阔前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号