PAM:基于传播的通用三维医学图像分割模型——突破44个数据集的性能边界
《npj Digital Medicine》:PAM: a propagation-based model for segmenting any 3D objects across multi-modal medical images
【字体:
大
中
小
】
时间:2025年12月04日
来源:npj Digital Medicine 15.1
编辑推荐:
本研究针对当前三维医学图像分割方法依赖大量标注、可迁移性差等挑战,开发了基于传播机制的PAM模型。该模型通过单张二维提示即可实现跨模态、跨器官的精准三维分割,在44个数据集上的平均DSC显著优于MedSAM和SegVol(提升19.3%),推理速度提升显著(P<0.001),交互时间减少63.6%。其创新性地建模切片间信息流的设计理念,为通用医学图像分析提供了新范式。
在精准医疗时代,三维医学图像分割已成为疾病诊断、手术规划和疗效评估的关键技术。然而,现有方法面临两大核心瓶颈:一方面,传统深度学习模型需要针对特定器官或病灶进行大量数据标注和重复训练,难以适应临床中千变万化的分割需求;另一方面,基于自然图像分割范式(如Segment Anything Model)的医学适配模型,在三维医学图像处理上存在明显局限——要么像MedSAM那样忽略切片间连续性导致分割结果不连贯,要么如SegVol般因直接采用三维卷积而计算效率低下、泛化能力不足。
针对这一挑战,北京大学团队在《npj Digital Medicine》发表的研究中提出了PAM(Propagating Anything Model)模型。该研究创新性地将医学图像分割问题的本质重新定义为“切片间信息流的建模”,而非传统的“特定对象特征学习”。通过模拟医生读片时沿切片序列推演结构的认知过程,PAM实现了仅需单张二维提示(边界框或草图)即可完成全三维分割的突破。
关键技术方法涵盖:1)基于动态归一化的多模态数据适配技术,针对CT、MRI、PET-CT等不同成像特性自适应调整预处理策略;2)双模块架构设计,Box2Mask模块将边界框转换为精细掩膜,PropMask模块通过交叉注意力机制实现切片间信息传播;3)多尺度提示引导解码器,融合局部特征与长程依赖关系。研究纳入44个公开数据集(含168类对象、164万实例),涵盖北京大学肿瘤医院等机构的临床数据。
在44个数据集上的系统性评估表明,PAM-2DBox和PAM-2DMask在34个内部数据集和10个外部数据集上均显著优于对比模型。其中PAM-2DBox平均DSC达到0.740,较MedSAM提升23.1%,较SegVol提升19.3%。在边界精度指标上,PAM的HD95(8.937±5.767)显著低于MedSAM(27.951±39.774)和SegVol(15.457±19.783),证明其能更好保持三维结构的连续性。
PAM的混合架构(CNN+Transformer)使其参数量控制在32.48M,推理速度显著优于对比模型(P<0.001)。更重要的是,其单视图提示设计将用户交互时间减少63.6%,极大提升了临床可用性。这种效率优势源于其独特的传播式推理机制,避免了MedSAM的逐片处理或SegVol的重叠块计算。
针对临床实践中医生选择初始切片的差异性,研究模拟了±20%的偏移情况。实验显示PAM在不同偏移程度下均保持稳定分割性能(P≥0.5985)。同时,传播厚度在10-40mm范围内变化时,模型一致性也无显著差异(P≥0.6131),证明其鲁棒性。
通过量化目标不规则性(盒比率、凸比率、逆转动惯量),研究发现PAM对不规则目标的分割改进程度与目标不规则度呈负相关(r<-0.1249)。在胃癌患者疗效评估的临床验证中,基于PAM三维分割的肿瘤体积变化比率能显著区分高低风险组(Log-rank P=0.013),而传统二维测量则无此能力(P=0.14),凸显其临床价值。
零样本测试显示PAM在未见过数据集上保持优异性能。微调实验表明,即使仅用少量数据,PAM-2DMask-Finetuned也能快速适应新任务,且性能恢复度超过75.33%。特别值得注意的是,在结构相似的不同数据集间表现出明显的正向迁移效应,如D35训练后对D39的性能恢复度达87.57%,印证其学习的是通用切片间关系而非特定对象特征。
核心组件的逐步验证表明:动态归一化策略在8/10数据集上优于固定归一化;Box2Mask生成的引导提示显著优于全框或自适应掩膜;图像-掩膜编码器解耦设计带来显著性能提升;多尺度提示引导解码器中,第二尺度(R2)贡献最大收益。
研究结论强调,PAM通过建模三维医学结构中的连续信息流,实现了跨模态、跨对象的通用分割能力。其核心创新在于将学习目标从“对象特征”转向“切片间关系”,这一范式转变有效克服了医学数据稀缺性和语义模糊性的双重挑战。相比直接移植自然图像处理范式的方法,PAM更好地利用了医学图像特有的结构连续性先验,在44个数据集上验证了其卓越性能。
讨论部分指出,未来工作可沿四个方向拓展:一是深入评估下游临床任务价值,二是开发动态多尺度解码器等自适应机制,三是探索点、线等多元交互方式,四是研究跨模态信息融合策略。该研究不仅提出了一个高效的分割工具,更重要的是为三维医学图像分析提供了新的方法论启示——通过挖掘医学数据固有特性(如时空连续性、层级结构)来设计学习目标,可能比简单扩大模型规模或数据量更能推动领域发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号