超声基础模型UltraSam:基于开放分割数据集的多任务泛化研究

【字体: 时间:2025年09月16日 来源:International Journal of Computer Assisted Radiology and Surgery 2.3

编辑推荐:

  为解决超声(US)图像分析中标注数据稀缺和领域差异大的难题,研究人员通过整合43个开放数据集(US-43d)构建了28.2万图像量的训练集,开发出基于提示分割范式(prompt-conditioned segmentation)的UltraSam模型。实验证明该模型在分类和实例分割任务中超越现有SAM变体及自监督模型,为碎片化医学数据的价值挖掘提供了新范式。

  

超声(US)成像领域长期面临两大"拦路虎":人体解剖结构的复杂多变与标注数据的严重匮乏。尽管大规模预训练在其他视觉领域大放异彩,但超声图像特有的模态偏移(modality shift)和临床场景差异(如胸部/卵巢/内窥镜成像)使其难以直接套用现有方案。

科研团队另辟蹊径,将目光投向散落各处的公开分割数据集。通过精心整合43个开放资源(US-43d),构建起包含28.2万张图像、覆盖58种解剖结构的超级"营养基"。在这个基础上培育出的UltraSam模型,采用提示驱动分割(prompt-conditioned segmentation)的创新架构,巧妙规避了传统方法对统一标注的依赖。

这个"医学视觉通才"在三大测试集中展现出惊人潜力:在提示分割任务中碾压SAM系列模型,在创新设计的提示分类(prompted classification)任务上更是把自监督预训练模型远远甩在身后。其秘诀在于将物体特异性提示(object-specific prompts)与图像特征进行联合解码,就像给AI装配了"临床思维导航仪"。

这项研究为碎片化医学数据的价值挖掘提供了完美范本。团队已开源所有代码和预训练模型,并呼吁学界持续贡献高质量数据集——毕竟,当28万张超声图像都能"众筹"成功时,医学AI的奇点时刻或许真的不再遥远。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号