
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于辅助信息引导的半确定性无限混合原型Few-Shot胸部X射线诊断模型
【字体: 大 中 小 】 时间:2025年09月21日 来源:Computers in Biology and Medicine 6.3
编辑推荐:
本综述提出了一种创新的小样本学习(FSL)框架,通过辅助语义信息引导的半确定性无限混合原型(SIMP)方法,解决胸部X射线影像中病变表征多样性难题。该方法动态生成多原型聚类,显著提升少样本条件下胸部疾病的诊断精度,代码已开源。
深度学习模型虽在医学影像分析取得显著进展,但普遍存在数据饥渴问题——需要大量标注数据才能有效训练[1]。小样本学习(FSL)方法通过设计 episodic 训练机制应对这一挑战,其与传统深度学习训练法的核心区别在于:通过构建包含少量支持集和查询集的小型任务(episodes),模拟少样本学习场景,迫使模型学会从极少数样本中泛化表征。
本研究提出针对胸部X射线诊断的FSL框架,重点关注同一异常表现在不同患者X射线影像中存在的视觉特征变异。医学异常(尤其是胸部放射摄影)很少在不同患者间呈现均匀的视觉特征。同一病理状况可能在外观、位置、形态学和关联特征方面表现出显著差异性[3]。以肺部病理为例,结核病等病症可能呈现多样化的放射学模式,包括不同直径、位置和边缘特征的小结节簇[4]。这些表现受疾病阶段、患者特异性免疫反应、合并症和解剖变异等多因素影响[3]。单一原型表征必然无法捕捉这种丰富的表现谱系,即使经验丰富的放射科医师也承认这种变异性需要结合快速模式识别和审慎分析流程进行影像判读[5]。
文献指出最近邻[6]和原型网络[7]代表了聚类方法的两个极端:最近邻基于邻近性生成过多聚类,而原型网络通过将数据点平均为单类单原型过度简化聚类结构,忽略了数据复杂性。这种对比表明需要一种不受固定聚类数量约束且不依赖大数据集的自适应聚类方法。无限混合原型(IMP)算法[8]以其灵活性满足了这一需求。
我们的方法基于以下认知:胸部X射线数据集的特征空间应当能够表征同一病症的不同表现形式并形成 distinct 聚类。通过允许多原型表征异常而非单一平均表征,我们的模型能够捕捉表征同一基础病症的多样化视觉特征。
为捕捉异常内部的细微变异,我们提出了一种小样本学习方法,通过语义引导为每种异常形成多个聚类。我们引入半确定性无限混合原型(SIMP)方法,在聚类过程中引入受控随机性,从而在特征(嵌入)空间中为每种异常形成多个聚类。该框架采用自适应聚类方法,根据数据自身确定每个异常类别的合适原型数量。与传统强制固定聚类数量的方法不同,我们的方法自动识别每个类别特征分布中的自然分组。
在聚类过程中,我们考虑特定类别的不同聚类应在嵌入空间中保持邻近性。为实现这一点,我们利用异常语义信息(以语义签名形式)指导聚类过程,确保特定类别的聚类不会显著发散。该过程由异常的辅助语义信息引导,这保证了表征特定异常的聚类同时具有语义意义。因此,我们致力于使模型能够利用少量标注训练数据提供更精确、更细致的诊断。本文主要贡献如下:
(1) 提出用于胸部X射线影像诊断的小样本学习(FSL)方法
(2) 引入半确定性无限混合原型(SIMP)方法对胸部X射线影像提取的视觉特征进行聚类。该方法允许在特征空间中为每种异常形成多个聚类,是FSL方法的骨干
(3) 提出在聚类过程中使用辅助语义信息的技术,该信息通过词嵌入挖掘获得
胸部X射线中的异常通常复杂且可能表现出显著变异性。若从X射线影像提取特征,这些变异性可能无法通过特征空间中的单一聚类有效捕捉。为捕捉异常内部的细微变异,我们提出一种小样本学习方法,促进形成多个语义引导的聚类。我们引入半确定性无限混合原型(SIMP)
我们提出了一种执行胸部X射线影像少样本诊断的方法,该方法利用辅助信息并执行半确定性聚类。与确定性创建新聚类的基线模型不同,我们的方法在将查询点分配到新聚类前引入随机性,从而实现更具适应性的聚类过程。我们还通过使用语义签名形式的辅助信息指导聚类过程。此类信息是
生物通微信公众号
知名企业招聘