基于通用与组织特异性特征提取器的机器学习模型精准分型活检样本:推动拉丁美洲肺癌诊断进步

【字体: 时间:2025年09月21日 来源:JVS-Vascular Science 2

编辑推荐:

  本研究针对拉丁美洲地区肺癌诊断资源差异及组织学亚型分类挑战,开发了基于DinoV2架构的LungDino和OncoDino特征提取器模型。通过对1308张H&E染色WSIs的训练,模型在79例拉丁美洲样本验证中表现出色:LungDino对腺癌和鳞癌的AUC分别达0.97/0.96,OncoDino对小细胞癌AUC达0.99。该研究为AI驱动病理诊断在资源受限地区的应用提供了精准可解释的解决方案。

  

肺癌作为全球癌症相关死亡的首要原因,其准确的组织学亚型分类对治疗方案制定具有决定性意义。然而在医疗资源分布不均的现实背景下,拉丁美洲等代表性不足地区面临着诊断变异性和资源匮乏的双重挑战。传统病理诊断高度依赖病理学家的经验判断,在低分化或未分化样本的亚型鉴别中尤其容易产生分歧,这种不确定性可能直接影响患者的靶向治疗选择和临床预后。

为应对这一全球性健康挑战,由Viviane Teixeira Loiola de Alencar领衔的研究团队开展了一项突破性研究,致力于开发基于人工智能(AI)的病理诊断模型。该研究创新性地采用两种不同的特征提取策略——针对肺部组织特异性优化的LungDino和面向泛癌种应用的OncoDino,旨在提升对hematoxylin and eosin(H&E)染色全幻灯片图像(Whole-Slide Images, WSIs)的自动分析能力。研究成果已发表在《JVS-Vascular Science》期刊,为AI在病理诊断领域的临床应用提供了重要实践依据。

研究团队采用的核心技术方法包括:基于DinoV2架构的深度学习特征提取器开发、多中心WSIs数据集构建(包含TCGA和拉丁美洲本地样本)、接收者操作特征曲线(ROC)分析模型性能、以及类激活热图生成技术实现肿瘤可视化定位。训练数据集涵盖1,308张WSIs,包含412例腺癌(Adenocarcinoma, ADC)、323例鳞状细胞癌(Squamous Cell Carcinoma, SCC)、41例小细胞癌(Small Cell Carcinoma, SCLC)和532例良性组织样本。

研究结果方面:

《Materials and Methods》部分详述了模型构建流程:研究团队开发了基于DinoV2的LungDino(肺部组织特异性)和OncoDino(泛癌种通用性)特征提取器,以在ImageNet预训练的ResNet模型为基线对比。训练数据整合了TCGA和拉丁美洲本地数据库的1,308张H&E染色WSIs,涵盖三大肺癌亚型和良性组织。在79例拉丁美洲WSIs测试集上通过ROC曲线评估性能,并生成热图实现肿瘤定位可视化。

《Results》部分展示了模型的卓越性能:DinoV2架构模型全面超越ResNet基线。LungDino获得总体最佳性能,对ADC和SCC的AUC分别达到0.97和0.96;OncoDino在稀缺类别表现突出,对SCLC的AUC高达0.99,证明其优秀泛化能力。两类模型均产生可解释热图,其中LungDino呈现精确的肿瘤定位能力。特别值得注意的是,在传统病理报告诊断为低分化或未分化的样本子集中,DinoV2模型仍保持高分类性能。

《Conclusion》部分总结了研究的临床价值:本研究证实了任务特异性与通用特征提取器在提供准确、可解释结果方面的有效性,弥补了AI驱动组织病理学在代表性不足地区应用的研究空白。模型生成的直观热图为病理医生提供了可靠的决策支持工具,其在高难度样本中保持的稳定性能尤为值得关注。

该研究的创新价值在于首次系统性地比较了组织特异性与通用特征提取策略在肺癌诊断中的性能差异,并专门针对拉丁美洲人群验证模型适用性。LungDino在常见亚型中的卓越准确性与OncoDino在罕见亚型中的强大泛化能力形成互补优势,为未来开发集成化诊断系统提供了重要参考。研究结果不仅证明了深度学习在复杂病理图像分析中的潜力,更为资源受限地区提高诊断一致性、减少医疗 disparities 提供了切实可行的技术路径。这项工作的持续推进将有助于构建更加公平、精准的全球癌症诊断体系,最终改善肺癌患者的临床预后质量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号