基于深度可分离残差神经网络的甲状腺癌病理图像PCDH8状态预测研究
【字体:
大
中
小
】
时间:2025年09月27日
来源:Intelligent Oncology
编辑推荐:
本研究针对甲状腺癌PCDH8基因表达状态预测中传统方法成本高、耗时长且需要专业知识的问题,开发了一种新型深度可分离残差神经网络(DSRNet),能够直接从WSIs非侵入性地预测PCDH8状态。在TCGA-THCA数据集上,DSRNet实现了92.76%的准确率和0.93的AUC值,显著优于现有CNN和Transformer模型,为甲状腺癌辅助诊断和预后提供了准确、可解释的工具。
甲状腺作为重要的内分泌器官,调控着生长、发育、免疫调节和神经发生等关键生理过程。近年来,全球甲状腺癌发病率持续上升,对公众健康构成严重威胁。随着分子生物学的发展,研究人员在甲状腺癌细胞中发现了大量基因和蛋白表达异常,揭示了众多潜在的生物标志物。其中,原钙粘蛋白8(PCDH8)作为钙粘蛋白超家族的一员,引起了广泛关注。越来越多的证据表明,PCDH8表达失调与多种恶性肿瘤的发病机制、侵袭性和转移潜能相关。在甲状腺癌中,PCDH8过表达与较高的肿瘤分级、增加的侵袭性和不良患者预后密切相关,凸显了其作为有价值的诊断和预后生物标志物的潜力。
然而,现有的PCDH8检测方法包括免疫组化、分子检测(如mRNA表达分析)、配体结合试验和放射免疫分析等,都存在各自的局限性。免疫组化方法虽然能够直观显示PCDH8的定位和表达水平,但对技术专业知识和判读技能要求很高。通过mRNA分析的分子检测提供定量结果且灵敏度高,适合多基因预测,但成本昂贵且依赖专用设备。配体结合试验和放射免疫分析虽然用于早期研究,但由于需要大量组织样本和特异性差,现在已较少使用。
在这种背景下,来自河南农业大学信息与管理科学学院的研究团队在《Intelligent Oncology》上发表了一项创新研究,开发了一种基于深度学习的深度可分离残差神经网络(DSRNet),用于直接从常规H&E染色的病理图像预测PCDH8状态。这项研究为解决甲状腺癌诊断中面临的挑战提供了新的解决方案。
研究人员采用了几项关键技术方法开展本研究。他们从TCGA数据库收集了403个甲状腺癌全切片图像(WSIs),基于PCDH8表达中值将样本分为高状态和低状态两组。使用OpenSlide库将每个WSI分割成512×512像素的图块,并筛选出前100个非白色图块作为最终输入数据集。设计的DSRNet架构整合了深度可分离卷积、残差连接和可变形卷积金字塔池化(DCPP)模块,能够高效捕获十亿像素WSI中的多尺度和长距离特征。模型采用十折交叉验证进行训练,使用Adam优化器和交叉信息熵损失函数。
研究结果方面,通过"训练过程分析"发现,DSRNet在训练过程中表现出良好的学习能力和收敛性,训练准确率从0.5逐步提升到0.95,训练损失从0.6下降到0.1左右,验证准确率也显示出相似的增长趋势,表明模型具有很好的泛化能力。
"对比实验结果"显示,DSRNet在TCGA-THCA数据集上实现了92.76%的准确率、91.92%的精确度、92.69%的召回率和0.93的AUC值,显著优于VGG16、ResNet50、ResNet101、ViT、MobileNetV2、DenseNet121、InceptionV3、CLAM和TransMIL等9种主流CNN和Transformer模型。
"可视化分析"通过注意力滚出技术生成的热图表明,DSRNet能够有效捕捉病理图像中与PCDH8状态相关的关键区域。在高PCDH8状态图像中,模型关注特定区域, warmer颜色集中在某些区域;在低PCDH8状态图像中,注意力分布也突出显示特定区域,这些区域很可能对应低PCDH8状态的特征。
"t-SNE分析"进一步证实了DSRNet的有效性。输入层特征密集聚集,主要呈黄色,表明输入特征相对集中,缺乏明显的类间区分;而输出层特征分为两个明显的簇,一个黄色一个紫色,表明输出层特征很好地分离为两个类别,证明DSRNet在训练过程中有效地学习了判别性特征。
"消融实验"结果表明,DSRNet的各个组件都对其性能有重要贡献。缺少层归一化(LN)的DSRNet1性能显著下降;包含LN但排除深度可分离卷积的DSRNet2F1分数为85.48%;结合深度可分离卷积和LN的DSRNet3将F1分数提高到75.90%;添加数据增强的DSRNet4进一步将F1分数提高到87.13%;完整的DSRNet包含深度可分离卷积、LN、数据增强和DCPP模块,获得了91.86%的最高F1分数。
此外,研究还通过"泛化性能验证"在TCGA-BRCA乳腺癌数据集上测试了DSRNet的泛化能力,结果显示模型达到了89.13%的准确率和0.90的AUC值,比次优的InceptionV3高出2.7个百分点,表明DSRNet在不同癌症类型的PCDH8分类任务中都具有高准确性和鲁棒性。
研究结论表明,DSRNet成功解决了引言中提出的两个核心挑战:通过结合深度可分离卷积与残差连接,克服了甲状腺癌WSI的十亿像素大小和稀疏性问题;通过DCPP模块融合多尺度感受野,在没有Transformer二次成本的情况下捕获了全局上下文。在403个TCGA-THCA切片上,DSRNet实现了92.76%的准确率和0.93的AUC值,显著优于9种最先进的CNN和Transformer基线模型。
这项研究的重要意义在于,它验证了从常规H&E染色切片非侵入性评估PCDH8的可行性,为甲状腺癌预后提供了高效、可解释的工具。DSRNet协调了CNN的局部细节优势与Transformer的长距离建模能力,在独立乳腺癌数据集上实现了2-3%的绝对增益。同时,注意力滚出热图显示网络专注于肿瘤丰富区域,与免疫组化研究相互印证,建立了生物学合理性。不过,研究人员也指出了一些局限性,包括TCGA-THCA数据集可能限制模型泛化能力、真实应用中图像质量和染色变异可能影响性能、对高质量WSI和计算资源的依赖可能限制在资源有限环境中的可及性等。未来的研究需要通过进一步的多中心验证和与临床结果的整合来加强模型的实用性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号