利用改进的高维特征融合方法优化宫颈癌检测的细胞分类

《Medical Engineering & Physics》:Refining Cell Classification for Cervical Cancer Detection Using an Improved High Dimensional Feature Fusion Approach

【字体: 时间:2025年09月29日 来源:Medical Engineering & Physics 2.3

编辑推荐:

  宫颈癌筛查中,基于Modified High-Dimensional Feature Fusion(HDFF)框架整合VGG16、ResNet50等7种预训练CNN的特征,通过全连接分类器结合正则化技术提升泛化能力。实验在Herlev、SIPaKMeD等4个数据集上验证,最高准确率达99.85%,且在多类别场景中保持高精度(0.995)、召回率(0.987)和F1-score(0.985),有效解决类别不平衡问题,为临床提供可靠诊断工具。

  
Seema Singh|Chandrahas Sahu|Pushpendra Singh|Alka Mishra|Santosh Kumar Mishra|Pawan Kumar Patnaik
电子与电信工程系,Shri Shankaracharya 技术校区,Bhilai,Chhattisgarh,490020,印度

摘要

引言

早期和准确地对宫颈细胞图像进行分类对于及时检测和预防宫颈癌至关重要。传统的细胞学分析方法,如人工解读巴氏涂片,通常劳动强度大且容易出错。深度学习的最新进展提供了有希望的解决方案,但许多现有模型在跨数据集的泛化能力方面存在不足,并且在多类别分类任务中面临挑战。

方法

为了解决这些限制,本文提出了一种改进的高维特征融合(HDFF)框架。该方法整合了从七种不同的预训练卷积神经网络(CNN)架构中提取的标准化特征向量——VGG16、VGG19、ResNet50、XceptionNet、InceptionV3、DenseNet121以及一个轻量级特征提取器。这些特征被串联起来形成一个统一的表示,然后通过带有dropout和批量归一化的全连接分类器进行处理,以增强泛化能力并减少冗余。

结果

该模型在四个基准数据集上进行了评估:Herlev、SIPaKMeD、Mendeley LBC 和 Malhari。在二元分类任务中,准确率达到了99.85%,并且在更复杂的多类别设置中保持了高精度、召回率、F1分数、特异性和AUC。例如,在Herlev数据集上,其精度为0.995,召回率为0.987,F1分数为0.985。与现有方法相比,改进的HDFF表现出更低的误分类率,并且在类别不平衡和数据集变化的情况下表现稳定。

结论

结果证实了改进的HDFF框架的稳健性和适应性,使其成为现实世界宫颈癌筛查的可靠候选方案。其在不同数据集上的泛化能力突显了其临床相关性和诊断价值。

部分摘录

引言

宫颈癌起源于宫颈的上皮层,是全球女性中第四大常见癌症。根据世界卫生组织(WHO)的数据,仅2018年就报告了约570,000例新病例和311,000例相关死亡病例[1,2]。这种疾病的主要负担——超过85%的病例和相关死亡——发生在低收入和中等收入国家,这些国家的筛查和治疗服务有限[3]。

相关工作

宫颈癌筛查历来依赖于细胞学方法,如巴氏涂片,尽管这种方法被广泛采用,但需要大量的手工解读,并且容易受到观察者偏见和人为错误的影响。为了提高诊断的一致性和可扩展性,早期的计算研究探索了传统的人工智能(ML)方法,这些方法严重依赖于手工制作的特征。例如,Bandyopadhyay等人[10]提取了几何描述符——面积、周长等。

材料与方法

使用深度学习对宫颈癌进行分类的方法是一个综合过程,包括从数据采集和预处理到模型训练、评估和结果计算等多个关键阶段。如图1所示,这个结构化的方法首先收集一个多样化的数据集,如Herlev [32] 或 SIPaKMeD 数据集 [33],其中包含各种类型的宫颈癌图像及其相关的临床数据。关键类别包括

实验设置

训练和评估过程在构建有效的宫颈癌巴氏涂片图像分类模型中起着至关重要的作用。在这项研究中,我们采用了一种改进的混合深度特征融合(HDFF)技术,替代了传统的模型架构以提高诊断性能。所提出的模型在四个公开可用的数据集上进行了严格的训练和评估——SIPaKMeD [33]、Herlev [32]、Mendeley 液基细胞学(LBC)[41] 和 Malhari

讨论

本研究证明,所提出的改进高维特征融合(HDFF)框架显著提高了多个基准数据集中宫颈细胞学图像的自动分类性能。通过整合来自七种互补CNN架构的标准化特征,该模型在准确性、精度、召回率和F1分数方面均优于单独的CNN和简单的融合策略。特别是,改进的HDFF

结论

本研究提出了一种针对宫颈细胞图像分析的改进高维特征融合(HDFF)方法。该模型合并了来自七个成熟卷积网络的特征表示,捕捉了多样的形态和纹理模式。采用了dropout和批量归一化等技术来提高泛化能力并减少冗余。测试在四个标准数据集上进行——Herlev、SIPaKMeD、Mendeley LBC等

资助

伦理批准

无需

利益冲突声明

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号