《Image and Vision Computing》:Modified ResNet model for medical image-based lung cancer detection
编辑推荐:
肺癌早期诊断中基于改进ResNet 50的医学影像分析模型研究。采用迁移学习优化预训练ResNet 50,通过添加批量归一化层、全局平均池化层和SE注意力机制,提升小病灶检测能力。在JSRT数据集上验证,准确率达98.77%,敏感性、特异性等临床指标优于原模型及现有方法,降低计算复杂度,适用于实时医疗影像诊断。
Zeyad Q. Habeeb | Branislav Vuksanovic | Imad Q. Alzaydi
伊拉克技术大学/生物医学工程系,巴格达,伊拉克
摘要
肺癌仍然是全球肿瘤死亡的最常见原因。因此,迫切需要开发肺癌诊断工具。本研究提出了一种经过调整的ResNet 50模型,用于从胸部X光图像中检测和诊断肺癌。ResNet 50的架构经过优化,以更好地适应医学成像数据所面临的独特挑战。修改措施包括添加额外的批量归一化层以稳定训练过程,用全局平均池化层替代全连接层以减少过拟合,以及添加挤压-激发(SE)模块来增强模型对关键特征(如结节和病变)的识别能力。此外,还对预训练的ResNet 50权重进行了迁移学习,并针对肺部图像数据集进行了微调,以提高对癌变模式的敏感性。这种改进后的ResNet 50在JSRT公开肺图像数据集上的表现优于原始ResNet 50和现有最先进的研究成果。该模型在敏感性、特异性、精确度以及F1分数方面均取得了优异成绩,这些指标在临床应用中至关重要。结果显示,肺癌检测的准确率高达98.77%。这些结果表明,改进后的ResNet模型是一种高度可靠且高效的肺癌早期检测工具。改进后的架构不仅提高了诊断准确性,还降低了计算复杂度,使其适用于需要实时处理的医学成像应用。
引言
肺癌约占所有癌症死亡病例的18%[1]。早期发现和诊断被认为是提高患者生存率的重要因素,因为如果在疾病初期发现肺癌,生存率会显著提高[2]。然而,早期肺癌在医学X光片上的表现较为微妙且不明显,给放射科医生带来了诊断挑战。这促使研究人员开发先进的肺癌异常检测工具[3]。
胸部X光在医学诊断中具有显著优势,尤其是在识别和监测肺部状况方面[4]。作为一种非侵入性、广泛可用且成本低廉的成像方法,胸部X光能够立即提供关于肺部的重要信息。通过X光可以检测到的异常包括肺部感染、肿瘤、骨折和胸腔积液等。此外,胸部X光的辐射剂量相对较低,适合反复检查,这对于监测疾病进展或治疗反应非常重要[5]。同时,胸部X光检查简单快捷,有助于在紧急情况和常规护理中迅速做出决策,从而尽早为患者提供治疗[6]。
残差网络(ResNet)是由Kaiming He等人于2015年提出的创新深度学习(DL)模型[7]。ResNet通过残差连接机制解决了梯度消失问题,允许网络跳过某些层并保留多层学习到的特征[8]。这种架构使得深度网络的训练能够在不损失性能的情况下进行。ResNet在确保高准确性和捕捉复杂模式方面的能力使其适用于多种任务,从图像分类和物体检测到医学成像[9]。尽管原始ResNet取得了巨大成功,但其架构并未完全针对肺癌检测的特殊需求进行优化,而肺癌检测需要高度精确地识别肺部的小型潜在恶性病变。
在这项研究中,作者提出了一种改进版的ResNet 50模型,用于从医学X光图像中检测和诊断肺癌。改进措施包括解决医学成像中常见的问题,如高维度导致的过拟合问题以及大多数肺癌数据集中标记数据有限的问题。此外,还添加了批量归一化层以提高训练稳定性;用全局平均池化层替代传统的全连接层;引入挤压-激发(SE)模块以突出显示临床相关的特征(如结节和病变)。研究还利用迁移学习对模型进行微调,使其适应肺部X光图像数据集。最后,将提出的模型与ResNet 50及现有最先进模型进行对比测试,以评估其准确性、敏感性和特异性这三个对临床决策至关重要的指标。
本文结构如下:第2节介绍使用深度学习方法检测肺癌的相关工作;第3节阐述改进版ResNet 50的架构和训练过程;第4节展示并讨论实验结果;第5节总结主要发现并提出未来研究方向。
文献综述
深度学习(DL)技术在肺癌检测中具有重要意义。综合文献表明,基于深度学习的模型在肺癌诊断准确性方面优于传统方法。它们在医学图像异常检测方面表现出色,而这些异常往往难以被传统方法甚至专家放射科医生发现。
多项研究致力于优化深度学习架构,以提高肺癌检测效果
方法论
本研究提出了一种基于胸部X光图像的改进版ResNet 50模型用于肺癌检测。该方法结合了预处理技术和改进的深度学习模型,利用预训练的ResNet 50 CNN模型提高了肺癌检测的诊断性能,并通过迁移学习利用了预训练模型的优势,从而加快了训练速度并提升了模型性能。
结果与讨论
本节比较了原始ResNet 50与改进版MResNet 50模型的性能。通过使用相同的JSRT数据集和相同的预处理流程,分析了两种模型的性能,以评估改进措施对MResNet 50的影响。这样的对比有助于全面了解两种模型的优缺点。
结论
研究表明,改进版的MResNet 50在肺癌检测方面表现出色。模型通过添加全局平均池化层、批量归一化层、修改跳过连接以及引入注意力机制等架构改进,实现了更高的准确率、敏感性和特异性,以及更高的F1分数,显示出其在区分癌变病例方面的强大能力。
CRediT作者贡献声明
Zeyad Q. Habeeb:撰写初稿、验证、监督、软件开发、资源管理、项目协调、方法论设计、数据分析、概念构思。Branislav Vuksanovic:撰写初稿、验证、概念构思。Imad Q. Alzaydi:撰写初稿、方法论设计、概念构思。
利益冲突声明
作者声明不存在可能影响本文研究的已知财务利益或个人关系。
致谢
作者衷心感谢伊拉克技术大学提供的宝贵支持,这对研究的顺利完成起到了关键作用。