
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:关于多种混合深度学习模型在肺部肺泡区域自动及可解释性肺炎检测中的综合性研究:当前进展与未来发展方向
《ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING》:A Comprehensive Study of Various Hybrid Deep Learning Models for Automated and Explainable Pneumonia Detection in the Pulmonary Alveolar Region: Current Insights and Future Directions
【字体: 大 中 小 】 时间:2025年12月05日 来源:ARCHIVES OF COMPUTATIONAL METHODS IN ENGINEERING 12.1
编辑推荐:
肺炎是儿童、老年及免疫缺陷人群的重要死因,传统影像诊断成本高耗时久。本文提出Swin-T-McSWA框架,通过多上下文滑动窗口注意力机制捕捉局部与全局关系,结合轻量级T-块提升计算效率。实验显示该模型准确率达98.76%,超越CNN、ViT及EfficientNet-B0,参数量仅37M, flops仅7.2,适用于资源受限环境。
肺炎仍然是全球范围内导致疾病和死亡的主要原因之一,尤其是在儿童、老年人和免疫系统受损的人群中。为了有效管理肺炎,需要及时且准确的诊断。胸部X光和CT扫描是肺炎的标准化诊断方法;然而,这些方法成本高昂且耗时较长。因此,需要利用人工智能(AI)和深度学习(DL)技术的自动化系统。大多数相关研究的重点是将卷积神经网络(CNN)和早期版本的视觉变换器(ViTs)应用于专为肺炎检测设计的计算机辅助诊断(CAD)系统中。尽管这些方法在一定程度上显示出有效性,但由于计算效率较低,它们往往忽略了医学图像中存在的长期依赖关系,这限制了它们在现实医疗场景中的应用。当前的研究旨在通过实施Swin-T-McSWA Transformer框架来解决这一问题。该框架试图将Swin Transformer的层次化设计与多上下文移动窗口注意力(McSWA)和轻量级的T-Block相结合,以进一步提升性能。为实现这些目标,研究提出了一个新的框架:时空调控多上下文移动窗口Swin Transformer(Swin-T-McSWA)。McSWA机制通过上下文相关的窗口移动来改进空间特征提取,从而捕捉医学图像中的局部和全局关系。T-Block利用扩张卷积保持了肺炎特征检测所需的准确性,并提高了计算效率。这种方法最显著的特点在于它能够在特征提取与计算成本之间取得良好的平衡。这使得模型具有高准确性和低资源消耗。实验结果显示,与传统CNN和ViTs相比,Swin-T-McSWA的准确率达到了98.76%,F1分数为98.17%。更值得注意的是,所提出的模型在准确率上超越了常用于图像分类的EfficientNet-B0模型(其准确率为94.2%),提高了4.5%。此外,Swin-T-McSWA模型仅使用了3700万个参数和7.2 GFLOPs的计算资源,使其在计算上高效,适用于资源有限的环境。总之,Swin-T-McSWA模型增强了肺炎检测的自动化系统,其准确性和效率均超过了现有模型。这一创新有望改变医学图像分析领域,并在临床环境中带来显著优势,因为在这些环境中,快速准确的肺炎检测对于有效管理患者至关重要。
生物通微信公众号
知名企业招聘