迈向COVID-19的智能诊断方法:深度学习在医学成像领域的应用综述
《IPEM-Translation》:Towards smart diagnostic methods for COVID-19: Review of deep learning for medical imaging
【字体:
大
中
小
】
时间:2025年09月19日
来源:IPEM-Translation
编辑推荐:
快速诊断与隔离是控制COVID-19传播的关键。本文系统回顾2020-2021年间应用深度学习技术(如CNN、ResNet、U-Net等)进行CT和X光胸片COVID-19诊断的68篇同行评审文献,总结技术细节、性能指标及挑战。研究发现现有模型存在过拟合风险,临床实用性待验证,建议结合临床数据和多模态信息提升模型泛化能力。
随着2019年12月新冠病毒(SARS-CoV-2)的首次发现,全球范围内迅速爆发了冠状病毒病2019(COVID-19)。在随后的几个月中,该病毒成为一种全球性流行病,影响了数亿人的健康。尽管逆转录酶-聚合酶链反应(RT–PCR)被认为是诊断这种疾病的黄金标准,但其检测的敏感性相对较低,这导致即使RT–PCR结果为阴性,也不能完全排除感染的可能。因此,医学影像技术,尤其是胸部计算机断层扫描(CT)和X光,常被用于补充RT–PCR检测,以提高诊断的确定性。这些影像技术的高敏感性使其在早期诊断、治疗和疾病监测中发挥了至关重要的作用。然而,CT和X光图像的诊断准确性依赖于放射科医生的专业知识,一些放射科医生可能无法准确解读这些影像结果,从而导致敏感性降低。
在机器学习和深度学习技术迅速发展的背景下,科学家和临床医生开始探索如何将这些先进的计算方法应用于医学影像处理,以提高诊断的准确性和效率。深度学习(DL)在图像识别和分类任务中表现出色,这使得它成为一种有潜力的工具,用于支持临床决策并减少医疗错误。近年来,大量基于深度学习的模型被开发出来,用于对胸部CT和X光图像进行分类和分割,以识别COVID-19患者。然而,尽管这些模型在实验室条件下表现良好,但在临床实际应用中的效果仍需进一步研究和验证。
本文对2020年1月至2021年10月期间发表的关于使用深度学习技术进行胸部CT和X光图像诊断的文献进行了系统回顾。研究的重点是分类和分割模型,这些模型用于识别疑似感染的患者。所选文献均来自同行评审的期刊,以确保研究的可靠性和科学性。回顾的结果显示,尽管已有许多模型被开发,但它们在临床使用中的效果仍存在不确定性。此外,研究还指出了在使用深度学习进行智能诊断时面临的挑战,并提出了若干建议,以帮助研究人员开发更准确和实用的模型。
### 方法
本研究旨在回答以下问题:“哪些深度学习技术已被开发用于基于胸部CT和X光图像的冠状病毒病诊断?”为了找到相关研究,我们对IEEE Xplore、ScienceDirect、Springer、PubMed和Google Scholar等在线数据库进行了系统搜索,时间范围为2020年1月至2021年10月。使用关键词“COV-19;Coronavirus;Diagnosis;Detection;Artificial Intelligence;Machine Learning;Deep Learning;Medical Imaging;CT-Scan;X-ray”进行搜索,这些关键词通过“and”或“or”连接,以识别涉及使用深度学习技术进行冠状病毒病诊断的论文。
### 选择标准
本研究纳入了以下标准的文献:(1) 使用机器学习或深度学习技术进行冠状病毒病诊断的文章;(2) 使用技术分析放射影像(CT扫描和/或X光)的文章;(3) 应用分类和分割模型的文章。排除标准包括:(1) 非英文文章;(2) 未在同行评审期刊上发表的文章;(3) 评论文章;(4) 未使用机器学习/深度学习方法进行基于医学影像的冠状病毒病诊断的文章;(5) 未提供清晰模型描述和结果解释的文章。
### 技术背景
本文旨在回顾文献中用于冠状病毒病智能诊断的深度学习模型。我们关注基于胸部CT和X光图像的分类和/或分割技术。为此,本节简要讨论了在回顾文献中应用的各种深度学习架构。
#### 分类模型
在本节中,我们讨论了基于胸部CT和X光图像进行冠状病毒病分类的不同深度神经网络。
**标准卷积神经网络(CNN)**:卷积神经网络(CNN)的架构受到人类和动物大脑的启发。CNN的主要优势在于能够自动检测相关特征,无需人工监督。CNN通过使用卷积层来克服过拟合问题。
**AlexNet**:AlexNet是最早且最常被引用的深度神经网络之一,也是任何目标检测任务中的领先架构。它首次引入了两种新概念,即局部响应归一化(LRN)和随机丢弃(Dropout),以帮助深度神经网络更好地学习。LRN实现的是横向抑制的概念,而Dropout是一种正则化方法,用于避免过拟合问题。在训练过程中,它会随机跳过一些神经元,迫使该层的其他神经元承担更多责任。AlexNet的架构如图2所示。
**SqueezeNet**:SqueezeNet是一种卷积神经网络,利用设计策略来减少权重数量,被认为是AlexNet的更紧凑替代品。在ImageNet数据集上,它实现了与AlexNet相当的准确性,但速度更快,参数数量减少高达50倍。ImageNet是一个大规模的图像注释数据集,用于计算机视觉和机器学习研究。
**VGGNet**:VGG是一种经典的卷积神经网络架构。它由几个应用ReLU激活函数的卷积层组成。不同版本的VGG具有不同数量的卷积层。在这些激活层之后,通常放置一个最大池化层和三个全连接层,如图4所示。该架构使用Softmax分类器。
**GoogleNet**:GoogleNet,也称为InceptionNet-V1,提出了新的Inception块,以提高识别准确性。该架构的显著特征包括大卷积掩码、较低的维度空间和减少的计算复杂度。与它的前身AlexNet和VGG相比,GoogleNet更深,但参数更少。
**MobileNet**:MobileNet的主要特点是使用深度可分离卷积,包括两个层:深度卷积和点卷积。通过这些层,MobileNet在模型大小和计算成本方面实现了显著的减少,比标准卷积减少了8-9倍。ReLU和批量归一化层放置在这些层之后。MobileNet结构简单,适用于移动设备和嵌入式机器视觉应用。
**DenseNet**:DenseNet是一种卷积神经网络,其特点是在卷积层之间建立了密集连接,每个层都连接到其他所有层。DenseNet被引入以克服梯度消失问题。通过有效利用特征重用,网络参数大幅减少。DenseNet的架构如图5所示。
**ResNet**:残差网络(ResNet)的核心思想是引入一种称为跳跃连接(或快捷连接)的技术,跳过网络中的一些层,将某一层的输出作为后续层的输入,如图6所示。ResNet的不同变体由不同数量的层组成。最流行的一种是ResNet50,包括49个卷积层和一个全连接层。
**EfficientNet**:EfficientNet网络依赖于复合缩放方法,该方法均匀缩放深度/宽度/分辨率三个维度,同时保持所有网络维度之间的平衡。通过使用复合缩放技术,作者将基线网络EfficientNet-B0缩放,以获得不同变体,包括EfficientNet-B1到B7。与squeeze-and-excitation网络相比,EfficientNet小7.7倍,快10倍。EfficientNet的架构如图7所示。
**InceptionNet**:Inception网络由重复的组件组成,称为Inception模块。InceptionNet采用辅助分类器来解决梯度消失问题,并提高非常深网络的收敛性。它还应用了不同大小的卷积核并行。这种架构有助于同时提取不同大小的相似特征。流行的InceptionNet版本包括InceptionV1到V3(如图8所示)和Inception-ResNet。
### 结果
从所有数据库中找到的文献中,我们识别了15,417篇符合条件的文章,其中6209篇是预印本(未经过同行评审)并被排除。对于重复研究(157篇),我们确保只考虑最新版本的文章。通过筛选标题、摘要和全文,我们去除了8983篇无关或缺乏足够详细信息的文章,最终保留了68篇经过同行评审、信息完整的文章。本节总结了这些文章中开发的深度学习模型的技术细节,并解释了所使用技术的优缺点。
表1总结了回顾的文章,并报告了它们的详细信息。
| 参考文献 | 模态 | 数据集 | 每类病例数 | 测试方法 | 验证方法 | 迁移学习 | ML方法 | 预处理 | 分类 | 分割 | DNN | 分类器 | 后处理 | 性能指标 (%) |
|----------|------|--------|------------|----------|----------|----------|--------|--------|------|------|----|--------|--------|----------------|
| [67] | X-ray | 两个不同数据库的组合 | 142 COVID-19,142正常图像 | 70%:30% | Hold-out | ImageNet | 监督 | 缩放,数据增强 | 从非COV-19中识别COV-19 | 无 | NCOVnet(基于VGG-16) | Softmax | 无 | Acc=97.62,Sen=97.62,Spe=78.57 |
| [68] | X-ray | 两个不同数据库的组合 | 295 COV-19,65正常,98肺炎图像 | 70%:30% | 5折 | 无 | 监督 | 模糊颜色方法,图像堆叠技术 | 从其他肺炎中识别COV-19 | 无 | MobileNetV2,SqueezeNet | SVM | 社会模仿优化方法 | Acc=99.27 |
| [69] | X-ray | 两个不同数据库的组合 | 105 COV-19,11 SARS,80正常图像 | 70%:30% | Hold-out | ImageNet | 监督 | 数据增强,直方图,使用AlexNet进行特征提取,PCA,K-means | 从其他肺炎中识别COV-19 | 无 | DeTraC(基于ResNet18),AlexNet(特征提取) | Softmax | 组成阶段 | Acc=95.12,Sen=97.91,Spe=91.87 |
| [70] | X-ray | 一个数据库(COVdx) | 76 COV-19,1583正常,4290肺炎图像 | 80%:10%:10% | Hold-out | 无 | 监督 | 数据增强,RGB格式,归一化 | 从其他肺炎中识别COV-19 | 无 | Deep SqueezeNet(使用贝叶斯优化) | 决策系统 | 类激活映射可视化(热图) | Acc=98.3,Spe=99.13,F1-Score=98.3 |
| [71] | X-ray | 两个不同数据库的组合 | 127 COV-19,500非发现,500肺炎图像 | 75%:25% | 4折 | 无 | 监督 | 数据增强 | 从非COV-19中识别COV-19 | 无 | DarkCovidNet(基于CNN) | 线性 | 热图可视化 | Acc=98.08,Spe=95.3,Sen=95.13,Pre=98.03,F1-Score=96.51 |
| [72] | X-ray | RYDLS-20 | 90 COV-19,10 MERS,11 SARS,10水痘,12链球菌,11肺孢子虫图像 | 70%:30% | Hold-out | ImageNet | 监督 | 不同特征,早期融合,晚期融合,不同重采样算法 | 从其他肺炎中识别COV-19 | 无 | Inception-V3 | Clus-HMC框架 | 弗里德曼统计检验用于排名 | F1-Score=88.89 |
| [73] | X-ray | 两个不同数据库的组合 | 284 COV-19,310正常,330细菌性肺炎,327病毒性肺炎图像 | 75%:25% | 4折 | ImageNet | 监督 | 缩放 | 从其他肺炎中识别COV-19 | 无 | CoroNet(基于Xception架构) | Softmax | 无 | Acc=89.5,Pre=97,F1-Score=98 |
| [74] | X-ray | 三个不同数据库的组合 | 455 COV-19,2109非COV-19图像 | 90%:10% | 10折 | 无 | 监督 | 缩放,数据增强 | 从非COV-19中识别COV-19 | 无 | MobileNet V2 | 无 | 无 | Acc=99.18,Sen=97.36,Spe=99.42 |
| [21] | X-ray | 三个不同数据库的组合 | 403 COV-19,721非COV-19图像 | 932–192 | Hold-out | 无 | 监督 | 使用CovidGAN的图像增强 | 从非COV-19中识别COV-19 | 无 | VGG16 | Softmax | PCA可视化 | Acc=95,Sen=90,Spe=97 |
| [75] | X-ray | 三个临床数据库的组合 | 69 COV-19,79正常,79病毒性肺炎,79细菌性肺炎图像 | 72%:18%:10% | Hold-out | ImageNet | 监督 | 数据增强 | 从非COV-19中识别COV-19 | 无 | EfficientNetB0 | Swish | 无 | Acc=93.9,Sen=96.8,PPV=100 |
| [76] | X-ray | 三个不同数据库的组合 | 224 COV-19,504健康患者 | 70%:30% | Hold-out | ImageNet | 监督 | 数据增强 | 从非COV-19中识别COV-19 | 无 | VGG-16 | Softmax | 无 | Acc=96,Spec=97.27,Sen=92.64 |
| [77] | X-ray | 三个不同数据库的组合 | 180 COV-19,6054肺炎,8851正常图像 | 80%:20% | 10折 | ImageNet | 监督 | 数据增强 | 从其他肺炎中识别COV-19 | 无 | ResNet101 | Softmax | 无 | Acc=98.93,Sen=98.93,Spec=98.66,Pre=96.39,F1-score=98.15 |
| [78] | X-ray | 三个不同数据库的组合 | 181 COV-19,364健康患者 | 80%:20% | Hold-out | ImageNet | 监督 | 数据增强 | 从非COV-19中识别COV-19 | 无 | VGG-19 | Softmax | 无 | Acc=96.3 |
| [79] | X-ray | 三个不同数据库的组合 | 202 COV-19,300正常,300病毒性肺炎,300细菌性肺炎图像 | 90%:10% | 10折 | ImageNet | 监督 | 数据增强 | 从其他肺炎中识别COV-19 | 无 | EfficientNet和卷积块注意模块(CBAM) | SVM | 无 | Acc=98,Pre=98,Sen=98,F1-score=98 |
| [80] | X-ray | 五个不同数据库的组合 | 180 COV-19,191正常,54细菌性肺炎,20病毒性肺炎图像 | 70%:10%:20% | Hold-out | ImageNet | 监督 | 标准预处理,分割,数据类型转换,直方图均衡化,伽马校正,缩放 | 从其他肺炎中识别COV-19 | 无 | ResNet18(分类),FC-DenseNet103(分割) | 多数投票 | 概率公式中的噪声或贝叶斯函数计算总感染置信度 | Sen=100,Pre=76.9 |
| [81] | X-ray | 两个不同数据库的组合 | 27正常,220SARS,17链球菌图像 | 80%:20% | Hold-out | ImageNet | 监督 | 噪声去除(使用维纳滤波) | 从其他肺炎中识别COV-19 | 无 | FM-CNN | MLP | 无 | Acc=98.06,Spec=98.29,Sen=97.22,F-score=97.93 |
| [82] | X-ray | 六个不同数据库的组合 | 900 COV-19,900正常,900肺炎图像 | 70%:30% | Hold-out | ImageNet | 监督 | 缩放,将图像转换为彩色图像 | 从其他肺炎中识别COV-19 | 无 | E-DiCoNet | ELM | 无 | Acc=94.07,Sen=98.15,Spec=91.48 |
| [83] | X-ray | 三个不同数据库的组合 | 543 COV-19,600正常,600肺炎图像 | 1220–523 | Hold-out | ImageNet | 监督 | 缩放 | 从其他肺炎中识别COV-19 | 无 | AlexNet,ReliefF | SVM | 无 | Acc=98.64,Spec=98.64,Sen=98.64,F-score=98.63 |
| [84] | X-ray | 一个数据库(CXR) | 27正常,220SARS,17链球菌图像 | 80%:20% | Hold-out | ImageNet | 监督 | 噪声去除(使用维纳滤波) | 从其他肺炎中识别COV-19 | 无 | FM-CNN | MLP | 无 | Acc=98.06,Spec=98.29,Sen=97.22,F-score=97.93 |
| [85] | X-ray | 两个不同数据库的组合 | 202 COV-19,300正常,300病毒性肺炎,300细菌性肺炎图像 | 80%:20% | 5折 | ImageNet | 监督 | 强化学习 | 从其他肺炎中识别COV-19 | 无 | ResNet18(分类),VNET-IR-RPN(分割) | 密度 | 无 | Acc=90.8,Sen=84,Spe=93,ppv=79.4,npv=94.8,Auc=94.9 |
| [86] | X-ray | 一个数据库(CXR) | 27正常,220SARS,17链球菌图像 | 80%:20% | 5折 | ImageNet | 监督 | 数据增强 | 从其他肺炎中识别COV-19 | 无 | FM-CNN | MLP | 无 | Acc=98.06,Spec=98.29,Sen=97.22,F-score=97.93 |
| [87] | X-ray | 三个不同数据库的组合 | 2665 COV-19,3692肺炎,3692正常图像 | 80%:20% | 5折 | ImageNet | 监督 | 修剪模型:VGG-16,VGG-19和Inception-V3(分类) | Softmax | 无 | 无 | 无 | 无 | Acc=98.67,Kappa score=0.98,F1-Score=100 |
| [88] | X-ray | 一个数据库(CXR) | 219 COV-19,1341正常,1345病毒性肺炎图像 | 80%:20% | 5折 | ImageNet | 监督 | 数据增强 | 从其他肺炎中识别COV-19 | 无 | ResNet101 | Softmax | 无 | Acc=98.93,Sen=98.93,Spec=100,Acc=99.02 |
| [89] | X-ray | 一个数据库(Kaggle) | 455正常,457细菌性肺炎,470病毒性肺炎(阶段1),480病毒性肺炎(阶段2),440 COV-19图像 | 70%:10%:20% | 5折 | ImageNet | 监督 | 缩放,归一化,数据增强 | 从其他肺炎中识别COV-19 | 无 | CVDNet | Softmax | 无 | Acc=96.69 |
| [90] | X-ray | 六个不同数据库的组合 | 900 COV-19,900正常,900肺炎图像 | 70%:30% | Hold-out | ImageNet | 监督 | 缩放,将图像转换为彩色图像 | 从其他肺炎中识别COV-19 | 无 | E-DiCoNet | ELM | 无 | Acc=94.07,Sen=98.15,Spec=91.48 |
| [91] | X-ray | 三个不同数据库的组合 | 543 COV-19,600正常,600肺炎图像 | 1220–523 | Hold-out | ImageNet | 监督 | 缩放 | 从其他肺炎中识别COV-19 | 无 | AlexNet,ReliefF | SVM | 无 | Acc=98.64,Spec=98.64,Sen=98.64,F-score=98.63 |
| [92] | X-ray | 一个数据库(CXR) | 27正常,220SARS,17链球菌图像 | 80%:20% | 5折 | ImageNet | 监督 | 数据增强 | 从其他肺炎中识别COV-19 | 无 | FM-CNN | MLP | 无 | Acc=98.06,Spec=98.29,Sen=97.22,F-score=97.93 |
| [93] | X-ray | 三个不同数据库的组合 | 423 COV-19,1341正常,1345病毒性肺炎图像 | 80%:20% | 5折 | ImageNet | 监督 | 图像增强 | 从其他肺炎中识别COV-19 | 无 | VGG-19 | LMPL(大边距分段线性) | 热图可视化 | Acc=99.39,F1-score=99.45,Pre=99.47,Sen=99.42 |
| [94] | CT-Scan | 一个数据库(临床) | 368 COV-19患者,127其他肺炎患者 | 395–50–50 | Hold-out | 无 | 监督 | 数据增强 | 从其他肺炎中识别COV-19 | 无 | ResNet50 | Dense层 | 无 | Acc=76,Sen=81.1,Spe=61.5 |
| [95] | CT-Scan | 一个数据库(临床) | 1262 COV-19阳性,1230 COV-19阴性图像 | 68%:17%:15% | Hold-out | ImageNet | 监督 | 数据增强 | 从非COV-19中识别COV-19 | 无 | DenseNet201 | Sigmoid | 无 | Pre=96.29,Recall=96.29,F1-Score=96.29,Spe=96.21,Acc=96.25 |
| [96] | CT-Scan | 一个数据库(临床) | 368 COV-19患者,127其他肺炎患者 | 395–50–50 | Hold-out | 无 | 监督 | 数据增强 | 从其他肺炎中识别COV-19 | 无 | ResNet50 | Dense层 | 无 | Acc=76,Sen=81.1,Spe=61.5 |
| [97] | CT-Scan | 一个数据库(临床) | 3389 COV-19患者,4106肺癌患者 | 3997-60-600 | 5折 | ImageNet | 监督 | 肺分割,手动主动轮廓分割方法,缩放,归一化,标准化 | 从其他肺炎中识别COV-19 | 无 | 3D-ResNets(分类),3d-U-Net(分割) | Softmax | 热图可视化 | Acc=93.3,Sen=87.6,Spe=95.5 |
| [98] | CT-Scan | 一个数据库(临床) | 521 COV-19,665非COV-19患者 | 70%:20%:10% | Hold-out | ImageNet | 监督 | 肺分割,手动主动轮廓分割方法,填充,缩放,肺窗,归一化,标准化 | 从非COV-19中识别COV-19 | 无 | EfficientNet B4 | Sigmoid | 生成热图 | Acc=96,Sen=95,Spec=96 |
| [99] | CT-Scan | 一个数据库(临床) | 1272 COV-19,1230非COV-19图像 | 70%:30% | 5折和10折 | 无 | 监督 | 归一化,标准化 | 从非COV-19中识别COV-19 | 无 | PQIS-Net(分割) | 多数投票 | 基于分割的肺CT图像分类 | Acc=93.1,Pre=89,Recall=83.5,F1-Score=82.6,AUC=98.2 |
| [100] | CT-Scan | 一个数据库(临床) | 296 COV-19,1735CAP,1325非肺炎图像 | 60%:10%:30% | Hold-out | ImageNet | 监督 | 肺检测,填充图像的空白区域,使用其旋转肺区域 | 从其他肺炎中识别COV-19 | 无 | DRENet(基于ResNet-50和FPN) | 无 | Grad-CAM | Pre=93,Recall=93,Acc=93,Spec=93,F1-Score=93 |
| [101] | CT-Scan | 一个数据库(临床) | 111 COV-19,115CAP,109正常患者 | 300–15–20 | Hold-out | ImageNet | 监督 | 生成伪感染异常,重采样,缩放,归一化 | 从其他肺炎中识别COV-19 | 无 | BCDU-Net(分割),CNN(分类) | 无 | 无 | Acc=86.66,Spec=100,Sen=90.91 |
| [102] | CT-Scan | 一个数据库(临床) | 255 COV-19,420典型病毒性肺炎图像 | 无 | Hold-out | ImageNet | 监督 | 生成伪感染异常,重采样,缩放,归一化 | 从非COV-19中识别COV-19 | 无 | AM-SdenseNet(分类),U-Net(分割) | Sigmoid | 无 | Acc=99.18,Pre=99.32,Recall=98.97,F1-score=91.14 |
| [103] | CT-Scan | 一个数据库(临床) | 1601 COV-19,1626非COV-19图像 | 80%:20% | Hold-out | ImageNet | 监督 | 无 | 从非COV-19中识别COV-19 | 无 | EfficientNet和卷积块注意模块(CBAM) | SVM | 无 | Acc=98,Pre=98,Sen=98,F1-score=98 |
| [104] | CT-Scan | 一个数据库(临床) | 259 COV-19,171非COV-19患者 | 无 | 10折 | DeepLesi LIDC-IDRI | 监督 | 图像缩放,图像增强(缩放,随机翻转,随机裁剪,颜色畸变) | 从非COV-19中识别COV-19 | 无 | Prototypical Network | Relu | 无 | Acc=88.5,Pre=89.9,Recall=88.6,AUC=94.5 |
| [105] | CT-Scan, X-ray | 两个不同数据库的组合 | 3065 COV-19,3065非COV-19图像 | 70%:30% | 无 | 无 | 监督 | 数据增强 | 从非COV-19中识别COV-19 | 无 | ConvLSTM | 无 | 无 | Acc=98.45,F1-score=98.07,Mcc=96.81 |
| [106] | CT-Scan, X-ray | 两个不同数据库的组合 | 2780细菌性肺炎,1493病毒性肺炎,231 COV-19,1583正常图像 | 80%:20% | 无 | ImageNet | 监督 | 强化学习 | 从其他肺炎中识别COV-19 | 无 | U-Net(分割),Inception ResNetV2(分类) | MLP | 无 | Acc=92.18,Sen=92.11,Spec=96.06,Pre=92.38,F1-Score=92.07 |
### 讨论
在最近的冠状病毒大流行中,RT-PCR测试频繁出现假阴性结果,这会随着时间的推移而增加。由于高假阴性率,这种测试有时会将感染冠状病毒的患者误认为健康人,这会带来严重后果。在患者感染病毒的第一天,假阴性结果的概率是100%,在感染后的第四天降至67%。在第五天,即症状出现的典型时间,假阴性结果的概率是38%,在第八天降至20%。然后,它会再次上升,从第九天的21%增加到第21天的66%。因此,早期诊断工具的必要性显而易见。
胸部影像可以在缺乏RT-PCR检测的情况下用于疑似或便携式冠状病毒患者的诊断,或者在RT-PCR检测结果延迟或早期感染阶段为阴性,但有疑似冠状病毒症状的情况下使用。Benmalek等人报告了确认的冠状病毒肺炎病例的典型影像特征,这有助于疾病的早期筛查和追踪。
胸部CT扫描已被发现具有98%的敏感性,并且是诊断这种疾病的最精确方法之一。因此,胸部CT可以被视为一种可靠的补充诊断方法,帮助医生更准确地评估患者。Li等人的报告显示,在症状出现后的第五天进行初始CT扫描,可以对严重和非严重患者进行明确区分。胸部CT上的肺部异常在症状出现后的6-13天达到高峰,此时达到最高严重程度评分。另一方面,X光的敏感性为69%,用于冠状病毒诊断。然而,与CT相比,X光更快,危害更小,易于进行,成本更低。在胸部X光上检测到的放射学发现显示,在症状出现后的第5-10天达到最高严重程度。
Shazia等人指出,将深度学习技术应用于放射影像以识别新出现的冠状病毒具有潜力,可以减轻医疗从业者的工作负担,并提高冠状病毒诊断的准确性和效率。接下来,我们将讨论回顾的文章中开发的深度学习模型,以回答以下研究问题:哪些深度学习技术被用于基于医学影像的冠状病毒病检测?在胸部影像的深度神经网络训练过程中,我们可能面临哪些挑战?我们如何应对这些挑战?每种成像方式在分类和分割任务中的优缺点是什么?
### 挑战
深度学习方法需要大量的数据来构建稳健的预测模型。然而,由于冠状病毒病是一种新出现的传染病,缺乏大规模标注数据是这一领域的主要挑战。这可能导致过拟合,并降低基于深度学习的模型的准确性。为了克服这一挑战,大多数研究使用了迁移学习和图像预处理技术,如图像增强,或者结合不同的数据集,以应对冠状病毒病的数据泄漏和数据不平衡问题,并提高模型性能。然而,这些方法可能会在测试阶段导致深度学习模型性能的高方差估计。由于许多冠状病毒病预测模型描述不充分,存在高偏倚和模型过拟合的风险,因此需要更多的研究来确保这些模型在临床使用中的性能。
### 建议
在早期诊断和管理冠状病毒病方面,了解其不同的临床特征至关重要。一些研究比较了冠状病毒病患者与其他类型肺炎患者的临床表现。研究人员发现,结合背景信息、患者临床发现、症状持续时间、辅助影像发现和需要时的随访CT扫描,可以有助于差异诊断。因此,我们强烈建议开发基于深度学习的模型,这些模型利用临床文本数据,以及胸部CT和X光图像,以提供更准确的冠状病毒病诊断。尽管已有许多基于深度学习的技术被提出用于基于胸部X光图像检测冠状病毒病,但较少的研究涉及使用临床文本数据进行诊断和预测。此外,据我们所知,目前没有文献关注基于医学影像和文本数据的冠状病毒病诊断。
由于冠状病毒病的数据稀缺,深度学习在该领域的应用面临挑战。研究人员可以通过各种模型增强和数据生成技术来应对这一问题。由于更复杂的模型具有更多的超参数,它们比较浅的模型更容易过拟合。因此,调整模型复杂度以适应数据复杂度可以帮助研究人员克服过拟合问题。此外,结合多个模型的结果,即所谓的集成学习,可以提高预测的准确性。这种方法涉及将多个个体模型以某种方式组合,例如加权平均和投票。集成模型的泛化性能优于任何单个模型。
### 结论
冠状病毒病在短时间内在全球范围内迅速传播。SARS-CoV-2感染在不同人身上导致的症状从轻微到严重不等。截至2022年10月19日,世界卫生组织(WHO)报告了超过6.23亿例确诊病例,包括65
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号