利用注意力增强型深度学习,从全景X光片中对牙齿状况进行多标签诊断

《Oral and Maxillofacial Surgery》:Multi-label diagnosis of dental conditions from panoramic x-rays using attention-enhanced deep learning

【字体: 时间:2025年10月08日 来源:Oral and Maxillofacial Surgery 1.7

编辑推荐:

  本研究开发并评估了用于全景X光片多类牙科状况分类的自动化深度学习模型,比较了自定义CNN、预训练模型及混合方法的效果。实验采用1512张X光片的预处理和5折交叉验证,结果显示混合模型(CNN+随机森林)准确率最高达90.6%,预处理普遍提升性能,自定义CNN(含注意力机制)优于传统方法。

  

摘要

目的

本研究旨在开发和评估用于全景X光图像中牙齿状况多类别分类的自动化深度学习模型,比较了带有注意力机制的自定义CNN架构、预训练模型以及混合方法的有效性。

方法

对1,512张全景牙科X光图像进行了预处理,通过分割处理生成了4,764张在四个类别(填充物、龋洞、种植牙和阻生牙)上平衡的图像。应用了数据增强和预处理技术,包括亮度调整、CLAHE增强和归一化。评估了多种架构:带有注意力机制的自定义CNN、集成注意力机制的预训练模型(VGG16、ResNet50、Xception),以及混合CNN-机器学习方法(CNN + SVM、CNN + 随机森林、CNN + 决策树)。性能评估采用了5折交叉验证,指标包括准确率、精确度、召回率和F1分数以及ROC-AUC。

结果

经过预处理的混合CNN + 随机森林模型取得了最佳性能:准确率为90.6%,ROC-AUC为0.987,F1分数为0.906。预处理显著提高了所有架构的性能,准确率提升幅度从6.3%(VGG16)到19.4%(ResNet50)不等。带有注意力机制的自定义CNN的准确率为86.0%,优于传统的CNN方法(76.0%)。在预训练模型中,经过预处理的Xception准确率为79.8%。

结论

与端到端深度学习模型相比,混合CNN-机器学习方法在牙齿状况分类方面表现更优。然而,临床应用需要解决数据集中缺乏正常/健康病例的问题,并在多样化的临床人群中进行前瞻性验证研究,以确定其在实际应用中的有效性和安全性。

目的

本研究旨在开发和评估用于全景X光图像中牙齿状况多类别分类的自动化深度学习模型,比较了带有注意力机制的自定义CNN架构、预训练模型以及混合方法的有效性。

方法

对1,512张全景牙科X光图像进行了预处理,通过分割处理生成了4,764张在四个类别(填充物、龋洞、种植牙和阻生牙)上平衡的图像。应用了数据增强和预处理技术,包括亮度调整、CLAHE增强和归一化。评估了多种架构:带有注意力机制的自定义CNN、集成注意力机制的预训练模型(VGG16、ResNet50、Xception),以及混合CNN-机器学习方法(CNN + SVM、CNN + 随机森林、CNN + 决策树)。性能评估采用了5折交叉验证,指标包括准确率、精确度、召回率和F1分数以及ROC-AUC。

结果

经过预处理的混合CNN + 随机森林模型取得了最佳性能:准确率为90.6%,ROC-AUC为0.987,F1分数为0.906。预处理显著提高了所有架构的性能,准确率提升幅度从6.3%(VGG16)到19.4%(ResNet50)不等。带有注意力机制的自定义CNN的准确率为86.0%,优于传统的CNN方法(76.0%)。在预训练模型中,经过预处理的Xception准确率为79.8%。

结论

与端到端深度学习模型相比,混合CNN-机器学习方法在牙齿状况分类方面表现更优。然而,临床应用需要解决数据集中缺乏正常/健康病例的问题,并在多样化的临床人群中进行前瞻性验证研究,以确定其在实际应用中的有效性和安全性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号