
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于肿瘤轮廓形态学特征与人工智能的乳腺肿瘤良恶性分类研究
【字体: 大 中 小 】 时间:2025年09月24日 来源:Computers in Biology and Medicine 6.3
编辑推荐:
本文创新性地利用预训练卷积神经网络(CNN)提取乳腺X线影像中肿瘤轮廓特征,结合多种机器学习算法(ML)进行良恶性分类,最高准确率达88.13%。研究通过数据增强与K折交叉验证(K=5)优化模型性能,为减少活检依赖和加速乳腺癌诊断提供了新思路。
Highlight
数据库
本研究采用的数据库包含100个于2024年公开的乳腺X线影像文件夹1。这些影像包含侧位和正位拍摄视角,时间跨度1-10年。每个文件夹包含4张DICOM格式的乳腺X线图像和4张标记肿瘤位置与类型的JPG格式图像。其中恶性肿瘤文件夹50个,良性肿瘤15个,健康影像35个。良性肿瘤包含纤维腺瘤、囊肿等类型,恶性肿瘤则主要为浸润性导管癌。所有图像均经过专业放射科医师标注确认。
结果
根据采用的评估方法,所有五种机器学习算法在五次重复实验中的准确率(accuracy)、精确度(precision)、特异性(specificity)和敏感性(sensitivity)结果均被单独呈现,同时展示了五种算法的组合效果。各图中结果均以算法名称加数字后缀形式标注五次实验数据(如KNN1),末行未加后缀者为平均值。
讨论
本研究的主要局限在于所用公开数据集规模较小。为减轻模型偏差,我们采用广泛的数据增强技术将数据集扩增6-8倍。但需要认识到,旋转和缩放等几何增强并不能完全复现肿瘤形态的自然生物多样性,这种对合成数据的依赖可能导致过拟合风险——模型可能学习到增强数据特有的特征而非真实的生物学特征。尽管通过K折交叉验证缓解了此问题,但在更具多样性的临床数据上进行验证仍十分必要。
临床意义与未来展望
超越统计指标,AI诊断工具的临床适用性至关重要。在乳腺癌诊断中,误诊代价存在显著不对称性:假阴性(恶性被误判为良性)可能导致诊断延误,使癌症进展至更难治愈的晚期阶段;反之,假阳性(良性被误判为恶性)则可能导致不必要的患者焦虑、侵入性活检和相关医疗费用。因此,在优化整体准确性的同时,需要特别关注敏感性指标以最小化假阴性风险。未来工作将探索集成学习(ensemble learning)技术,通过结合多个模型预测来提升鲁棒性,并开发可解释AI(XAI)方法为临床医生提供决策依据。
结论
癌症检测算法的验证存在机器学习(ML)与深度学习(DL)两种方法。ML方法需先进行肿瘤分割,再提取特征并通过算法进行分类;DL方法则可自动完成这些步骤。本研究提出了一种基于肿瘤轮廓特征提取与机器学习分类的高效算法,通过预训练CNN网络提取形态学特征,结合传统ML分类器实现良恶性鉴别。该方法为减少对全图像分析的依赖、提升计算效率提供了新途径。
生物通微信公众号
知名企业招聘