基于可解释人工智能的乳腺癌肿瘤恶性度快速预筛工具开发与验证

《Scientific Reports》:A simple and fast explainable artificial intelligence-based pre-screening tool for breast cancer tumor malignancy detection

【字体: 时间:2025年10月03日 来源:Scientific Reports 3.9

编辑推荐:

  为解决资源有限地区乳腺癌早期诊断困难、现有AI模型可解释性差及数据依赖性强的问题,研究人员开展了一项基于可解释人工智能(XAI)的乳腺癌肿瘤恶性度检测研究。他们利用Kaggle公开数据集,通过对比8种机器学习算法,最终开发出一种仅需4个临床特征(淋巴结受累、转移、肿瘤大小、年龄)的决策树模型。该模型在测试集上取得了91.7%的准确率,并通过SHAP分析验证了其决策逻辑的透明性。该研究为临床决策支持系统提供了一种快速、可靠且易于解释的预筛工具,尤其适用于资源匮乏的医疗环境。

  
乳腺癌是全球女性最常见的癌症之一,也是导致女性癌症相关死亡的主要原因。据国际癌症研究机构(IARC)预测,到2050年,全球乳腺癌年新发病例将达到320万,死亡病例将达到110万。早期诊断是提高患者生存率的关键,对于局部乳腺癌,五年生存率可达99%,而一旦发生转移,这一数字将骤降至27%。然而,在低收入和中等收入国家,由于成本、基础设施和专业人员短缺等问题,以钼靶为代表的筛查手段普及率低,导致大量患者确诊时已处于晚期。
尽管基于人工智能(AI)的决策支持系统在乳腺癌诊断中已展现出高达95%的准确率,但其在资源有限地区的应用仍面临两大挑战。首先,这些模型通常需要高质量、高维度的数据,对计算基础设施要求高;其次,大多数“黑箱”模型缺乏可解释性,导致临床医生难以信任其决策过程,限制了其在临床实践中的推广。
针对这一痛点,来自奥斯曼尼耶·科库特·阿塔大学的研究团队在《Scientific Reports》上发表了一项研究,旨在开发一种快速、低数据需求且高度可解释的人工智能预筛工具,用于乳腺癌肿瘤恶性度的分类。该研究巧妙地将目光投向了那些在资源匮乏地区也能轻松获取的临床参数,如年龄、肿瘤大小、淋巴结状态和转移情况,试图构建一个不依赖复杂影像学检查的辅助诊断模型。
关键技术方法
本研究主要采用了以下关键技术方法:1. 数据来源与处理:研究使用了一个公开的Kaggle数据集,该数据集包含来自213名患者的9个临床和人口统计学特征。对分类变量进行了标签编码或独热编码处理。2. 模型构建与比较:系统性地比较了8种机器学习算法,包括决策树、判别分析、逻辑回归、支持向量机(SVM)、朴素贝叶斯、K近邻(K-NN)、集成学习(RUSBoost)和人工神经网络(ANN)。3. 模型评估与优化:采用90%训练集和10%测试集的数据划分策略,并在训练集内进行十折交叉验证。使用贝叶斯优化进行超参数调优。4. 可解释性分析:采用两种方法增强模型的可解释性,一是直接可视化决策树结构,二是利用SHAP(SHapley Additive exPlanations)分析量化每个特征对模型输出的贡献度。5. 特征选择策略:采用条件特征增强策略,通过分析特征与类标签的关系(卡方检验、相关性、信息增益、基尼指数)来构建最终模型,避免过拟合。
研究结果
1. 模型性能比较与选择
研究人员首先对8种机器学习算法进行了全面的性能评估。结果显示,决策树和基于RUSBoost的集成方法均取得了最高的性能,准确率均为91.7%,F1分数在90.1%至92.8%之间,马修斯相关系数(MCC)为83.1%。尽管集成模型性能优异,但研究团队最终选择了决策树作为最终模型。这一选择主要基于决策树在可解释性、透明性、低计算成本和临床实用性方面的显著优势。决策树能够生成清晰、直观的决策规则,便于临床医生理解和验证,这对于建立临床信任至关重要。
2. 核心决策树模型与SHAP分析
研究构建的核心决策树模型结构清晰,仅使用了两个特征:受累淋巴结和肿瘤大小。其决策逻辑如下:如果存在受累淋巴结,则直接判定为恶性;如果不存在受累淋巴结,则进一步检查肿瘤大小,若大于4.5厘米则判定为恶性,否则判定为良性。该模型在测试集上达到了91.7%的准确率。
为了深入理解模型的决策依据,研究人员进行了SHAP分析。结果显示,受累淋巴结是影响模型决策的最重要特征(SHAP值:0.57),其次是肿瘤大小(SHAP值:0.017)。这一分析结果与决策树的直观结构完全吻合,从定量角度验证了模型决策的合理性。此外,SHAP分析还揭示了模型在假阴性和假阳性病例中的局限性。在假阴性病例中,受累淋巴结的SHAP值通常较低,提示模型可能难以识别微转移或影像学伪影等边界情况;在假阳性病例中,肿瘤大小的贡献度较高,表明接近4.5厘米阈值的良性肿瘤可能被误判。
3. 特征重要性分析与冗余处理
为了解释为何最终模型仅使用了两个特征,研究人员对数据集中的所有特征进行了深入分析。结果显示,受累淋巴结、转移和肿瘤大小具有最高的判别能力。然而,受累淋巴结与转移之间存在极高的相关性(r=0.885),存在信息冗余。为了避免过拟合并增强临床可解释性,模型最终保留了信息增益和基尼指数更高的受累淋巴结,而排除了转移。肿瘤大小因其独立的判别贡献而被纳入模型。年龄和绝经状态虽然排名靠前,但由于其高度相关性(r=0.709)以及为避免过拟合的考虑,最终仅保留了年龄作为更基础的生物学指标。其他特征如乳腺癌象限、侧向性和家族史在本数据集中的判别能力较低,因此未被纳入最终模型。
4. 条件特征增强与优化模型
为了探索在更大样本量下模型的潜力,研究人员构建了一个新的决策树模型,该模型排除了最主要的判别特征(受累淋巴结)。结果显示,该模型依然取得了89.6%的准确率,证明了仅使用肿瘤大小、转移和年龄也能构建有效的分类模型。SHAP分析进一步确认了转移和年龄作为重要分类器的潜力。基于此,研究人员通过条件特征增强策略,将转移和年龄整合到原始模型中,构建了最终的优化决策树模型。该模型包含四个特征:受累淋巴结、肿瘤大小、转移和年龄,其决策逻辑更加全面,在保持高准确率(91.15%)的同时,AUC(91.9%)和MCC(82.1%)等泛化指标优于使用所有特征的模型,有效降低了过拟合风险。
结论与讨论
本研究成功开发了一种基于可解释人工智能(XAI)的乳腺癌肿瘤恶性度预筛工具。该工具的核心是一个决策树模型,仅需四个易于获取的临床特征(淋巴结状态、转移、肿瘤大小和年龄)即可实现高精度分类。其决策逻辑清晰透明,与临床医生的诊断思路高度契合,为资源有限地区的早期筛查提供了强有力的支持。
该模型提供了三条核心的、可解释的决策路径:1. 存在淋巴结受累,直接判定为恶性;2. 存在转移,无论肿瘤大小,均倾向于判定为恶性;3. 在无淋巴结受累和转移的情况下,肿瘤体积大且患者年龄大,是判定为恶性的重要依据。这种结构化的决策流程不仅提供了统计分类,更模拟了临床推理过程,有助于医生进行诊断、风险分层和后续检查规划。
然而,该研究也存在一定的局限性。首先,数据集规模较小(213名患者),且缺乏分子标志物(如ER/PR、HER2)和转移亚型(如骨转移、内脏转移)等关键信息,这限制了模型对肿瘤生物学异质性的全面反映。其次,模型基于静态临床数据,无法捕捉疾病的动态演变过程。因此,该模型应被视为一种初步筛查工具,而非最终诊断或治疗规划的依据。
未来,研究团队计划利用更大规模、多中心的数据集进行外部验证,并尝试将分子标志物和转移亚型等更全面的信息整合到模型中,以进一步提升其预测能力和个性化水平。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号