伪数据集用于估计人工神经网络中的特征归因

《Scientific Reports》:Pseudo datasets estimate feature attribution in artificial neural networks

【字体: 时间:2025年11月24日 来源:Scientific Reports 3.9

编辑推荐:

  神经网络预测能力虽强但缺乏可解释性,现有方法多聚焦单特征忽略交互效应。本文提出两阶段Pseudo Datasets Perturbation Effect(PDPE)方法,通过数据扰动评估特征及其交互作用重要性,计算机模拟显示其较SHAP更准确高效,真实临床数据验证其有效性。

  

摘要

神经网络在各种分类任务中表现出卓越的预测性能。然而,由于其缺乏可解释性,这些模型的广泛应用受到了限制。因此,近年来许多研究人员专注于模型解释技术,以阐明这些“黑箱”模型的内部机制。然而,现有的解释方法主要集中在解析单个特征上,从而忽略了多个特征之间的协同效应和相互作用,这可能阻碍了对模型预测行为的全面理解。为此,本研究提出了一种两阶段解释方法,称为伪数据集扰动效应(PDPE)。该方法的基本思想是通过扰动数据并观察其对预测结果的影响来辨别特征的重要性。在结构化数据的情况下,PDPE可以在评估单个特征及其交互项的相对重要性时识别潜在的特征交互作用。与广泛认可的SHAP值方法相比,我们在模拟神经网络(这些网络近似于逻辑回归的线性关联)中的计算机实验表明,PDPE能够提供更快、更准确的解释。PDPE有助于用户理解单个特征及其交互作用对模型预测的重要性。此外,使用来自美国国家糖尿病、消化系统疾病和肾脏疾病研究所的真实数据,分析结果也显示了这种新方法的优越性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号