GraphCleanse：通过对比训练防御图学习中的后门攻击

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《IEEE Transactions on Information Forensics and Security》：GraphCleanse: Defending Backdoor Attacks in Graph Learning via Contrastive Training

【字体：大中小】 时间：2025年11月24日 来源：IEEE Transactions on Information Forensics and Security 8

编辑推荐：

　　针对图神经网络（GNNs）的后门攻击问题，提出GraphCleanse方法。该方法通过图对比训练削弱后门特征与标签的关联，并采用互信息最大化策略提升模型性能，在四组基准数据集上验证其有效性。

摘要：

图神经网络（GNNs）极易受到多种对抗性攻击的影响，其中后门攻击是最难应对的类型之一，因为它会导致模型分类错误。与深度神经网络（DNNs）类似，GNNs中的后门攻击是通过攻击者修改图数据的一部分，并将标签替换为目标标签来实现的，这会使模型在训练过程中学习到这些触发特征。尽管最近出现了一些防御技术，但基于可解释性和数据隔离的方法往往无法检测到带有隐蔽触发器的恶意样本，而差异学习方法则可能因去除有用特征而降低模型性能。为了克服这些限制，我们提出了一种名为GraphCleanse的新型后门防御方法，该方法能够在训练过程中有效消除潜在的后门特征。具体而言，GraphCleanse利用图对比训练轻松打破后门特征与目标标签之间的强相关性。为了进一步提高模型准确性，我们提出了一种互信息最大化方法，通过聚类图对比编码器获取的特征来学习标记为可信的样本和未标记的可疑样本中的重要特征信息。与随机平滑等潜在解决方案相比，GraphCleanse能够在保持高模型性能的同时有效避免后门样本的负面影响。在四个基准数据集上的广泛实验评估表明，GraphCleanse可将攻击成功率降低到10%，同时性能下降幅度不超过7%。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号