GuidedDE:通过基于置信度的变异对自动语音识别系统进行有针对性的黑盒对抗攻击
《Neural Networks》:GuidedDE: Targeted Black-Box Adversarial Attacks via Confidence-Guided Mutation on Automatic Speech Recognition Systems
【字体:
大
中
小
】
时间:2025年11月20日
来源:Neural Networks 6.3
编辑推荐:
针对自动语音识别(ASR)系统中的深度神经网络对抗攻击漏洞,提出基于引导差分进化的新型攻击方法。该方法通过结合梯度估计与CTC损失反馈机制,显著提升攻击成功率(90-95%)并减少查询消耗(67-73%),同时揭示ASR系统对能量密集型音素(如爆破音和摩擦音)组成的短语更敏感的特性。
近年来,随着人工智能技术的迅速发展,自动语音识别(ASR)系统在许多领域得到了广泛应用,包括智能助手、自动驾驶和医疗诊断等。然而,这些系统所依赖的深度神经网络(DNN)在面对黑盒对抗攻击时仍然存在严重的安全漏洞,成为当前研究中的重要课题。对抗攻击的本质在于通过微小但精心设计的扰动,使模型在输入数据发生改变的情况下产生错误的输出。这种攻击方式对ASR系统构成了潜在威胁,尤其是在缺乏模型内部信息的情况下,攻击者仍能通过外部手段影响系统的运行。
现有的对抗攻击方法主要分为几类,包括白盒攻击、黑盒攻击和迁移攻击。白盒攻击由于可以访问目标模型的结构和参数,通常具有较高的攻击成功率,但其应用场景有限,因为实际环境中很少有攻击者能够获得完整的模型信息。相比之下,黑盒攻击在现实环境中更为常见,因为它不需要直接访问模型的内部结构,而是通过有限的交互和查询来估计模型的行为。这类攻击方式虽然在实现上更具挑战性,但其攻击效果往往优于白盒攻击,特别是在对抗高安全性的系统时。迁移攻击则利用替代模型来生成对抗样本,再将其应用于目标模型,从而实现攻击目的。这种方法在一定程度上降低了攻击的难度,但也面临“现实差距”问题,即在实验室中生成的对抗样本难以在真实环境中有效工作。
面对这些挑战,研究者们提出了多种改进方法,其中基于查询的攻击方法因其在黑盒场景下的适用性而受到广泛关注。这些方法通常结合遗传算法(GA)和梯度估计技术,通过不断优化扰动来提高攻击成功率。然而,现有的查询基方法仍然存在两个关键问题:一是查询消耗量较高,通常需要成千上万次查询才能完成一次攻击;二是对目标攻击的机制分析不够深入,缺乏对攻击成功原因的系统性理解。为了解决这些问题,本文提出了一种新的黑盒攻击方法——引导差分进化(Guided Differential Evolution,简称Guided DE),该方法通过引入基于置信度的梯度信号,优化差分进化(DE)框架中的突变操作,从而在保持攻击效率的同时显著提高攻击成功率。
Guided DE的核心思想是将差分进化算法与置信度驱动的梯度信号相结合,使突变向量能够更精准地调整,以适应目标ASR系统的行为。差分进化算法是一种基于群体的优化方法,通过迭代改进候选解来寻找最优解。而置信度驱动的梯度信号则利用ASR模型的输出反馈,引导突变过程,使其更加高效地逼近目标。这种方法不仅能够减少查询次数,还能提高攻击的成功率,从而在实际应用中更具可行性。
在实验部分,本文对三种不同的ASR架构进行了测试,评估了Guided DE在不同场景下的表现。结果表明,Guided DE在仅需40.2k到48.9k次查询的情况下,实现了高达90%-95%的攻击成功率,这比基于遗传算法的基线方法提高了67%-73%的效率,并且攻击成功率增加了2.1倍到3倍。同时,与标准差分进化方法相比,Guided DE在攻击成功率上提升了62.4%,而在查询消耗上减少了19.3%。这些数据表明,Guided DE在提高攻击效率和成功率方面具有显著优势。
此外,本文还揭示了ASR系统在语音识别过程中的一些关键漏洞模式。研究表明,包含能量丰富的音素(如爆破音和摩擦音)的短语比以元音为主的短语更容易受到攻击。这一发现不仅有助于理解ASR系统的脆弱性,还为防御策略的制定提供了新的思路。通过深入分析语音识别过程中的能量分布和特征提取机制,本文提出了一种基于谱能量动态的对抗攻击模式,这为未来的攻击和防御研究提供了重要的理论基础。
在实际应用中,对抗攻击对ASR系统的威胁不仅仅体现在技术层面,还可能对社会安全和隐私保护造成严重影响。例如,在智能语音助手的应用场景中,攻击者可以通过精心设计的音频扰动,使系统误将隐藏命令识别为有效指令,从而实现未经授权的操作。在自动驾驶领域,对抗攻击可能导致系统错误地识别语音指令,进而影响车辆的运行安全。而在医疗诊断中,对抗攻击可能干扰语音识别系统对患者语音的准确分析,从而影响诊断结果的可靠性。
为了应对这些威胁,本文提出的Guided DE方法不仅在攻击效率和成功率上表现出色,还通过引入基于置信度的梯度信号,使攻击过程更加可控和可解释。这一方法能够有效识别ASR系统中容易受到攻击的语音特征,并通过优化突变向量来提高攻击的针对性。此外,Guided DE还能够在不同的ASR架构和数据集上保持较高的攻击成功率,这表明其具有良好的泛化能力和适应性。
在实验设计方面,本文采用了多种公开数据集和不同的ASR模型进行测试,以确保评估的全面性和准确性。通过对比实验,本文验证了Guided DE在多个方面优于现有方法,包括查询消耗、攻击成功率和计算效率。同时,本文还对Guided DE的局限性进行了分析,指出在某些情况下,攻击效果可能受到环境因素和模型结构的限制。这些分析为未来的研究提供了重要的参考,也为实际应用中的防御措施提供了方向。
总体而言,本文的研究成果不仅推动了对抗攻击方法的发展,还为ASR系统的安全性提供了新的视角。通过引入基于置信度的梯度信号,Guided DE在提高攻击效率和成功率的同时,也揭示了ASR系统在语音识别过程中的关键漏洞模式。这些发现对于构建更加安全和可靠的语音识别系统具有重要意义,同时也为相关领域的研究人员提供了有价值的参考。未来的研究可以进一步探索如何利用这些漏洞模式来提高系统的防御能力,或者开发更加高效的攻击方法,以应对不断变化的安全威胁。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号