
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于语义结构不变性的机器翻译系统变形测试
《IEEE Transactions on Reliability》:Semantic Structure Invariance-Based Metamorphic Testing for Machine Translation Systems
【字体: 大 中 小 】 时间:2025年11月20日 来源:IEEE Transactions on Reliability 5.7
编辑推荐:
针对神经机器翻译(NMT)系统因深层神经网络脆性导致的翻译错误问题,提出基于语义结构不变性的元测试方法(SSIMT),通过分析上下文相似句子的语义结构差异检测错误,实验表明SSIMT在微软必应和谷歌翻译两大系统中检测准确率超70%,覆盖多种常见错误类型。
机器翻译是自然语言处理(NLP)的一个子领域[1],它利用计算设备自动将一种语言的文本翻译成另一种语言。近年来,深度学习的快速发展推动了神经机器翻译(NMT)的进步,NMT通过端到端的学习方法直接在源语言和目标语言之间使用深度神经网络[2]。NMT已在工业领域得到广泛应用。2016年,Google Translate的日翻译量超过了1000亿词,并拥有数亿用户[3];2021年,Google Translate在Android平台上的安装量达到了10亿次[4]。然而,NMT系统并不像用户期望的那样完美。由于神经网络的脆弱性,各种机器学习系统可能会产生次优甚至错误的输出[5]。相应地,机器翻译系统也可能返回不准确或不恰当的翻译结果,可能导致误解、经济损失、医疗事故、政治冲突,甚至对个人安全构成威胁[6]。据报道,2017年一名巴勒斯坦人在Facebook上用阿拉伯语发布了“good morning”,但该系统错误地将其翻译成希伯来语的“attacked them”,导致他被以色列警方逮捕[7]。
生物通微信公众号
知名企业招聘