将数字虚假行为置于框架之中:比较用户对人工智能生成人脸的识别能力与基于信息的诈骗手段
《Addiction Neuroscience》:Framing digital inauthenticity: Comparing user detection of AI-generated faces to messaged-based scam methods
【字体:
大
中
小
】
时间:2025年12月06日
来源:Addiction Neuroscience 2.2
编辑推荐:
数字不真实性检测:图像与消息型任务对比及影响因素研究。用户对AI生成面部图像的识别能力显著低于消息型任务如钓鱼邮件和短信。认知反思和风险素养影响图像任务中的谨慎性判断,但数字素养未有效预测三种任务。性别差异存在,女性在图像任务中表现更优,男性在消息任务中更准确。研究揭示图像型不真实性更具欺骗性,需针对性干预措施。
数字不真实性的认知机制与检测能力差异研究
一、研究背景与理论框架
在数字化进程加速的背景下,基于生成式人工智能(genAI)的数字不真实性(digital inauthenticity)已成为全球性安全隐患。据联邦调查局(FBI)2025年报告显示,2024年网络欺诈造成的经济损失达160亿美元,同比上升33%。这种安全威胁正从传统的消息类诈骗(如钓鱼邮件)向图像视频类诈骗(如深度伪造)快速演变,但现有研究对两类诈骗的认知机制差异仍缺乏系统分析。
本研究基于双重信息处理理论(dual-process theory)和事实默认理论(Truth-Default Theory),构建跨模态检测能力分析框架。双重处理理论认为人类信息处理存在系统1(快速直觉)和系统2(慢速理性)两种路径,而事实默认理论强调人类存在先验的信任倾向。这些理论共同指出,数字不真实性的识别依赖于处理速度与准确性的平衡,而信任倾向可能成为安全漏洞的根源。
二、研究设计与实施
1. 研究对象
通过Prolific平台招募166名母语为英语的美国成年参与者(年龄19-75岁,男女比例接近1:1),通过注意力检测和reCAPTCHA验证筛选有效样本。人口学特征显示参与者平均年龄39.7岁,数字设备使用频率较高(DLS量表得分中位数118.8)。
2. 实验材料
- 消息类:8封钓鱼邮件(4真4假)和8条欺诈短信(4真4假),内容涵盖亚马逊、Netflix等常见平台,采用Sarno团队先前验证的刺激集(2020,2022,2024)
- 图像类:8张真实人脸与8张AI生成面部图像(StyleGAN3、Stable Diffusion等模型生成),使用Flickr-Faces-HQ和DF3数据库验证真伪
3. 测量工具
- 数字素养量表(DLS):涵盖设备安全、信息验证等6维度,Cronbach's α=0.81
- 认知反思测试(CRT):7项任务测量系统处理倾向,α=0.79
- 需求认知量表(NCS):6项评估信息处理动机,α=0.92
- 风险素养量表(RLS):7项测量风险决策能力,α=0.54
三、核心研究发现
1. 检测能力差异显著
- 消息类任务:邮件检测d'=2.07(SD=1.36),短信检测d'=2.46(SD=1.16)
- 图像类任务:面部识别d'=1.01(SD=1.29),显著低于前两者(p<0.001)
- 关键发现:图像任务正确识别率仅45%,低于消息类任务(邮件75%、短信96%),且存在负偏态分布(FA率23% vs 真实邮件29%)
2. 个体差异的跨模态影响
- 认知反思(CRT)与邮件检测正相关(r=0.25, p<0.01),但对图像检测无显著影响(r=-0.05)
- 风险素养(RLS)仅在邮件检测中显著相关(β=0.20, p<0.05)
- 性别差异:男性在短信检测中表现更优(r=-0.21, p<0.05),女性在图像检测中准确率高出15%(p<0.01)
3. 决策模式与置信度特征
- 消息类任务呈现保守决策倾向(c=-0.13),图像类任务更趋风险(c=0.64)
- 置信度评估显示:图像类任务置信区间(69.8±16.1)显著低于邮件(76.7±15.2)和短信(81.3±12.8)
- 决策一致性:82%参与者保持跨任务置信度相关性(r=0.57-0.68)
四、理论解释与机制分析
1. 双重处理机制的适用性
图像检测任务中,系统1快速判断(面部对称性、表情真实性)主导决策过程,导致78%参与者未识别AI生成的平均化面部特征。系统2的理性分析(如DLS评估)仅贡献12%检测能力,显著低于消息类任务(邮件32%、短信28%)。
2. 信任偏好的作用机制
事实默认理论在图像任务中体现更明显:参与者默认信任视觉信息(面部对称性评分与决策倾向正相关r=0.27, p<0.01),这与深度伪造技术中平均化处理( StyleGAN生成图像的对称性比真实人脸高15%)形成矛盾。
3. 风险认知的调节效应
风险素养得分高的参与者(RLS>5.5)在邮件检测中表现出更谨慎的决策倾向(c=-0.38 vs 0.23),但在图像任务中决策风险反而增加(c=0.26 vs 0.19),说明风险认知存在双刃剑效应。
五、实践启示与改进方向
1. 安全教育优化策略
- 分性别设计培训内容:女性应加强图像验证训练(如面部微表情识别)
- 分场景定制方案:邮件检测重点在文本逻辑分析(准确率提升需结合视觉线索)
- 认知反射训练:针对低CRT得分群体(<4.0),开发基于贝叶斯推理的判断训练模块
2. 技术防护体系升级
- 构建多模态验证机制:将面部微表情分析(准确率提升至68%)与文本语义检测(准确率89%)结合
- 动态生成对抗网络(GAN)检测器:针对StyleGAN3模型,开发基于生成对抗网络架构的识别工具
- 实时置信度评估系统:当用户决策置信度<70%时自动触发二次验证流程
3. 组织防护策略
- 建立分层防御体系:基础层(自动化过滤90%低风险内容)+ 应用层(人工审核重点场景)+ 用户教育层
- 实施动态风险评估:根据用户个体差异(如NCS得分、性别特征)调整防护策略
- 构建威胁情报共享网络:整合跨平台检测数据(如邮件、图像、视频)的关联分析
六、研究局限性与发展方向
1. 现存局限
- 样本代表性:仅覆盖美国英语母语者,跨文化差异未充分验证
- 刺激规模限制:小样本(N=166)导致效应量估算偏差(Cohen's d=0.3-0.5为中等效应)
- 测量工具信度:RLS量表α=0.54,需开发更精准的风险认知评估工具
2. 未来研究方向
- 多模态融合检测:构建文本、图像、视频联合分析模型
- 认知偏差量化:开发动态认知负荷监测系统
- 基于强化学习的自适应培训:根据用户反馈实时优化训练内容
3. 跨学科研究建议
- 计算神经科学:通过fMRI研究面部识别的神经机制
- 社会工程学:模拟攻击者策略优化防御体系
- 行为经济学:设计基于前景理论的激励干预方案
本研究揭示了数字不真实性检测能力的显著模态差异,为构建分层防御体系提供了理论依据。后续研究需着重解决跨文化效度、刺激难度梯度控制、多维度风险评估等关键问题,推动从被动防御到主动免疫的安全范式转变。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号