共同设计健康教育干预能否提升公众对ChatGPT健康咨询的批判性思维?一项随机对照试验的启示

《npj Digital Medicine》:Can co-designed educational interventions help consumers think critically about asking ChatGPT health questions? Results from a randomised-controlled trial

【字体: 时间:2025年11月19日 来源:npj Digital Medicine 15.1

编辑推荐:

  本期推荐一项发表于《npj Digital Medicine》的创新研究。针对公众日益依赖ChatGPT进行健康咨询却缺乏风险意识的现状,悉尼大学研究团队通过共同设计开发了动画与图像两种健康教育材料。随机对照试验显示,干预组(特别是动画组)对高风险健康场景的ChatGPT使用意愿显著降低(动画组M=2.42/5 vs 对照组M=3.12/5, p<0.001),同时提升了AI健康素养知识得分(动画组M=4.13/5 vs 对照组M=3.14/5)。该研究为开发适应人工智能时代的健康素养干预措施提供了首创性实证依据。

  
当ChatGPT等生成式人工智能工具逐渐成为公众获取健康信息的新渠道时,一场静默的医疗革命正在发生。2024年上半年,已有十分之一的澳大利亚人使用ChatGPT咨询健康问题,另有三分之一人群表示将在未来半年内尝试。更令人警觉的是,其中超过半数用户咨询了本需专业临床建议的问题,如疾病诊断或分诊。这种趋势随着谷歌在百余个国家搜索结果显示中引入"AI概览"功能而加速蔓延,使生成式AI渗透至最主流的互联网工具中。
尽管ChatGPT能显著提升健康信息的可读性,尤其GPT-4等新版模型在保持高准确性的同时可将内容阅读等级控制在目标水平,但研究显示其准确性存在显著波动。对于需要批判性思维、情境意识(个人/社会背景与医疗史)、地区指南认知的复杂健康问题,以及罕见病咨询等场景,AI的准确性明显降低。更严峻的是,通用型ChatGPT模型未经过专门医学训练,可能产生包含事实性错误的"幻觉",如错误的用药指导,这对患者安全构成实质风险。
悉尼大学健康素养实验室团队意识到,在健康素养与数字素养框架日益完善的今天,尚未有研究专门探讨如何培养公众安全使用生成式AI的工具的技能。为此,他们开展了世界上首项评估共同设计健康教育干预措施效果的随机对照试验,旨在帮助公众批判性反思使用ChatGPT进行健康咨询的行为。特别将研究对象聚焦于无大学学历的成年人群体,因该群体更可能面临健康素养局限,却又是最能从可及的健康信息中获益的人群。
研究方法核心包括通过在线面板招募619名澳大利亚成年人,按1:1:1随机分为三组:动画干预组(观看3分40秒教育动画)、图像干预组(浏览7张信息图集)和对照组(观看政府健康饮食信息图)。主要结局指标是参与者在"低风险"(如了解疾病知识)和"高风险"(如解读检验结果、症状诊断)健康场景下使用ChatGPT的意愿度(5点李克特量表)。次要结局包括ChatGPT知识得分(5项测试题)和对工具的信任度变化。
主要研究结果显示,动画干预组在高风险场景下的ChatGPT使用意愿(M=2.42)显著低于图像组(M=2.69, p=0.010),两组均显著低于对照组(M=3.12, p<0.001)。而在低风险场景中,三组间无显著差异(p=0.800),表明干预措施成功帮助参与者区分不同风险层级的健康咨询场景。
知识评估方面,动画组ChatGPT知识得分最高(M=4.13),显著高于图像组(M=3.7)和对照组(M=3.14)。在信任度变化上,控制基线值后,动画组对ChatGPT的信任度最低(M=2.58),图像组次之(M=2.84),两组均显著低于对照组(M=3.17)。
亚组分析发现,在低风险场景中,健康素养有限/临界、自评数字健康素养较低、基线ChatGPT信任度较低的参与者使用意愿普遍较低。高风险场景中,对照组和图像组内低信任度参与者的使用意愿显著低于高信任度参与者,而动画组中这一差异不明显,提示动画干预可能减弱了信任度对使用决策的影响。
干预措施接受度评估显示,动画的感知有效性评分(3.87/5)高于图像(3.56/5),两组参与者均表现出较高的资源分享意愿(动画组4.77/7,图像组4.45/7)和实用性认可(动画组4.07/5,图像组3.93/5)。
本研究通过共同设计方法开发的健康教育资源,首次证实简短在线干预可有效提升公众对AI健康咨询风险的辨识能力。特别值得关注的是,动画形式在知识传递、风险意识培养和信任度调节方面均优于静态图像,为未来健康传播策略提供了重要参考。随着ChatGPT搜索功能开始整合实时信息源,用户对信息质量的批判性评估能力变得愈发关键。
研究局限性包括缺乏经验证的AI健康素养评估工具,意图测量未必完全转化为实际行为改变,且受控环境与真实社交媒体场景存在差异。未来研究可考虑将内容适配于不同文化语言群体,扩展至Gemini、Co-Pilot等其他AI工具,并探索通过意见领袖传播等增强策略。
这项发表于《npj Digital Medicine》的研究标志着健康素养研究正式迈入人工智能时代,为构建包容、公平的AI健康素养教育体系奠定了基石。随着生成式AI在医疗健康领域的深度融合,培养公众的批判性思维技能已成为数字健康时代保障患者安全的重要防线。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号