多模态AI系统提升青光眼诊断中的医患信任与诊断准确性:一项基于验光师协作环境的研究
【字体:
大
中
小
】
时间:2025年09月30日
来源:Computers in Biology and Medicine 6.3
编辑推荐:
本研究针对AI系统在青光眼诊断中如何通过数据模态设计影响临床医生信任与决策准确性的关键问题,开展了基于多模态与单模态AI系统的对比研究。通过20名验光师的实证分析发现,多模态AI系统在信任评分(3.98 vs 3.00, p<0.001)和诊断性能(F1分数43.1% vs 37.3%)上均显著优于单模态系统,且其输入数据模态(IDM)、信息质量(IQ)、技术准确性(TA)、输出可解释性(OE)和系统质量(SQ)五大信任靶点均获得更高评价。该研究为构建符合临床认知流程的AI协作系统提供了重要设计依据,对推进医疗AI的临床落地具有显著意义。
随着人工智能技术在医疗领域的快速融合,特别是在眼科青光眼诊断这类复杂场景中,人机协作的有效性已成为关注焦点。青光眼作为全球不可逆性失明的主要病因,其诊断依赖多源数据的综合研判,包括眼底成像、光学相干断层扫描(OCT)、视野检查及患者历史数据等。尽管AI系统在诊断准确性上不断提升,但其实际临床应用仍面临关键挑战:医生对AI系统的信任程度直接影响其使用意愿和诊断效果,而信任的建立又与AI所采用的数据模态密切相关。现有研究多集中于技术性能优化,却较少探讨数据模态设计如何影响医生的认知信任和决策行为,尤其缺乏在真实临床协作环境中的实证依据。
为深入探究这一问题,来自加拿大滑铁卢大学系统设计工程系的研究团队在《Computers in Biology and Medicine》上发表了一项创新性研究。他们通过构建单模态(仅基于眼底图像)与多模态(整合眼底图像、OCT、视野数据及患者历史信息)两类AI模拟系统,在青光眼诊断场景中开展了对照实验,旨在揭示数据模态对验光师信任水平和诊断绩效的影响机制。
研究团队采用了多种关键技术方法:首先基于真实临床数据库筛选具有诊断模糊性的青光眼患者数据,经伦理审查后构建了八例包含多次访视记录的患者档案;其次利用Figma设计平台开发了高保真交互式AI模拟界面,其中多模态系统采用多智能体集成架构,能够分别处理不同数据类型并生成全局决策解释;通过为期两个月的线上实验,对20名执业验光师进行了重复测量的组内设计研究,采集了包括五维度信任量表(涵盖IDM、IQ、TA、OE、SQ)、诊断决策准确性和系统信心评分等多类数据;最后采用统计软件JASP进行了问卷信效度检验、重复测量方差分析和绩效指标(准确率、精确率、召回率和F1值)计算。
研究结果显著且具有启发性。在信任评估方面,多模态系统在所有五个目标维度上均显著优于单模态系统(p<0.001),其平均信任评分达到3.98(单模态仅为3.00)。具体而言,输入数据模态(IDM)的差异最为明显(3.90 vs 2.11),表明验光师更认可多源数据的临床价值;信息质量(IQ)评分显示多模态系统提供的信息更完整相关(3.85 vs 2.90);技术准确性(TA)方面尽管两系统实际性能相同,但多模态获得更高主观评分(3.57 vs 2.61),反映其输出更符合临床预期;输出可解释性(OE)的优越性(3.94 vs 3.18)体现多模态系统能提供更透明的决策逻辑;系统质量(SQ)虽差异最小但仍达统计显著(4.65 vs 4.28)。问卷的克隆巴赫系数(α)均高于0.7,组内相关系数(ICC)大于0.5,证实测量工具可靠。
在诊断绩效方面,当AI系统预测正确时,使用多模态系统的验光师表现出更高准确率(87.5% vs 69.8%)、精确率(76.7% vs 58.8%)、召回率(72.2% vs 34.5%)和F1分数(74.1% vs 32.4%)。值得注意的是,当系统预测错误时,多模态条件下的诊断性能大幅下降(准确率15.1% vs 54.1%),但用户信心保持中等水平(3.5/5),专家验光师更倾向于采取保守诊断策略(84.6%案例归类为疑似),而新手则出现过度依赖现象。这表明多模态系统在正确时能显著提升诊断质量,但其错误可能带来更大风险,凸显了信任校准的重要性。
进一步分析发现,专家验光师能根据系统准确性调整信任水平(p=0.02),而新手则保持高信心评级,揭示经验对信任校准的关键作用。性别因素仅在IDM和TA目标上呈现交互效应(p<0.05),表明个体差异可能影响对特定系统特性的感知。
研究结论强调,多模态AI系统因更贴合临床医生的认知模型和决策流程,能有效提升信任水平和诊断绩效。这种优势源于其多源数据整合能力,既降低了认知负荷,又增强了决策透明度和信息相关性。该发现对医疗AI设计具有重要指导意义:系统开发应优先采用与临床实践一致的数据模态,通过多源信息融合和解释机制构建来促进医生信任,同时需针对不同经验使用者设计信任校准机制,防止过度依赖。未来研究需在真实临床环境中验证这些发现,并探索长期使用中的信任演化规律。这项工作不仅为青光眼诊断AI提供了设计范式,也为更广泛的人机协作系统研究奠定了方法论基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号