咨询“数字医生”:ChatGPT-3.5在解答与糖尿病足溃疡护理相关问题方面的有效性
《Advances in Skin & Wound Care》:Consulting the Digital Doctor: Efficacy of ChatGPT-3.5 in Answering Questions Related to Diabetic Foot Ulcer Care
【字体:
大
中
小
】
时间:2025年09月29日
来源:Advances in Skin & Wound Care 1.7
编辑推荐:
糖尿病足溃疡(DFU)患者使用ChatGPT-3.5获取护理问答的效果评估。通过11个分类问题测试,AI平均准确度8.7分,但存在3次错误信息,10次遗漏关键内容(如DVT症状、术后鞋具重要性)。回答平均 readability为11.9年级水平,高于美国平均4个年级。AI虽能提供一般信息,但存在误导风险,需医师监督指导。
在当前医疗技术迅速发展的背景下,人工智能(AI)的应用正在改变传统的医疗服务模式。随着AI技术的普及,特别是像ChatGPT-3.5这样的大型语言模型(LLM)的出现,患者在获取医疗信息方面有了更多便捷的选择。这类工具能够以自然语言的方式回应用户的问题,提供信息,甚至在某些情况下帮助患者理解复杂的医学概念。然而,AI在医疗领域的应用仍处于探索阶段,其信息的准确性、全面性和安全性是必须认真考量的问题。
本研究聚焦于糖尿病足溃疡(DFU)这一常见且严重的慢性疾病,评估了ChatGPT-3.5在回答DFU相关常见问题方面的表现。DFU是一种影响全球数百万糖尿病患者的疾病,其管理复杂且关键,因为未经治疗的DFU是下肢截肢的主要原因,还与较高的死亡风险相关。因此,患者对DFU的了解和管理能力直接关系到其预后和生活质量。为了更好地满足患者的需求,研究者选择了11个与DFU护理和治疗相关的问题,这些问题涵盖了伤口护理、症状识别以及手术管理等多个方面,并以“我有糖尿病并且脚上有慢性伤口”作为前提进行提问。
在评估过程中,研究团队使用了四种塑料外科医生作为评估者,对ChatGPT-3.5的回答进行了评分,分别从准确性、全面性和潜在危险性三个方面进行考量。评分标准为10分制,其中准确性表示回答是否包含正确信息,全面性衡量回答是否涵盖了所有必要的内容,而潜在危险性则评估回答是否可能对患者造成伤害。此外,研究还采用了多种阅读难度评估工具,以衡量ChatGPT-3.5的回答是否适合普通患者理解。结果显示,ChatGPT-3.5的回答平均阅读难度为11.9,接近美国平均阅读水平的4个年级之上,这表明其语言风格较为复杂,可能难以被所有患者接受和理解。
从评分结果来看,ChatGPT-3.5在准确性方面表现良好,平均得分为8.7,说明其在回答问题时基本提供了正确的信息。然而,在全面性方面,得分仅为8.0,说明虽然回答涵盖了大部分内容,但仍然存在遗漏。例如,某些回答未能提及重要的临床信息,如深静脉血栓(DVT)的症状、影响肢体保留的合并症等。此外,在潜在危险性方面,得分仅为2.2,说明回答中存在一些可能误导患者的内容,如对疼痛药物的使用缺乏警告,或者对某些情况的处理建议不够具体。
尽管ChatGPT-3.5在某些方面表现不错,例如其语言表达的简洁性和信息的可读性,但研究者也指出了其局限性。首先,ChatGPT-3.5的回答缺乏个性化,无法根据患者的具体情况(如糖尿病控制状况、合并症、既往治疗等)提供量身定制的建议。这种缺乏个体化的回答可能使某些患者无法获得适合自己的护理方案,从而延误治疗。其次,ChatGPT-3.5在回答某些问题时存在不一致的情况,部分问题的回答出现了错误,而另一些问题则遗漏了关键信息。例如,在回答“我的伤口为什么会渗液”时,未能提及生物膜、细菌感染和静脉充血等重要因素,这可能导致患者对病情的误解。
此外,研究还发现,ChatGPT-3.5在手术管理方面的回答过于简化,没有充分强调基于功能的肢体保留策略,也没有提及一些重要的治疗方式,如蛆虫疗法。这种简化可能使患者低估手术的复杂性,或者对某些治疗选项缺乏正确的认识。对于DFU患者来说,这种误解可能会影响他们对治疗的依从性,甚至导致病情恶化。
在阅读难度方面,ChatGPT-3.5的回答整体上较高,这可能使得部分阅读能力较低的患者难以理解。美国约有20%的成年人在阅读第四年级的材料时会遇到困难,而患者教育材料通常建议使用第六年级以下的语言。因此,如果DFU患者的阅读能力有限,他们可能会因为无法理解ChatGPT-3.5的回答而忽视重要的健康信息,或者做出错误的护理决策。
尽管存在这些局限性,ChatGPT-3.5仍具有一定的潜力,特别是在提高DFU患者的健康素养方面。它能够以简洁易懂的方式提供基本信息,帮助患者更好地理解自己的病情和治疗方案。此外,ChatGPT-3.5的即时反馈和交互性使其成为一种有效的信息获取工具,尤其适用于那些无法频繁就诊或需要长期管理的DFU患者。然而,为了确保其有效性和安全性,医生在使用这类工具时必须保持警惕,尤其是在患者自行寻求信息时,需要提供适当的指导和解释。
未来的研究可以进一步探讨如何优化AI工具,使其更符合患者的阅读水平和理解能力。例如,通过使用更简单的语言、增加视觉辅助材料或引入多语言支持,可以提高信息的可及性和适用性。同时,AI工具的开发也需要考虑患者的个体差异,例如不同的文化背景、语言能力以及健康状况,以确保其提供的信息既准确又适合患者的需求。
综上所述,ChatGPT-3.5在DFU护理信息的提供方面具有一定的优势,但也存在明显的局限性。它在准确性方面表现良好,但在全面性和安全性方面仍有待提高。对于DFU患者而言,虽然AI可以作为辅助工具,但不能替代专业医生的建议和指导。因此,医生在临床实践中应主动向患者介绍AI工具的优缺点,帮助他们正确使用这些工具,并在必要时提供进一步的解释和指导。此外,AI工具的持续改进和优化也是未来医疗信息化发展的重要方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号