综述:大型语言模型在药物相互作用分析能力方面的系统性图谱评价

【字体: 时间:2025年10月09日 来源:Fly 2.2

编辑推荐:

  本综述系统评价了大型语言模型(LLM)在药物相互作用(DDI)分析中的应用。研究表明,以ChatGPT-4.0为代表的公开LLM在识别潜在DDI方面展现出一定能力,但准确性存在波动,亟需开发专门用于DDI检测的标准化工具以提升用药安全。

  
背景
药物相互作用(DDI)是全球公共卫生领域的重要问题,直接影响患者安全与治疗结局。随着大型语言模型(LLM)——例如ChatGPT、Bing AI和Google Bard等——在医疗健康领域的应用日益广泛,其作为便捷的辅助工具用于DDI分析的潜力引起关注,然而其实际效能尚不明确。本项研究通过系统性综述,对基于LLM的聊天机器人在识别DDI方面的表现证据进行全面评估。
方法
本研究遵循PRISMA指南进行系统综述(PROSPERO注册号:CRD420251020360),检索时限为2015年1月1日至2025年3月31日,覆盖PubMed、Scopus与Web of Science三大数据库。纳入标准明确限定为使用公开可用的LLM聊天机器人进行DDI检测的相关研究,以确保证据的实用性与可重复性。
结果
共纳入9项发表于2023至2025年间的研究,这些研究评估了多种主流LLM聊天机器人在DDI识别任务中的表现。方法类型多样,涵盖患者层面的多药并用筛查、单一药物核查以及基于临床案例的情景测试。结果显示,不同聊天机器人性能差异显著:ChatGPT,尤其是其4.0版本,能够识别较多潜在DDI,但准确性存在较大波动;相比之下,Bing AI和Google Bard的表现可靠性较低,一致性与覆盖范围均不及ChatGPT。
结论
当前公开可用的LLM聊天机器人在检测DDI方面表现出部分有效性,但整体效果不一致且尚未达到可靠临床应用的标准。因此,亟需开发专用于DDI识别、且可免费获取的专业化聊天机器人工具。未来的研究方向应集中于制定统一的性能评估标准、扩大模型的可及性,并进一步推动LLM在临床用药安全实践中的落地应用。
Prospero
本系统综述已在PROSPERO平台注册,编号为CRD420251020360。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号