大型语言模型(LLM)在共享决策对比表生成中的应用与评估:准确性、可读性及临床可行性分析

【字体: 时间:2025年09月22日 来源:Patient Education and Counseling 3.1

编辑推荐:

  本研究评估了四种大型语言模型(LLM)和谷歌搜索流程生成膝关节置换术对比表的能力,并与人工制作的Option Grid?进行对比。结果显示LLM生成表格的准确率可达97%,但可读性较差,需人工核查。研究表明LLM在扩展循证决策辅助工具生产方面具有潜力,但需结合事实核查与反馈机制。

  

1亮点2

3主要发现4

大型语言模型(LLM)确实能够生成可用于填充对比表的回复内容。这些针对提示词的回复可以覆盖Option Grid中描述的相同主题(例如益处、副作用和恢复时间)。不过,在具体的信息条目上存在差异。例如,不同LLM生成的表格提及的副作用各不相同。LLM回复中选择特定副作用的原因尚不明确。尽管Option Grid工具中未明确说明,但其选择副作用是基于对现有证据的系统性评估,并经过临床专家审查。LLM的回复似乎依赖于其训练数据中的统计模式,而非经过验证的临床证据。此外,所有由LLM生成的表格和谷歌搜索流程得到的结果都遗漏了关于替代干预措施的信息,而这一信息对于共享决策(SDM)至关重要。人工生成的Option Grid在可读性方面表现更优,其文本更简洁,使用的句子更短,词汇更简单。

5结论6

大型语言模型(LLM)生成的对比表,其准确性比人工生成的Option Grid低3%至5%。由LLM生成的对比表可读性可能较差,并且需要额外的核查和编辑工作。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号