Choerospondias axillaris:其临床应用、植物化学特性的综述及其作为潜在心血管治疗药物的探究

《Acupuncture and Herbal Medicine》:Choerospondias axillaris: a review of its clinical application, phytochemistry, and an investigation into its potential cardiovascular therapy

【字体: 时间:2025年09月29日 来源:Acupuncture and Herbal Medicine 4.3

编辑推荐:

  硬膜外麻醉患者教育中,大型语言模型(如ChatGPT和MediSearch)在可靠性与可读性上的权衡研究。采用100个基于Rothwell系统的分类问题,评估发现MediSearch在DISCERN可靠性评分(P<0.0001)上显著优于ChatGPT,但后者在Flesch-Kincaid可读性(P=0.0013)和Coleman-Liau指数(P<0.001)上更优,反映可靠性与可读性的对立矛盾。

  本研究聚焦于探讨大型语言模型(LLMs)在患者教育中的应用潜力,特别是针对分娩过程中常用的硬膜外麻醉(epidural analgesia)这一主题。硬膜外麻醉是一种区域麻醉技术,通过将局部麻醉药物(有时结合阿片类药物)注入脊椎周围的硬膜外间隙,阻断疼痛信号的传递,从而减轻分娩时的疼痛。在美国,这种技术的使用率非常高,约有79%的初产妇和64%的经产妇选择在分娩过程中使用硬膜外麻醉。尽管其普及度很高,但患者往往对这种技术的利弊、适用范围及可能的并发症了解有限。因此,提供清晰、准确且易于理解的患者教育材料变得尤为重要。

随着互联网技术的发展,越来越多的患者倾向于通过数字平台获取健康信息,而大型语言模型如ChatGPT和MediSearch正逐渐成为这一领域的有力工具。ChatGPT是由OpenAI开发的一种对话式模型,它基于海量文本数据进行训练,能够生成自然流畅、贴近人类语言的回应。尽管ChatGPT并非专门针对医疗领域设计,但其在处理复杂问题和将专业内容转化为通俗语言方面的表现,使其在患者教育中具有一定的应用前景。相比之下,MediSearch是专门为医疗环境开发的模型,其设计目标是能够从庞大的医学文献和临床数据中筛选出相关信息,提供更加精准和基于证据的医学信息。

本研究通过分析100个与硬膜外麻醉相关的患者提问,评估了ChatGPT和MediSearch在提供可靠且易懂信息方面的表现。这些提问是从Google的“People Also Ask”功能中提取的,该功能展示了用户在搜索特定主题时所提出的常见问题。为了确保数据的准确性,研究者对这些问题进行了去重处理,最终形成了一个包含100个独特问题的集合。这些问题按照Rothwell分类系统被划分为政策类、事实类和价值类,分别对应不同的信息需求和认知层面。

在评估过程中,研究采用了两种主要方法:一是使用改良版的DISCERN评分系统来衡量信息的可靠性和平衡性;二是通过Flesch-Kincaid Grade Level和Coleman-Liau Index两个指标来评估文本的可读性。DISCERN评分系统是一种经过验证的工具,用于评估消费者健康信息的质量,主要包括五个二元判断标准,如信息是否清晰、是否使用了可靠的来源、信息是否平衡等。而Flesch-Kincaid Grade Level和Coleman-Liau Index则是衡量文本复杂程度的常用指标,前者通过句子长度和词汇复杂度来判断所需阅读能力,后者则主要关注句子长度和单词长度。

研究结果显示,MediSearch在DISCERN评分上显著优于ChatGPT(P < .0001),表明其在提供可靠信息和避免偏倚方面表现更为出色。然而,ChatGPT在可读性方面表现更好,其Flesch-Kincaid Grade Level和Coleman-Liau Index评分均低于MediSearch(P = .0013,P = 7.257 × 10^-10)。这表明,虽然ChatGPT生成的信息更容易被患者理解,但在信息来源的可靠性方面存在不足,而MediSearch虽然在科学准确性上更具优势,但其语言风格较为复杂,可能对部分患者造成理解困难。

从Rothwell分类的角度来看,政策类问题(如“是否应该接受硬膜外麻醉?”)和价值类问题(如“硬膜外麻醉的效果如何?”)的可读性评分在两个模型之间存在显著差异。对于政策类问题,MediSearch的 Coleman-Liau Index评分高于ChatGPT,这可能意味着MediSearch提供的信息更为专业,但同时也更难被普通患者理解。而价值类问题的可读性评分则进一步升高,显示出MediSearch在处理这类需要深入分析的问题时,语言的复杂性更加明显。相比之下,事实类问题(如“硬膜外麻醉能持续多久?”)的可读性评分差异相对较小,但ChatGPT在这些问题上的表现仍然略逊于MediSearch。

这些发现凸显了一个关键挑战:如何在确保信息可靠性的同时,提高其可读性,使不同教育背景和健康素养水平的患者都能从中受益。在美国,约有54%的成年人健康素养水平低于六年级,这意味着即使是有基本读写能力的患者,也可能难以理解某些医学信息。因此,患者教育材料的可读性对于提升医疗决策的质量至关重要。

值得注意的是,尽管ChatGPT在可读性方面表现更佳,但其在信息来源的可靠性上明显不足。研究者发现,ChatGPT生成的信息缺乏明确的参考文献或来源引用,这可能会影响其信息的可信度。而在MediSearch的回应中,研究者观察到其内容更倾向于引用医学文献和临床数据,从而增强了信息的权威性和可信度。这种差异可能源于两个模型的设计初衷不同,ChatGPT更注重自然语言的表达和用户友好性,而MediSearch则专注于提供基于证据的医学信息。

然而,这种差异也带来了潜在的问题。例如,MediSearch的复杂语言可能对低健康素养的患者构成障碍,使其难以充分理解信息内容。相反,ChatGPT虽然在可读性方面更优,但其信息的科学性和准确性可能无法满足专业医疗需求。因此,选择合适的模型作为患者教育工具,需要根据目标受众的特点进行权衡。

此外,本研究还发现,尽管两个模型在某些方面表现不同,但它们在整体上都未能完全满足患者对信息的多样化需求。例如,对于需要深入解释的复杂问题,MediSearch可能提供更全面的信息,但其语言风格对部分患者来说可能不够友好。而对于需要快速获取信息的患者,ChatGPT可能更加便捷,但其信息的可靠性可能不够。这种现象提示我们,未来在开发和应用大型语言模型进行患者教育时,需要进一步优化模型的输出,使其在科学准确性与可读性之间取得更好的平衡。

研究还指出,当前的LLMs在医疗教育领域的应用仍处于初步阶段,尤其是在麻醉学这样的专业领域。虽然已有研究探讨了LLMs在手术信息传播中的作用,但针对硬膜外麻醉等具体医疗程序的教育工具仍需进一步探索。此外,研究者还提到,未来的研究可以考虑引入更多LLMs,扩大问题集的范围,并评估其在不同医学专科中的表现。这将有助于更全面地了解LLMs在医疗教育中的潜力,并为未来的临床应用提供更坚实的理论基础。

本研究的一个重要局限性在于,仅限于评估了两个免费版本的LLMs,且问题集的数量相对有限。这意味着研究结果可能无法完全代表所有LLMs的表现,也可能无法覆盖更广泛的医疗主题。此外,研究并未评估LLMs生成信息的准确性,这在未来的探索中可能是一个重要的方向。准确性是患者教育的核心要素之一,如果LLMs生成的信息存在错误,可能会对患者的医疗决策产生负面影响。因此,未来的研究需要进一步验证LLMs在提供医疗信息时的准确性,并探索如何提高其信息的科学性和可靠性。

另一个局限性是,本研究并未探讨LLMs在实际医疗场景中的应用效果。例如,患者是否真正使用这些工具来获取信息,以及他们在使用过程中是否能够有效理解并应用这些信息,这些都是值得进一步研究的问题。此外,研究者还提到,未来可以探索将LLMs与医疗机构网站链接,以提供更及时和更新的信息,从而弥补传统患者教育材料的局限性。

总的来说,本研究为LLMs在患者教育中的应用提供了重要的实证依据。它不仅揭示了ChatGPT和MediSearch在硬膜外麻醉教育中的表现差异,还强调了在选择和使用这些工具时需要考虑的多个因素。研究者认为,随着AI技术的不断发展,如何在保证信息可靠性的同时提高其可读性,将成为LLMs在医疗教育中应用的关键。未来的研究可以进一步优化这些模型,使其在科学性和易读性之间取得更好的平衡,从而更好地服务于患者教育的需求。

在医疗领域,患者教育的质量直接影响到医疗决策的科学性和安全性。如果患者能够准确理解硬膜外麻醉的利弊、适用范围以及可能的并发症,他们将更有可能做出符合自身健康需求的选择。因此,开发可靠的、易于理解的患者教育工具,对于提升医疗服务质量具有重要意义。大型语言模型作为新兴的数字工具,有望在这一领域发挥重要作用,但其应用仍需谨慎评估,并结合具体场景进行优化。

此外,本研究还突出了健康素养在患者教育中的重要性。由于许多患者可能缺乏足够的医学知识,他们需要的信息必须以简单明了的方式呈现。然而,目前的LLMs在这一方面仍存在不足,尤其是那些专注于科学准确性的模型,其语言风格可能过于专业,难以被普通患者接受。因此,未来的LLMs开发应更加注重用户的认知水平和健康素养,确保信息既准确又易于理解。

最后,研究者强调,AI技术在医疗教育中的应用仍处于探索阶段,需要更多的实证研究来验证其效果。尽管LLMs在信息生成和传播方面展现出巨大的潜力,但其在医疗领域的应用仍需进一步研究和实践。通过不断优化模型的输出,结合用户反馈和实际需求,才能真正实现AI在医疗教育中的价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号