LITERAS:生物医学文献综述与引文检索代理 —— 提升医学领域引文精准性与可靠性的多 AI 代理系统

【字体: 时间:2025年05月19日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  当前 LLMs 用于参考文献检索常出现不准确、灰色文献或虚构引文等问题。本研究开发多 AI 代理系统 LITERAS,整合 PubMed 检索与双向代理通信。其在 5 个医学领域表现出色,引文准确率近 99.82%, referencing accuracy 达 96.81%,显著提升 AI 辅助文献综述可靠性。

  
在生物医学研究的浩瀚海洋中,新期刊如雨后春笋般涌现,每年诞生的研究成果不计其数,这无疑标志着医学领域的飞速进步。然而,当研究者们想要从中提炼出有价值的信息撰写文献综述时,却仿佛置身于一片布满暗礁的海域 —— 大量低质量研究、非 PubMed 索引期刊论文、低分区低影响因子的文献以及过时的文章混杂其中,如同迷雾般遮挡了高质量研究的光芒。更棘手的是,传统的关键词搜索虽能在一定程度上定位相关文献,但往往耗时良久,而大型语言模型(LLMs)虽能提供细致的解释、总结研究并辅助撰写手稿,却深陷两大困境:一是 citation hallucinations(引文幻觉,即生成虚构或错误的引文)频发,二是对文献来源质量缺乏鉴别力。早期的 LLMs 如 GPT-3.5,仅有 45% 的参考文献准确,43% 存在实质性错误;即便后来的 GPT-4 与 Gemini ultra,Gemini 的准确率也仅 68%,且都难以可靠地优先引用高质量文献,这显然无法满足严谨的学术需求。

为了冲破这一桎梏,来自 Rambam 医疗园区的研究人员开展了一项颇具突破性的研究,相关成果发表在《Computers in Biology and Medicine》。他们开发了一种多 AI 代理系统 —— 文献综述与引文检索代理系统(LITERAS),旨在优化高质量文献综述的撰写和精准、可靠引文的检索。

研究人员主要采用了以下关键技术方法:开发了开源的多 AI 代理系统 LITERAS,该系统通过 PubMed 的应用程序接口对最大的生物医学文献数据库(MEDLINE)进行搜索,并利用双向代理间通信来提高引文的准确性和可靠性。

研究结果


引文准确性与 referencing accuracy 评估


通过对比 LITERAS 与当前最先进的 LLMs(Perplexity AI 的 Sonar 和 Sonar-Pro)在五个医学专科(肿瘤学、心脏病学、风湿病学、精神病学、感染性疾病 / 公共卫生)的表现发现,LITERAS 的 citation accuracy(即参考文献是否与真实出版物匹配)高达 99.82%,与 Sonar(100.00%,p = 0.065)和 Sonar-Pro(99.93%,p = 0.074)在统计学上无显著差异。而在 referencing accuracy(文内引用细节与元数据的一致性)方面,LITERAS(96.81%)显著优于 Sonar(89.07%,p < 0.001),并与 Sonar-Pro(96.33%,p = 0.139)相当。

文献来源质量对比


在文献来源质量上,LITERAS 展现出独特优势,其引用的文献完全来自 Q1–Q2 区的同行评审期刊,非学术内容占比为 0%。相比之下,Sonar 包含 35.60%(p < 0.01)的非学术来源,Sonar-Pro 也有 6.47%(p < 0.001)的非学术内容。不过,Sonar-Pro 引用的期刊影响因子更高,其中位数影响因子(IF)为 14.70,而 LITERAS 为 3.70(p < 0.001)。

多代理循环与文献时效性


LITERAS 的多代理循环机制(每个查询平均 2.2 ± 1.34 次迭代)有效减少了 hallucinations(幻觉,此处指错误生成的内容),并且始终优先选择近期文献(四分位距为 2023–2024 年)。在特定领域分析中,肿瘤学领域的 IF 差异最为显著(Sonar-Pro 为 42.1,LITERAS 为 4.3,p < 0.001),这反映出 Sonar-Pro 更倾向于引用大型联盟指南和高影响因子的元分析。

研究结论与讨论


LITERAS 在文献综述任务中,相较于基于学术搜索的 LLMs 方法,展现出更高的近期学术期刊文章检索能力,并能生成更长的总结报告。该研究凸显了多 AI 代理系统相较于单一 LLMs 的优势,表明在超出 LLMs 固有能力的任务中,开发多代理系统至关重要。这一成果为提升 AI 辅助文献综述系统的可靠性提供了宝贵的思路和方向,未来研究可聚焦于将 LITERAS 整合到临床工作流程中,进一步评估其对工作效率和准确性的影响。该研究不仅为解决当前 LLMs 在文献检索中的难题提供了有效方案,更有望推动 AI 在生物医学研究领域的深入应用,助力研究者更高效、精准地获取和利用学术资源,加速医学研究的进展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号