人工智能辅助系统评价文献筛选在前列腺癌治疗心脏毒性研究中的应用与效率评估
【字体:
大
中
小
】
时间:2025年09月28日
来源:European Urology Open Science 4.5
编辑推荐:
本研究针对系统性评价(SR)文献筛选过程繁琐耗时的问题,开发了基于人工智能(AI)的INSIDE PC平台。通过与传统方法对比,证实AI筛选可显著提升效率(WSS@80%达54.0%),并通过散点图可视化实现质量分析,为循证医学研究提供了高效可靠的文献处理新范式。
随着科学文献的爆炸式增长,研究人员在进行系统性评价(Systematic Review, SR)时面临着前所未有的挑战。以前列腺癌(Prostate Cancer, PC)研究领域为例,仅PubMed数据库在2010-2024年间就收录了超过13.8万篇相关文献,且每年以3%的速度持续增长。传统的SR流程需要研究人员手动进行标题/摘要筛选和全文筛选,这个过程既劳动密集又耗时漫长——平均需要67.3周才能完成从方案注册到SR发表的整个过程。这种低效率严重阻碍了循证医学实践和临床指南的及时更新。
在此背景下,人工智能(Artificial Intelligence, AI)技术为优化SR流程提供了新的解决方案。AI能够快速分析海量数据,通过自然语言处理(Natural Language Processing)技术理解和提取非结构化文本中的关键信息。尽管已有Rayyan、Covidence等多种自动化工具被开发出来,但如何评估这些AI工具在SR工作中的效率和可靠性仍缺乏最佳实践标准。
为了解决这一问题,由Steven E. Canfield领衔的研究团队开展了一项创新性研究,比较了基于AI的INSIDE(artificial INtelligence to Support Informed DEcision making)平台与传统"金标准"方法在前列腺癌治疗相关心脏毒性SR文献筛选中的表现。该研究成果已发表在《European Urology Open Science》期刊上。
研究人员采用了几个关键技术方法:首先利用基于BERT的算法对文献进行相关性评分和排序;其次采用主动学习(Active Learning)机器学习技术,通过迭代过程不断优化筛选模型;使用工作量节省抽样(Work Saved over Sampling, WSS)指标量化筛选效率;并通过散点图可视化实现质量分析。研究数据来源于四个相关SR的传统筛选结果(共3363篇出版物,其中278篇相关),同时使用Dimensions数据库获取更广泛的文献资源(384,465篇出版物)。
3.1. Screening of publications
研究发现,传统方法通过针对性搜索获得3363条记录,其中278条为相关文献。而AI方法通过更简单、更广泛的搜索策略,从Dimensions数据库获得了384,465篇出版物,显著扩大了文献覆盖范围。在效率分析中,AI方法成功识别了所有278篇相关文献和2087篇不相关文献(共2365篇有标签文献),为后续比较分析奠定了基础。
效率分析结果显示,AI方法在识别80%和95%相关文献方面显著优于传统方法。使用第一种排序方法时,识别80%相关文献仅需审查约60%的文章(n=1411),相比传统方法节省了20.3%的工作量(WSS@80% 20.3%)。而采用主动学习方法后,效率进一步提升——仅需筛查873篇出版物就能达到80%的相关性识别,工作量节省达到54.0%(WSS@80% 54.0%),节省了1816篇文献的筛查工作。同样,在识别95%相关文献时,工作量节省也达到54.8%。
质量分析通过散点图可视化展示了不同出版物在心脏毒性和治疗密度两个关键参数上的分布情况,清晰呈现了相关、不相关和未筛查文献的比例关系。这种可视化方法不仅有助于识别更多符合条件的出版物,还能作为反馈工具优化搜索策略。研究还发现,那些仅在一个参数上得分较高的异常值出版物(如手册和书评)可以被排除在筛选范围之外,从而进一步节省时间和精力。
研究结论部分强调,基于AI的INSIDE PC方法为SR文献筛选提供了一个可靠且高效的框架,能够显著节省工作量和时间成本。这种方法特别适用于指南更新、动态系统评价(living SRs)以及为监管问题整理临床证据,支持循证决策和临床实践。虽然当前研究主要针对前列腺癌领域,但该框架有望应用于其他肿瘤类型和更广泛的临床问题。
讨论部分指出,与传统依赖针对性搜索的策略不同,INSIDE PC平台依托更广泛的Dimensions数据库,通过交互式仪表板和过滤器实现高效文献筛选,而不会遗漏相关记录。这种AI驱动的方法代表了在快速增长的出版环境中支持SR发展的更全面策略。研究还提出了评估AI平台用于SR开发的核心建议,包括使用WSS@80%和WSS@95%等标准化指标,以及结合主动学习和早期停止标准来优化筛查流程。
尽管该研究存在一些局限性,如仅使用了一种性能指标、未评估用户满意度等其他潜在指标,且AI工具的可及性和技术要求可能成为推广的障碍,但研究结果明确显示了AI方法在保持质量的同时显著节省时间的潜力。随着出版物数量的持续增长,加快文献挖掘和分析速度已成为支持临床实践的迫切需求。因此,需要进一步研究基于AI的SR方法,以优化和支持SR开发的有效演进,从而产生更及时、有效和全面的评价。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号