开发一种用于从自由文本临床记录中识别临床风险的工具:自然语言处理研究
《JMIR AI》:Developing a Tool for Identifying Clinical Risk From Free-Text Clinical Records: Natural Language Processing Study
【字体:
大
中
小
】
时间:2025年09月25日
来源:JMIR AI 2
编辑推荐:
电子病历中的自然语言处理技术用于开发退伍军人自杀风险识别工具,基于英国慈善机构20,342条临床记录,通过逻辑回归模型实现高精度分类,为临床决策提供辅助支持。
本研究由Natasha Biscoe、Daniel Leightley和Dominic Murphy三位科学家共同完成,他们来自英国的一个专注于军事健康研究的慈善组织——Combat Stress Centre for Applied Military Health Research,位于Leatherhead地区。研究的核心目标是通过自然语言处理(NLP)技术,从电子患者记录(EPRs)中开发出一种能够识别退伍军人自杀风险高低的工具。这项研究的意义在于,尽管电子患者记录在临床研究中被广泛使用,但在非营利性组织中的应用仍然有限,而退伍军人群体在心理健康问题上往往面临独特的挑战,因此该工具的开发具有重要的实际价值。
在当前的医疗环境中,识别和管理临床人群的风险是至关重要的环节。特别是在英国,国家卫生与护理卓越研究院(NICE)已明确要求临床心理服务必须制定风险管理系统,以应对患者自身的风险(如自残行为或自杀念头)以及对他人可能造成的威胁(如攻击行为或暴力倾向)。然而,传统的风险评估方法主要依赖于心理测量工具和临床访谈,这种方法在实际操作中往往受到主观判断和复杂风险因素的限制。例如,心理测量工具可能无法全面捕捉个体的心理状态变化,而临床访谈则可能因时间、资源和人员能力的不足而难以覆盖所有患者。此外,现有研究指出,虽然当前方法在识别退伍军人自杀风险方面具有一定的敏感性,但同时也存在较高的假阳性率,这在一定程度上影响了其临床应用的有效性。
随着信息技术的发展,电子患者记录作为一种丰富的数据来源,正在被越来越多地用于辅助临床决策。特别是自然语言处理技术,能够从文本数据中提取有价值的信息,从而为心理健康服务的优化提供支持。在退伍军人服务中,电子患者记录不仅包含了患者的基本信息,还涵盖了他们在治疗过程中的各种表现、风险评估结果以及与治疗相关的互动内容。这些记录通常由临床工作人员在每次与患者接触或更新患者档案时生成,因此具有较高的真实性和时效性。
为了构建风险识别工具,研究团队从该慈善组织的电子患者记录系统中提取了20,342条记录,其中包含582名退伍军人的临床风险评分,分为低风险和高风险两类。考虑到资源限制和患者隐私保护的需要,团队并未对样本进行严格的计算,而是根据现有文献中常用的训练与测试数据比例,将70%的记录用于训练模型,剩余的30%用于测试和评估。在模型训练过程中,团队对数据进行了预处理,包括去除标点符号、排除与他人风险相关的词语、剔除常用词(如停用词)以及去除可能引起混淆的表达。随后,研究团队利用TF-IDF(词频-逆文档频率)技术提取特征,并结合互信息评分筛选出最具预测性的500个特征,用于构建最终的分类模型。
在分类模型的选择上,研究团队测试了多种机器学习算法,包括支持向量机(SVM)、随机森林、人工神经网络、K近邻算法、逻辑回归以及XGBoost。通过对这些模型的10折交叉验证进行比较,研究发现逻辑回归在所有模型中表现最佳,这可能与其较高的准确率、精确率和敏感率有关。尽管其他模型在某些指标上表现优于逻辑回归,但逻辑回归在综合性能上更胜一筹,尤其是在临床决策支持工具中,其可解释性是重要考量因素。因此,研究团队最终选择了逻辑回归作为风险识别工具的核心算法。
在测试阶段,团队使用了30%的未标注数据(共6103条记录)进行模型评估。这些记录被划分为低风险(3102条)和高风险(3001条)两类。通过将模型的预测结果与临床风险评估结果进行对比,团队计算了多项关键性能指标,包括准确率、精确率、敏感率、F1分数以及Youden指数。结果显示,逻辑回归模型在这些指标上的表现分别为0.734(95%置信区间为0.712-0.756)、0.737(0.70-0.774)、0.748(0.738-0.758)、0.741(0.71-0.76)和0.734(0.72-0.75)。这些结果表明,逻辑回归模型在识别退伍军人自杀风险方面具有一定的可靠性,但其准确率仍然存在提升空间。
从记录特征的角度来看,高风险记录在词汇数量、句子数量和空格数量上均高于低风险记录。这一现象可能反映了临床医生在评估高风险患者时的记录习惯,即在面对更复杂或更严重的心理问题时,医生倾向于提供更详细的记录,以便全面评估患者的风险状况。此外,高风险记录中出现的词汇往往与自杀念头、自残行为、情绪低落、冲动行为以及过去的自杀尝试等密切相关,而低风险记录中则更多地涉及社会支持、治疗参与度、情绪稳定以及康复迹象等保护性因素。这些发现与临床实践中的风险评估标准高度一致,进一步验证了模型的有效性。
尽管逻辑回归模型在本研究中表现良好,但研究团队也指出,该工具并不能完全取代临床医生的风险评估。目前,所有风险评估工具的准确率都无法达到100%,因此在实际应用中,仍需依赖专业人员的判断。然而,该工具的开发为临床医生提供了一种辅助手段,能够从大量的电子患者记录中提取关键信息,从而帮助医生更高效地识别高风险患者。特别是在退伍军人服务中,由于患者往往在危机状态才寻求帮助,且可能存在对风险因素的隐瞒,电子患者记录中的隐性信息可能为风险识别提供额外的线索。
此外,研究团队还探讨了该工具在实际应用中的局限性。首先,由于该慈善组织的治疗标准较为严格,部分处于危机状态或高风险的退伍军人可能无法接受治疗,因此样本可能存在一定的偏差。其次,研究过程中还受到外部因素的影响,例如新冠疫情导致的治疗流程变化以及电子患者记录系统的中断。尽管团队在数据提取时尽量考虑了这些因素,但它们仍然可能对结果产生一定的干扰。最后,研究团队并未采用更为先进的深度学习模型,如基于Transformer的架构,这主要是出于对实际部署条件的考虑。许多国家的医疗系统缺乏支持复杂模型的计算资源,因此在构建风险识别工具时,团队优先选择了能够在资源受限环境中运行的模型。
研究团队认为,尽管当前的风险识别工具在某些方面存在局限,但它仍然为退伍军人心理健康服务提供了一种有价值的补充手段。通过利用电子患者记录中的自然语言信息,该工具能够捕捉到临床医生可能忽略的细节,从而帮助识别那些潜在的高风险患者。未来的研究可以进一步优化该工具,使其能够更精确地识别风险等级,并提高其在不同数据来源中的泛化能力。此外,随着计算技术的进步,未来可能会采用更为复杂的模型来提升风险识别的准确性,但在此之前,仍需确保工具的可解释性和临床适用性。
在实际应用中,风险识别工具的开发不仅有助于提高心理健康服务的效率,还能够为政策制定者和医疗机构提供数据支持,以便更好地分配资源和制定干预措施。例如,通过识别高风险患者,医疗机构可以优先安排这些患者接受更频繁的随访或更深入的评估,从而降低自杀风险的发生率。同时,该工具还可以帮助研究人员分析退伍军人群体的风险模式,进而为心理健康干预策略的制定提供依据。
总的来说,这项研究展示了自然语言处理技术在退伍军人心理健康服务中的应用潜力。通过分析电子患者记录中的文本信息,研究团队成功开发出一种能够识别自杀风险高低的工具,为临床医生提供了额外的支持。然而,该工具仍然需要在实际应用中进行进一步的测试和优化,以确保其在不同环境下的适用性和准确性。未来的研究可以探索如何将该工具推广到其他临床群体,以及如何结合更先进的计算技术来提升其性能。此外,研究团队还建议,在推广该工具时,应充分考虑临床医生的主观判断,确保工具的使用不会削弱现有的风险评估流程,而是作为一种辅助手段,提高整体的风险管理能力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号