基于卷积神经网络(CNN)和变换器架构(Transformer)的个性化且安全的用药建议
《Engineering Applications of Artificial Intelligence》:Personalized and safe medication recommendation based on convolutional neural network and transformer architecture
【字体:
大
中
小
】
时间:2025年09月19日
来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
电子健康记录(EHR)驱动的个性化安全药物推荐模型CT-PASMR,结合CNN与Transformer并行处理局部关联和长程依赖,利用GAT建模药物共现与副作用,通过联合损失平衡准确性与安全性,在MIMIC数据集上优于9种SOTA模型。
在现代医疗体系中,电子健康记录(EHRs)的积累为人工智能(AI)在医疗领域的应用提供了宝贵的数据资源。特别是在药物推荐(Medication Recommendation, MR)方面,AI技术的引入极大地推动了个性化医疗的发展。然而,现有的药物推荐模型在患者表征和药物间不良相互作用(Adverse Drug–Drug Interactions, DDIs)的处理上仍存在不足,导致推荐结果的安全性和准确性受限。因此,如何构建一个既能准确捕捉患者个体特征,又能有效避免不良药物相互作用的药物推荐系统,成为当前研究的重点。
随着EHR数据的不断丰富,基于深度学习的药物推荐方法逐渐成为主流。这些方法通常通过学习患者和药物的表示来预测最合适的药物组合。然而,传统的模型在处理复杂数据时往往存在局限性。例如,基于循环神经网络(RNN)的模型虽然能够捕捉长期的患者病史信息,但可能忽略同一就诊中不同医学事件之间的局部关联。而基于图卷积网络(GCNs)的方法则在处理药物共现和不良相互作用方面表现出色,但在捕捉长期依赖性方面存在短板。此外,现有的模型在药物推荐结果中普遍面临不良相互作用率较高的问题,这限制了其在临床实践中的应用。
为了解决上述问题,本文提出了一种基于卷积神经网络(CNN)和Transformer架构的AI药物推荐方法,称为CT-PASMR(Convolutional Transformer for Personalized and Safe Medication Recommendation)。该模型的核心思想是通过结合CNN和Transformer的并行结构(CAT),同时捕捉患者单次就诊中的局部医学事件关联以及其长期的电子健康记录依赖关系。CNN被用来提取单次就诊中不同医学事件之间的局部关系,而Transformer则负责处理患者长期的EHR数据,从而生成全面的患者表征。此外,模型还引入了图注意力网络(GATs)来处理EHR和DDI图中的药物共现与不良相互作用,使得药物表征更加安全和精准。
为了进一步提升模型的性能,CT-PASMR设计了一个联合损失函数,该函数综合考虑了药物推荐的准确性和安全性。通过这种方式,模型不仅能够生成符合患者个体特征的推荐结果,还能有效避免潜在的不良药物相互作用。实验结果表明,CT-PASMR在MIMIC-III和MIMIC-IV两个数据集上,相比九种最先进的基线模型,在包括DDI率、Jaccard指数和F1分数在内的七个评估指标上均表现出色。此外,通过消融实验和进一步分析,研究验证了CAT和GAT模块在提高推荐结果的安全性和个性化方面的重要性。
在实际应用中,药物推荐不仅仅是简单的预测任务,它还涉及复杂的医学知识和临床推理。因此,模型的可解释性也是一项重要的研究方向。CT-PASMR通过引入注意力机制和联合损失函数,使得模型在生成推荐结果的同时,能够提供一定的解释依据,从而增强其在临床环境中的可信度和实用性。这为未来的药物推荐系统提供了新的思路,也为AI技术在医疗领域的深入应用奠定了基础。
此外,本文还探讨了药物推荐模型在实际医疗场景中的挑战和前景。在工程应用层面,AI技术的引入有助于提高药物推荐的效率和准确性,但在实际部署过程中,仍然面临诸多障碍,例如如何整合多模态数据、如何提升模型的可解释性以及如何确保推荐结果的安全性。通过CT-PASMR的研究,我们希望为这些问题提供一些有价值的见解,并为后续的研究提供参考。
CT-PASMR模型的提出不仅解决了现有药物推荐方法在患者表征和药物间相互作用处理上的不足,还通过并行结构和图注意力网络的设计,实现了对复杂医学数据的高效建模。这种模型在临床实践中具有广阔的应用前景,可以为医生提供更加精准和安全的药物推荐方案,从而改善患者的治疗效果和医疗质量。同时,该模型也为未来的研究提供了新的方向,例如如何进一步优化模型的结构以适应更多类型的医疗数据,如何提升模型的可解释性以满足临床医生的需求,以及如何在实际应用中确保模型的稳定性和可靠性。
在模型的构建过程中,我们充分考虑了医学数据的多样性和复杂性。EHR数据通常包含大量的文本信息、数值数据和结构化数据,这些数据的处理需要不同的方法。例如,文本信息可以通过自然语言处理(NLP)技术进行分析,数值数据可以通过统计方法进行处理,而结构化数据则可以通过图神经网络进行建模。CT-PASMR通过并行的CNN和Transformer结构,能够同时处理这些不同类型的数据,从而生成更加全面和准确的患者表征。
在药物推荐方面,CT-PASMR不仅关注药物组合的准确性,还特别强调推荐的安全性。传统的药物推荐模型往往在推荐过程中忽略药物间的相互作用,导致推荐结果中存在较高的不良相互作用率。而CT-PASMR通过引入GATs和DDI损失函数,能够在推荐过程中动态评估药物组合的安全性,从而减少潜在的风险。这种安全性评估机制对于临床医生来说尤为重要,因为它可以帮助医生更好地理解推荐结果,并做出更加合理的决策。
为了验证CT-PASMR模型的有效性,我们在MIMIC-III和MIMIC-IV数据集上进行了广泛的实验。这些数据集包含了大量真实世界的医疗数据,涵盖了多种疾病和复杂的药物组合情况。通过比较实验和消融实验,我们发现CT-PASMR在多个评估指标上均优于现有的基线模型。特别是在DDI率和Jaccard指数方面,CT-PASMR的表现尤为突出,表明其在避免不良药物相互作用和推荐符合患者特征的药物组合方面具有显著优势。
此外,CT-PASMR模型的可解释性也得到了一定程度的提升。通过注意力机制的应用,模型能够突出显示哪些医学事件和药物在推荐过程中起到了关键作用。这种可解释性不仅有助于医生理解推荐结果的依据,也为患者提供了更多的信息,使他们能够更好地参与自己的治疗决策。在医疗领域,患者的知情同意和参与是非常重要的,因此,提高模型的可解释性有助于增强患者对推荐结果的信任感。
总的来说,CT-PASMR模型在药物推荐任务中展现出了良好的性能和应用前景。它不仅能够有效捕捉患者个体特征,还能在推荐过程中动态评估药物组合的安全性,从而提供更加精准和安全的药物推荐方案。此外,模型的可解释性也为临床医生和患者提供了更多的信息支持,有助于推动AI技术在医疗领域的进一步应用和发展。
未来的研究方向可能包括如何进一步优化模型的结构以适应更多类型的医疗数据,如何提升模型的可解释性以满足临床医生的需求,以及如何在实际应用中确保模型的稳定性和可靠性。此外,随着医疗数据的不断增长,如何提高模型的计算效率和实时性也是一个重要的研究课题。通过不断改进和优化,CT-PASMR有望成为一种更加成熟和可靠的药物推荐工具,为医疗行业的智能化发展做出贡献。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号