VCTatDot与VCTatMLP:基于三元注意力嵌入的深度学习模型在协同药物组合预测中的应用

【字体: 时间:2025年10月09日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对病毒性疾病协同药物组合预测研究匮乏的问题,开发了两种基于注意力机制的深度学习模型VCTatDot和VCTatMLP。研究团队构建了包含44种病毒、211种药物及372个已知相互作用的CombTVir数据集,通过交叉注意力机制生成药物和病毒的嵌入表示,并采用三元点积和MLP两种解码策略进行协同效应预测。实验结果表明,在1:100的正负样本比例下,VCTatDot模型的AUC-ROC达到0.99,AUPR为0.98,MCC为0.87,性能优于传统机器学习方法。研究成功预测了阿昔洛韦+利巴韦林和阿昔洛韦+普拉诺韦肌苷两种经文献验证的协同组合,为病毒性疾病联合疗法提供了新的计算工具。

  
病毒作为地球上最古老的生物实体之一,在生态系统中扮演着重要角色,但同时也是人类健康的重大威胁。近二十年来,SARS-CoV、MERS-CoV和SARS-CoV-2等单链病毒引发的严重急性呼吸道感染,猴痘病毒引起的皮疹、发热等症状,以及人偏肺病毒(HMPV)导致的呼吸道感染,都凸显了病毒性疾病的防治紧迫性。这些病毒往往突然出现,导致致命疾病且缺乏现成治疗方案,使得有效药物的发现成为当务之急。
然而,传统药物研发过程既耗时又昂贵,完全依赖新药开发在紧急情况下可能危及成千上万人的生命。药物重定位(drug repurposing)在这方面显示出独特价值,但即便如此仍需要大量投入。计算药物重定位方法通过筛选和推荐已批准药物进行重新利用,成为了一种高效且经济的策略。尽管深度学习和大语言模型在药物研发领域产生了重大影响,但大多数研究集中在单药治疗(monotherapy)上,而对联合疗法(combination therapy)的关注相对不足。
特别是在病毒性疾病治疗领域,协同药物组合的研究更是凤毛麟角。这主要是由于药物耐药性、治疗难度大以及紧急情况下知识缺乏等挑战造成的。与癌症治疗领域广泛探索协同组合疗法形成鲜明对比, antiviral combination therapies(抗病毒联合疗法)的研究严重不足。正是为了填补这一空白,本研究团队开发了基于注意力机制(attention mechanism)的深度学习模型,用于预测病毒性疾病的协同药物组合。
研究人员采用了多种关键技术方法:首先构建了包含44种病毒、211种药物及372个已知相互作用的CombTVir数据集;利用Tanimoto评分计算药物相似性,通过序列比对计算病毒相似性;开发了基于交叉注意力(cross-attention)和自注意力(self-attention)的嵌入生成机制;采用三元点积(tri-dot product)和多层感知器(MLP)两种预测策略;使用Matthew相关系数(MCC)、AUC-ROC和AUPR等指标进行模型评估;并通过10折分层交叉验证确保结果可靠性。
数据集构建与特征分析
研究团队基于Myhre收集的病毒联合疗法列表,构建了标准化数据集CombTVir。该数据集包含44种病毒、211种药物及其372个已知相互作用,具有高度稀疏性。通过DrugBank获取药物SMILES(简化分子线性输入规范)数据,从NCBI获取病毒核苷酸序列,使用Tanimoto评分计算药物间相似性,通过序列比对计算病毒间相似性。数据集中病毒出现频率分析显示,HSV-1(单纯疱疹病毒1型)最为常见,而EBV(爱泼斯坦-巴尔病毒)和VZV(水痘-带状疱疹病毒)等出现频率较低,但模型仍能对这些罕见病毒进行有效预测。
模型架构设计
研究提出了两种基于注意力机制的深度学习模型:VCTatMLP(基于注意力和MLP的病毒联合疗法)和VCTatDot(基于注意力和点积的病毒联合疗法)。两种模型共享相同的编码器结构,包含三个注意力块:两个药物交叉注意力块和一个病毒自注意力块。交叉注意力块以一种药物作为查询(query),另一种药物作为键(key)和值(value),生成考虑药物间相互作用的嵌入表示。自注意力块对病毒特征进行内部关系建模,生成病毒的嵌入表示。
解码策略比较
VCTatMLP采用多层感知器进行协同效应预测,包含批归一化层、五个全连接层和Sigmoid激活函数。VCTatDot则使用三元点积运算,计算三个嵌入向量的元素级乘积之和,通过Sigmoid函数输出预测结果。三元点积是传统点积运算的推广,能够捕捉三个向量间的复杂相互作用。
性能评估结果
在正负样本比例为1:3、1:5和1:10的设置下,随机森林算法表现最佳,MCC达到0.99左右。而在最具挑战性的1:100比例下,VCTatDot表现出色,AUC-ROC为0.99,AUPR为0.98,MCC为0.87,优于其他对比方法。病毒分割实验进一步证明,即使训练中未包含10%的病毒,模型仍能保持良好性能,显示了较强的泛化能力。
预测验证与应用
模型成功预测了多个协同药物组合,其中阿昔洛韦+利巴韦林(acyclovir+ribavirin)和阿昔洛韦+普拉诺韦肌苷(acyclovir+Pranobex Inosine)两种组合已获文献实验验证,对HSV-1具有协同抗病毒效果。这些预测组合中,每个药物都对相应病毒有独立治疗效果,组合后产生协同增强效应。
该研究通过开发创新的注意力机制模型,为病毒性疾病协同药物组合预测提供了有效工具。研究表明,基于注意力机制生成的显著嵌入表示,结合轻量级预测模型(如三元点积),能够在极不平衡的数据集上取得优异性能。成功预测并经文献验证的协同组合证明了模型的实用价值,为病毒性疾病治疗提供了新的候选方案。
研究的创新点在于:首次将注意力机制应用于病毒协同药物组合预测;提出了结合交叉注意力和自注意力的嵌入生成方法;验证了三元点积在预测任务中的有效性;构建了专门针对病毒联合疗法的数据集CombTVir;证明了模型对罕见病毒的预测能力。
未来研究方向包括:在更大数据集上优化注意力模型;整合更多药物和病毒特征;开发可解释人工智能(XAI)方法以增强模型透明度;探索模型在其他疾病领域的适用性。这些工作将进一步推动计算药物重定位在联合疗法中的应用,为传染病防治提供新的解决方案。
该研究成果以"VCTatDot and VCTatMLP: deep learning models with triadic attention embeddings for synergistic drug combination prediction"为题,发表在《Scientific Reports》期刊上,为病毒性疾病治疗提供了重要的计算工具和方法学参考。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号