CKDTA:融合化学知识增强与协同注意力机制的药物-靶点亲和力预测新框架及其在药物发现中的应用

【字体: 时间:2025年09月17日 来源:Journal of Computational Science 3.7

编辑推荐:

  本文推荐一篇关于药物-靶点亲和力(DTA)预测的前沿研究。作者提出CKDTA框架,创新性地融合化学先验知识(如功能区域与元素属性)构建多层分子图,并设计协同注意力机制整合序列与图结构信息,显著提升预测精度与泛化能力,为加速药物筛选提供新范式。

  

Highlight

我们设计的多层分子图整合了分子结构信息、化学元素知识以及分子功能区域,为分子建模提供了一种创新方法。

我们提出的协同注意力融合机制使基于图的结构嵌入能够指导序列嵌入的学习,有效弥补一维序列缺乏空间上下文信息的不足,从而产生更丰富的特征表示。

我们采用分层注意力网络从多层图中学习表征。节点级注意力将相邻原子特征聚合为层特定嵌入,而语义级注意力自适应地整合跨层信息以形成统一的药物表示。

我们引入基于Top-K池化的图神经网络用于蛋白质表征,可自适应识别关键结合残基。案例研究验证了其有效性和可解释性,证实了模型捕获药物-靶点相互作用中结构相关特征的能力。

Multi-layer molecular graph

本研究提出一种多层分子图来建模药物分子。该表征整合了原子级分子结构信息、化学元素知识和分子片段,提供了对药物的全面描述。多层分子图形式化定义为 Gd = (Vd, Ed),其中节点集 Vd = Va ∪ Vr ∪ Vf 包含三类节点:

• Va:代表药物分子原子的原子节点

• Vr:编码化学元素属性的属性节点

Datasets

我们在DAVIS和KIBA数据集上评估了所提出的模型,这两个是广泛用于预测药物-靶点结合亲和力的基准数据集。DAVIS数据集包含68种化合物和442种蛋白质,共30,056个亲和力样本,以解离常数(Kd)作为亲和力度量。然而,Kd值通常非常小,直接用于建模可能会对模型的训练性能产生不利影响。为了更好地处理和表示这些亲和力数据,Kd值被转换为pKd值(即 -log10(Kd/109)),这使得值更易于处理且更适合建模。KIBA数据集是一个更大的集合,包含2,211种药物和229种蛋白质,共产生118,254个亲和力样本。KIBA分数是通过整合Ki、Kd和IC50等多种亲和力测量值计算得出的,提供了结合亲和力的统一指标。

Conclusion

本研究提出CKDTA,一种新颖的化学知识增强框架用于药物-靶点结合亲和力预测。通过融入化学元素知识、功能区域分割和原子级分子结构,CKDTA增强了分子表征并捕获了对准确预测结合亲和力至关重要的复杂分子特征。此外,我们引入的协同注意力模块动态地将序列嵌入与图交互数据对齐,弥补了一维序列中空间信息的缺失,从而实现了更全面和准确的特征表示。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号