RNA靶向药物设计新突破:基于AMOEBA极化力场与lambda-ABF方法实现核糖开关抑制剂结合亲和力的高精度预测
【字体:
大
中
小
】
时间:2025年10月02日
来源:Communications Biology 5.1
编辑推荐:
本研究针对RNA-小分子相互作用精准预测难题,开发了结合AMOEBA极化力场与lambda-ABF增强采样技术的计算新方法,成功实现对HCV-IRES核糖开关样RNA与19种苯并咪唑衍生物结合自由能的定量预测(RMSE=1.03 kcal/mol),为RNA靶向药物研发提供了可靠的计算工具。
在药物研发领域,蛋白质一直是主要的药物靶点,但人类基因组中约有80%的蛋白质被认为是"不可成药"的。这促使科学家将目光转向了RNA——作为连接基因组信息与功能蛋白质的桥梁,RNA具有形成复杂三维结构的能力,能够为小分子药物提供结合口袋,从而为靶向传统上难以靶向的蛋白质提供了新的途径。
然而,RNA靶向药物的开发面临着重大的计算挑战。RNA的化学组成与蛋白质截然不同,其表面具有高度负电性,且埋藏表面积有限。RNA分子带有高负电荷、动态性强,可以采取不同的构象。此外,二价金属离子在其结构稳定性中扮演着重要角色。由于RNA还被离子和可极化水分子包围,如果没有包含精确静电处理的可计算模型,其靶向将变得非常困难。
当前的计算方法在解决与结构确定、精确计算模型和可靠亲和力预测方法相关的关键障碍方面面临重大挑战,而这些正是指导初始分子设计和合理药物优化阶段所需的关键元素。特别是对于RNA系统,准确预测小分子与RNA的结合亲和力仍然是一个艰巨的挑战,因为RNA的特殊性质使其比小分子-蛋白质复合物对采用的协议更加敏感。
为了解决这些挑战,来自法国Qubit Pharmaceuticals、巴黎索邦大学、德克萨斯大学奥斯汀分校等机构的研究团队开展了一项创新性研究,开发了一种专门用于RNA结合小分子绝对结合自由能计算的最先进方法。他们结合了先进的AMOEBA极化力场与新开发的lambda-Adaptive Biasing Force(lambda-ABF)方案以及精细的约束方法,实现了高效采样。为了捕捉与挑战性RNA构象变化相关的自由能垒,他们将基于机器学习的集体变量与增强采样模拟相结合。这项研究成果发表在《Communications Biology》期刊上。
研究人员主要采用了以下几种关键技术方法:使用AMOEBA极化力场精确处理静电相互作用和极化效应;开发lambda-ABF增强采样方法提高计算效率;应用距离结合构象(DBC)约束保持配体在结合位点;采用基于机器学习的深度线性判别分析(Deep-LDA)集体变量捕捉构象变化;通过Tinker-HP软件包在GPU上进行高性能分子动力学模拟。所有研究均基于公开的X射线晶体结构(PDB ID: 3TZR)进行。
研究人员首先评估了研究的苯并咪唑衍生物小分子与HCV-IRES RNA靶标的结合模式。通过分析40纳秒分子动力学模拟获得的结合模式,他们发现三种主要相互作用对稳定配体在结合口袋中至关重要:苯并咪唑支架与G52和A53碱基之间的π-π堆积相互作用、带正电荷的氮原子与RNA磷酸基团之间的氢键作用、以及配体与镁离子协调网络之间的相互作用。
通过对每个配体的关键相互作用距离随时间演化的分析,研究人员发现对于大多数配体,G52COM与LIGCOM之间的距离分布较窄,集中在4.1到4.4埃之间,与典型的π-π相互作用范围3.3到4.4埃一致。相比之下,配体1和2的分布较宽,这与配体1是非结合剂、配体2是系列中最弱结合剂的实验事实一致。
为了准确预测带有2到3个正电荷的扩展配体与含有三个结构Mg2+离子的29-mer核糖开关样RNA的结合亲和力,研究人员开发了使用lambda-ABF方法和DBC约束的特定协议。
他们采用距离结合构象(DBC)集体变量来定义约束,该变量通过配体在结合位点移动参考系中的均方根偏差(RMSD)来测量,能在单个集体变量中捕获配体的位置、取向和构象偏差。为了促进采样并保持RNA-配体复合物的结构稳定性,研究人员在RNA的磷酸(P)原子和Mg2+离子上实施了轻微的位置约束(力常数为1 kcal/mol/?2)。
研究人员使用了两种不同的ABFE计算设置:一种包含所有配体的中性化系统(Neut.),第二种包含六个代表性配体的生理离子浓度(Phys.)。计算结果显示,原始绝对结合自由能(ΔGComp-raw)始终表现出比实验结果更强(更有利)的值。为了考虑Apo-Holo构象重组,他们对所有配体应用了系统性的自由能偏移,使得计算自由能的平均值等于实验自由能的平均值。
在包含计算和实验结合自由能之间的系统性偏移以适应Apo-Holo蛋白重组自由能后,研究人员观察到整个数据集的计算结果与实验结果之间的相关性为0.6(Pearson r),均方根误差(RMSE)为1.03 kcal/mol,平均绝对误差(MAE)为0.85 kcal/mol(中性化设置)。这些结果显示了结合亲和力的可靠重现和良好排名,配体6和配体4被确定为最有效的,而配体1,9,11,12,13,14,17,18,19为非结合剂。
如前所述,计算DG与实验值之间的能量差产生的ΔGshift估计在10.31至11.35±1.0 kcal/mol之间,主要反映了Apo-Holo构象变化。为了证实这些发现,采用更直接的计算方法至关重要。
研究人员采用了OPES Explore增强采样方法结合深度线性判别分析(Deep-LDA),这是一种专门设计用于识别复杂转变有效集体变量的机器学习技术。通过应用超过13 kcal/mol的偏置,他们在约10纳秒时观察到了从Apo状态到Holo状态的转变,这与从lambda-ABF计算估计的能量变化非常吻合。
这项研究成功开发了一种用于计算RNA结合小分子绝对结合自由能的最先进方法,并在一个具有挑战性的RNA系统——HCV-IRES核糖开关样RNA中展示了其有效性。该系统具有高度带电和灵活的RNA结构、复杂的结合位点(含有三个作为内在组分的镁离子)、带有多个正电荷和几个芳香族和非芳香族环以及长臂的配体,以及Apo和Holo状态之间显著的配体诱导构象变化。
通过将GPU加速的Tinker-HP软件包的计算性能与增强采样和机器学习相结合,同时利用AMOEBA力场的准确性,研究人员能够模拟具有挑战性的药物发现靶点如RNA,并使用lambda-ABF方法计算绝对结合亲和力以指导药物设计。这种协同作用不仅克服了传统方法的局限性,而且为RNA靶向治疗药物的开发提供了精确和可靠的计算工具。
该研究的成功表明,RNA和其他挑战性靶标的复杂性可以通过无与伦比的准确性和速度来解决,从而以精确和自信的方式指导RNA靶向治疗药物的开发。这一方法的应用将显著降低药物研发的失败率,为靶向传统"不可成药"蛋白质提供新的途径,最终扩展人类基因组中的可成药靶点空间。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号