-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature两篇论文:人工智能工具揭示数百万种蛋白质
【字体: 大 中 小 】 时间:2023年09月22日 来源:AAAS
编辑推荐:
巴塞尔大学和SIB瑞士生物信息学研究所的一个研究小组发现了一个未知蛋白质的宝库。拥抱最近的深度学习革命,他们发现了数百个新的蛋白质家族,甚至是一个新的预测蛋白质折叠。这项研究现已发表在《自然》杂志上。
2021年7月16日,谷歌旗下的DeepMind团队在 Nature 发表论文,发布了开源了基于人工智能(AI)的蛋白质结构预测工具——AlphaFold2,AlphaFold2仅通过氨基酸序列就能以前所未有的准确度预测蛋白质三维结构。 近期,巴塞尔大学和SIB瑞士生物信息学研究所的一个研究小组发现了一个未知蛋白质的宝库。利用这种AI,他们发现了数百个新的蛋白质家族,甚至是一个新的预测蛋白质折叠。这项研究现已发表在Nature.
在过去的几年里,AlphaFold已经彻底改变了蛋白质科学。这种人工智能(AI)工具经过了50多年来生命科学家收集的蛋白质数据的训练,能够高精度地预测蛋白质的3D形状。去年,它的成功促成了惊人的2.15亿个蛋白质的建模,提供了对几乎任何蛋白质形状的深入了解。这对于没有经过实验研究的蛋白质来说尤其有趣,这是一个复杂而耗时的过程。
“现在有许多蛋白质信息来源,包含了蛋白质如何进化和工作的宝贵见解,”该研究的负责人Joana Pereira说。然而,长期以来,研究一直面临着data jungle的问题。由巴塞尔大学生物中心和瑞士生物信息学研究所(SIB)组长Torsten Schwede教授领导的研究小组现在成功地解密了一些隐藏的信息。
新的蛋白质家族和折叠
研究人员构建了一个由5300万个具有高质量AlphaFold结构的蛋白质组成的互动网络。第一作者Janani Durairaj博士强调说:“这个网络是理论上预测未知蛋白质家族及其大规模功能的宝贵来源。”该团队能够识别290个新的蛋白质家族和一个类似花朵形状的新蛋白质折叠。
基于Schwede集团在开发和维护领先软件SWISS-MODEL方面的专业知识,他们将该网络作为交互式网络资源提供,称为“Protein Universe Atlas”。
人工智能在研究中是一个有价值的工具
该团队使用基于深度学习的工具在这个网络中寻找新奇之处,为生命科学的创新铺平了道路,从基础研究到应用研究。Pereira说:“了解蛋白质的结构和功能通常是开发新药或通过蛋白质工程修改其功能的第一步。”这项工作得到了SIB的“kickstarter”资助,鼓励在生命科学资源中采用人工智能。它强调了深度学习和智能算法在研究中的变革潜力。
有了蛋白质宇宙图谱,科学家们现在可以了解更多与他们的研究相关的蛋白质。Janani Durairaj说:“我们希望这个资源不仅可以帮助研究人员和生物管理员,还可以为学生和教师提供一个学习蛋白质多样性的新平台,从结构、功能到进化。”
蛋白质宇宙图谱:https://uniprot3d.org/atlas/AFDB90v4