-
生物通官微
陪你抓住生命科技
跳动的脉搏
科学研究能完全自动化吗? “人工智能科学家”/AI Scientist能替代研究人员吗?
【字体: 大 中 小 】 时间:2024年09月02日 来源:nature
编辑推荐:
“人工智能科学家”由东京Sakana AI公司的一个团队和加拿大和英国的学术实验室共同开发,从阅读有关问题的现有文献,为新的研究开发制定“猜想”,到尝试解决方案和撰写论文,完成整个研究周期。AI Scientist甚至做了一些同行评审的工作,并评估自己的结果。
现在的科研仪器已经越来越先进和自动化,复杂的实验只需要很少的人工操作,即可自动运行,自动分析结果。。。科学研究可以完全自动化吗?现在,一组机器学习研究人员已经进行了尝试。“人工智能科学家”由东京Sakana AI公司的一个团队和加拿大和英国的学术实验室共同开发,从阅读有关问题的现有文献,为新的研究开发制定“猜想”,到尝试解决方案和撰写论文,完成整个研究周期。AI Scientist甚至做了一些同行评审的工作,并评估自己的结果。
AI Scientist加入了创建至少可以自动化部分科学过程的人工智能代理行列。“据我所知,还没有人在一个系统中完成整个科学界,”人工智能科学家的联合创始人、加拿大温哥华英属哥伦比亚大学的机器学习研究员Cong Lu说。研究结果于本月发布在arXiv预印本服务器上。
“令人印象深刻的是,他们做到了端到端,”西雅图华盛顿大学的计算社会科学家Jevin West说。“我认为我们应该考虑一下这些想法,因为这可能有助于科学研究。”
到目前为止,结果还不是惊天动地的,系统只能在机器学习本身的领域做研究。特别是,AI科学家缺乏大多数科学家认为从事科学研究的关键部分——做实验室工作的能力。劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)和加州大学伯克利分校(University of California, Berkeley)的材料科学家Gerbrand Ceder表示:“从人工智能提出假设到在机器人科学家身上实现假设,还有很多工作要做。”不过,“如果你展望未来,我毫不怀疑这是大部分科学的发展方向。”
AI Scientist基于大型语言模型(LLM)。以一篇描述机器学习算法的论文为模板,从搜索文献中寻找类似的工作开始。该团队随后采用了一种被称为进化计算的技术,这种技术的灵感来自于达尔文进化论中的突变和自然选择。它分步骤进行,对算法进行小的、随机的改变,并选择那些能提高效率的改变。
为此,AI Scientist通过运行算法并测量它们的表现来进行自己的“实验”。最后,它生成一篇论文,并在一种自动同行评审中对其进行评估。在以这种方式“扩充文献”之后,算法可以在自己的结果基础上再次开始循环。
作者承认,人工智能科学家发表的论文只包含了渐进式的发展。其他一些研究人员在社交媒体上发表了严厉的评论。“作为一名期刊编辑,我可能会拒绝他们。作为一名评论者,我会拒绝他们,”黑客新闻网站上的一名评论者说。
Jevin West认为作者对研究人员如何了解他们所在领域的现状采取了一种简化的方法。他们知道的很多东西来自其他形式的交流,比如参加会议或在饮水机旁与同事聊天。“科学不仅仅是一堆论文,”“5分钟的谈话比5小时的文献研究更有效。”
West的同事Shahan Memon也同意这一观点,但是West和Memon都赞扬了作者完全公开了他们的代码和结果。这使他们能够分析人工智能科学家的结果。例如,他们发现,在选择作为参考文献的早期论文时,它存在“人气偏差”,会避开那些被引用次数高的论文。他们也在考虑衡量人工智能科学家的选择是否最相关。
当然,人工智能科学家并不是第一次尝试将研究人员工作的各个部分自动化:将科学发现自动化的梦想和人工智能本身一样古老——“可以追溯到20世纪50年代”,位于耶路撒冷的艾伦人工智能研究所(Allen Institute for AI)的计算机科学家Tom Hope说。例如,早在十年前,自动统计员就能够分析数据集并撰写自己的论文。伯克利的Gerbrand Ceder和他的同事们甚至实现了一些实验室工作的自动化:他们去年推出的“机器人化学家”可以合成新材料并进行实验。
Tom Hope表示,目前的LLM“除了基本的流行语肤浅组合之外,无法制定出新颖而有用的科学方向”。尽管如此,Ceder表示,即使人工智能无法在短期内完成更具创造性的工作,它仍然可以自动化许多重复性的研究工作。“在低水平上,你试图分析某事是什么,某事如何反应。这不是科学的创造性部分,但这是我们所做的90%的事情。”Lu说,他也从许多其他研究人员那里得到了类似的反馈。“人们会说,我有100个想法,但我没有时间。让人工智能科学家去做这些。”
Lu说,为了扩大AI科学家的能力——甚至是机器学习之外的抽象领域,比如纯数学——它可能需要包括语言模型之外的其他技术。例如,谷歌深度思维(Google Deep Mind)最近解决数学问题的结果表明了大型语言模型与“符号”人工智能技术相结合的力量,后者将逻辑规则构建到系统中,而不仅仅依赖于它从数据中的统计模式中学习。但他说,目前的迭代只是一个开始。他说:“我们真的相信这是人工智能科学的GPT-1。”
这些结果引发了一场争论,这是许多研究人员目前最关心的问题。“我在不同科学领域的所有同事都在试图弄清楚,人工智能在我们所做的事情中处于什么位置?它确实迫使我们思考什么是21世纪的科学——它可能是什么,它是什么,它不是什么,”Jevin West说。