-
生物通官微
陪你抓住生命科技
跳动的脉搏
Nature Methods:在计算生物学中使用可解释机器学习方法的指南
【字体: 大 中 小 】 时间:2024年08月13日 来源:news-medical
编辑推荐:
机器学习是计算生物学中的一个强大工具,可以分析广泛的生物医学数据,如基因组序列和生物成像。
机器学习是计算生物学中的一个强大工具,可以分析广泛的生物医学数据,如基因组序列和生物成像。但是,当研究人员在计算生物学中使用机器学习时,理解模型行为对于揭示健康和疾病的潜在生物学机制仍然至关重要。
在《自然方法》最近的一篇文章中,卡内基梅隆大学计算机科学学院的研究人员提出了一些指导方针,概述了使用可解释的机器学习方法来解决计算生物学问题的陷阱和机会。
该杂志八月份人工智能特刊的专题为“在计算生物学中应用可解释的机器学习-;新发展的陷阱、建议和机遇”。
“随着机器学习和人工智能工具被应用于越来越重要的问题,可解释的机器学习引起了极大的兴奋。随着这些模型变得越来越复杂,不仅在开发高度预测的模型方面,而且在创建帮助最终用户理解这些模型如何以及为什么做出某些预测的工具方面,都有很大的希望。然而,重要的是要认识到,可解释的机器学习尚未为这种可解释性问题提供交钥匙解决方案。”CMU机器学习系(MLD)副教授Ameet Talwalkar说。
这篇论文是由MLD的博士生Valerie Chen和Ray and Stephanie Lane计算生物系的博士生Muyu (Wendy) Yang合作完成的。Chen早期批评可解释机器学习社区缺乏下游用例基础的工作启发了这篇文章,这个想法是通过与Yang和Jian Ma (Ray and Stephanie Lane计算生物学教授)的讨论发展起来的。
Yang说:“我们的合作始于对计算生物学论文的深入研究,以调查可解释机器学习方法的应用。我们注意到,许多应用程序都以某种特殊的方式使用这些方法。我们这篇论文的目标是为在计算生物学中更稳健和一致地使用可解释的机器学习方法提供指导。”
本文指出的一个主要缺陷是依赖于单一的可解释机器学习方法。相反,研究人员建议使用多种可解释的机器学习方法和不同的超参数集,并比较它们的结果,以获得对模型行为及其潜在解释的更全面的理解。
“虽然一些机器学习模型似乎工作得非常好,但我们通常并不完全理解其中的原因。”“在生物医学等科学领域,理解模型为何起作用对于发现基本的生物机制至关重要。”
该论文还警告在评估可解释的机器学习方法时不要挑选结果,因为这可能导致对科学发现的不完整或有偏见的解释。
Chen强调,该指南可能会对更广泛的研究人员产生更广泛的影响,这些研究人员对将可解释的机器学习方法应用于他们的工作感兴趣。
“我们希望机器学习研究人员开发新的可解释的机器学习方法和工具-;特别是那些致力于解释大型语言模型的人。将仔细考虑可解释机器学习中以人为本的方面。这包括了解他们的目标用户是谁,以及如何使用和评估该方法。”
虽然理解模型行为对于科学发现和一个根本未解决的机器学习问题仍然至关重要,但作者希望这些挑战能刺激进一步的跨学科合作,以促进人工智能在科学影响方面的更广泛应用。