-
生物通官微
陪你抓住生命科技
跳动的脉搏
在一张图像中识别多个物体的最佳人工智能策略
【字体: 大 中 小 】 时间:2024年12月12日 来源:AAAS
编辑推荐:
图像分类是人工智能最常见的任务之一,系统需要从给定的图像中识别物体。然而,现实生活要求我们识别的不是一个单独的物体,而是在给定图像中一起出现的多个物体。这个现实提出了一个问题:处理多目标分类的最佳策略是什么?常用的方法是单独检测每个对象,然后对它们进行分类。但是新的研究挑战了这种传统的多目标分类方法。在今天发表在《物理学A》上的一篇文章中,来自以色列巴伊兰大学的研究人员展示了如何通过一种称为多标签分类(MLC)的过程将物体分类在一起,这可以超越常见的基于检测的分类。
图像分类是人工智能最常见的任务之一,系统需要从给定的图像中识别物体。然而,现实生活要求我们识别的不是一个单独的物体,而是在给定图像中一起出现的多个物体。
这个现实提出了一个问题:处理多目标分类的最佳策略是什么?常用的方法是单独检测每个对象,然后对它们进行分类。但是新的研究挑战了这种传统的多目标分类方法。
在今天发表在《物理学A》上的一篇文章中,来自以色列巴伊兰大学的研究人员展示了如何通过一种称为多标签分类(MLC)的过程将物体分类在一起,可以超越常见的基于检测的分类。
“检测需要单独识别每个物体,然后对每个物体单独进行分类,”领导这项研究的巴伊兰大学物理系和冈达(戈德施米德)多学科大脑研究中心的伊多·坎特教授说。“即使假设完美的识别,网络也需要独立正确地分类每个对象,而MLC的对象组合是一起分类的,而不是单独分类的。”
该研究的主要贡献者、博士生罗尼特·格罗斯(Ronit Gross)说:“这种新方法允许神经网络学习一起出现的物体之间的相关性,从而使它们更容易被识别。”“当网络需要识别多个对象时,学习组合而不是单个对象可以产生更好的结果。这种新的理解可以为人工智能铺平道路,它可以更好地识别单个图像中的物体组合,”她补充道。
这些结果质疑了目前对如何识别多个物体的理解,并可以改善现实生活中的应用,例如自动驾驶汽车,它需要在任何给定时刻分析多个物体。
关于多标签与检测分类的视频:https://www.youtube.com/watch?v=uCwtJa4ZUDE