《Engineering Applications of Artificial Intelligence》:Radon averaging: A practical approach for designing rotation-invariant models
编辑推荐:
旋转不变性在图像处理中至关重要,但传统方法需修改网络架构或调整超参数。本文提出Radon Averaging预处理方法,通过Radon变换计算图像的旋转不变表示,保持原有网络结构,实现高效复用预训练模型。实验在MNIST、半导体晶圆和遥感数据集上验证,该方法效果与或优于现有基线,显著降低模型开发成本。
Jangwon Kim|Sanghyun Ryoo|Jiwon Kim|Junkee Hong|Soohee Han
韩国庆尚北道浦项市南区Cheongam-ro 77号,浦项科技大学Convergence IT工程系,邮编37673
摘要
在制造场景中,旋转对称图案非常常见;因此,有效利用这种对称性对于实现鲁棒的视觉处理至关重要。然而,目前大多数实现旋转不变性的方法都会修改网络架构,这限制了预训练模型的重用,并且通常需要大量的超参数调整。为了解决这个问题,我们提出了一种简单有效的方法——Radon平均(Radon Averaging),该方法可以在不修改网络架构的情况下实现旋转不变性。Radon平均通过在预处理阶段利用Radon变换来计算每张图像的旋转不变表示,从而保持原始架构不变。这大大减少了构建旋转不变模型所需的工作量,并使得可以使用预训练的模型。在手写数字、半导体晶圆图和遥感飞机数据集上的实验表明,Radon平均的性能与强大的基线方法相当或更优。这些结果表明,Radon平均是一种实用且应用广泛的方法,适用于构建旋转不变模型。
引言
通过先进的图像处理技术,制造自动化已经达到了前所未有的效率和精度水平。特别是卷积神经网络(CNNs)(Li等人,2021年)在处理复杂图像任务方面表现出色,因为它们能够通过有效的特征提取来完成任务,并且性能优于传统的特征工程方法(Lowe,2004年;Rublee等人,2011年)。这些能力支持了更准确和可靠的制造自动化(Lee等人,2017年;Swapna等人,2018年;Liu和Bao,2022年),并显著提高了质量控制、缺陷检测和整体运营效率(Imoto等人,2019年;Ma等人,2019年;Liu等人,2020年)。鉴于其性能和适应性,CNNs已成为现代工业应用中的广泛采用的解决方案,应用范围从视觉质量检测到自动化决策支持系统(Zhou等人,2022年;Jha和Babiceanu,2023年)。
尽管CNNs在各种视觉任务中表现出色,但它们通常不具备旋转不变性。这一限制对于涉及任意物体方向的任务来说是一个主要障碍(Weiler等人,2018年)。为了解决这个问题,人们将强归纳偏见引入CNNs中,以构建可靠且样本效率高的模型,从而实现旋转不变性。
为了实现这一目标,许多研究探索了将旋转不变性融入神经网络的方法。数据增强是一种直接的方法,可以用来促进旋转不变性(Quiroga等人,2018年)。然而,它不能保证旋转不变性,并且可能会通过扩大训练数据集的大小来降低样本效率。
除了这些暴力技术之外,最近的研究越来越多地关注在架构层面嵌入等变性质。例如,群等变CNNs(Cohen和Welling,2016年)通过一种提升方法将群操作应用于特征图来实现等变性。在这个过程中,特征图首先被转换,然后堆叠起来,从而能够在不同的输入角度下进行一致的特征提取。另外,可定向CNNs(Weiler和Cesa,2019年)也被广泛用于构建旋转等变模型,其中每一层都设计了基于圆形谐波的滤波器。
然而,许多传统方法需要修改网络架构并进行仔细的超参数调整,这可能会增加成本并限制预训练模型的重用。为了解决这个问题,我们提出了Radon平均(RA),这是一种实用且有效的方法,可以实现特殊正交群的不变性。RA在预处理阶段计算每张图像的旋转不变表示,同时保持网络架构不变,允许直接使用预训练模型。我们在多种CNN变体和数据集上验证了RA的方法,结果表明其性能与强大的基线方法相当或更优,而无需修改网络架构或进行大量超参数调整。
相关研究
相关工作
在各种计算机视觉应用中,开发旋转不变模型一直是一个长期存在的挑战,包括医学图像分析(Serlie等人,2007年;Tabesh和Teverovskiy,2006年;Schlachter等人,2010年)、纹理分类(Kashyap和Khotanzad,1986年;Pietik?inen等人,2000年)以及卫星图像分析(Lei等人,2012年;Liu和Shi,2014年)。为了解决这个问题,已经提出了许多方法,特别关注构建S_2不变的模型。
对称性
卷积神经网络(CNNs)是经典的例子,它们在由卷积滤波器诱导的空间邻域内保持平移不变性。CNN中的卷积层本质上保持了对平移变换的等变性,而池化层则实现了不变性。然而,它们本身并不具备对其他变换(特别是任意旋转)的不变性。这一限制促使人们开发出使模型具有
实验
在许多行业中,S_2不变性在图像分析中起着关键作用。因此,我们选择了与行业相关的数据集进行比较。实验使用了包含手写数字的MNIST数据集,以及包含各种类型缺陷的半导体晶圆图图像的WM-811K数据集。
在实验中,所提出的RA方法使用了循环群C_8来处理MNIST和WM-811K数据集。为了突出S_2的采样效率
结论
在这项研究中,我们提出了Radon平均(RA),这是一种新颖且高效的方法,用于构建S_2不变的神经网络。RA的主要优势在于其简单性和高效性。与传统方法不同,RA不需要对CNN架构进行任何修改,也不需要大量的超参数调整,因为它通过输入级别的预处理来实现不变性。因此,它可以直接应用于已经优化或预训练的CNNs。这些特性显著提高了
CRediT作者贡献声明
Jangwon Kim:撰写——审阅与编辑,撰写——初稿,验证,监督,软件,方法论,调查,概念化。Sanghyun Ryoo:软件,方法论,调查。Jiwon Kim:项目管理,资金获取。Junkee Hong:项目管理,资金获取。Soohee Han:撰写——审阅与编辑,验证,监督,资源管理,项目管理,调查,资金获取。
利益冲突声明
作者声明他们没有已知的财务利益或个人关系可能会影响本文报告的工作。
致谢
本工作部分得到了信息与通信技术规划与评估研究所(IITP)的支持,该研究所由韩国政府科学技术信息通信部(MSIT)资助(项目编号:2019-0-00762)。此外,还得到了国家消防局(National Fire Agency)的传感器和机器人技术开发项目的支持,该项目旨在支持火灾现场的搜救和灭火活动(项目编号:20026197),以及用于灭火的基于轨道的移动机器人的开发。