近年来,人工智能计算需求的增加使得深度神经网络成为研究的热点。然而,随着电子芯片中晶体管的缩放接近物理极限,传统电子硬件已无法满足性能要求。光计算凭借其固有的并行性和高速度成为一种有前景的替代方案。特别是片上光神经网络(ONNs),它们利用光的传播特性执行矩阵运算,具有高带宽、低延迟和低互连损耗的特点[[1], [2], [3], [4], [5], [6], [7]]。
根据所携带信息的类型,ONNs可以分为实值光神经网络(RVONNs)和复值光神经网络(CVONNs)。CVONNs可以在光传播过程中自然地进行复数值运算,从而提高效率[[8], [9], [10]]。作为ONNs的关键组成部分,非线性激活函数(NAFs)可以有效缓解计算过拟合问题并提升模型性能[[11], [12], [13], [14]]。已经提出了多种基于复合材料和微环结构的全光NAFs[[15], [16], [17], [18], [19], [20]]。然而,随着ONNs的发展,推理任务的复杂性和精度要求不断提高,ONNs的规模已经从几个光子神经元扩展到数百甚至数千个[[21], [22], [23]]。在这些网络中,信息通常以光强度的形式传输。随着层数和节点数量的增加,光信号的相干或非相干叠加会导致输出强度急剧增加,超出了现有低阈值光非线性器件的毫瓦级动态范围[[24], [25], [26]]。这严重限制了大规模ONNs的准确性和可扩展性。
光子晶体(PhCs)由具有不同介电常数的材料周期性排列而成。当结构的周期性受到干扰时,会在光子带隙内形成缺陷模式,使光子在缺陷区域特定频率处局域化。在光器件设计中,二维(2D)PhCs可以利用成熟的微纳制造技术与其他光子芯片组件高效集成[[27]]。同时,PhC结构可以灵活嵌入各种功能材料。氧化石墨烯(GO)由于其优异的三阶非线性克尔效应,在光强度作用下能够产生显著的折射率变化,使其成为构建可控全光非线性调制器的理想材料[[28], [29], [30], [31], [32], [33]]。如果使用GO构建PhC缺陷,可以在确保光子局域化的同时引入可控的非线性调制能力,为实现高速、宽动态范围的全光非线性激活器件提供途径。
本文提出了一种基于2D PhC结构的全光非线性激活器件。通过模拟大规模光计算阵列中的高强度信号输出,信号光直接激发了GO缺陷区域中的克尔效应,实现了强度和相位的复数值非线性调制。表1展示了不同光NAF设备的准确性和响应范围的比较。与传统NAFs相比,所选设备在网络准确性和响应范围方面均有显著提升。该设备提供了从毫瓦到瓦级的宽响应范围和快速响应能力,大大扩展了光激活器件在大规模CVONNs中的应用范围。在构建的卷积CVONN中,该激活器件表现出优异的性能:在Fashion-MNIST数据集上的准确率为86.45%;在CIFAR-10数据集上的准确率为60.13%。与最优电子NAF方案相比,所提出的光非线性激活器件性能提高了6.07%和9.08%。该设备为大规模光计算架构中的NAFs实现提供了有前景的解决方案。