基于二维光子晶体结构的全光非线性激活函数,通过调制信号光来实现

《Optics and Lasers in Engineering》:All-optical nonlinear activation function based on the two-dimensional photonic crystal structure through modulating the signal light

【字体: 时间:2025年12月05日 来源:Optics and Lasers in Engineering 3.7

编辑推荐:

  非线性激活器件的研制及其在光计算中的应用。基于二维光子晶体腔结构,通过嵌入石墨烯氧化物材料实现信号光诱导的非线性响应,在复杂值光神经网络中同步调控光强与相位。实验表明该器件在Fashion-MNIST和CIFAR-10数据集上分别提升6.07%和9.08%的分类精度,动态范围扩展至毫瓦至瓦特级,为大规模光计算网络提供了新型非线性激活解决方案。

  
侯尧康|李大行|张国|胡佩|冯帅
中国民族大学理学院,北京100081

摘要

随着人工智能计算需求的不断增长,光神经网络(ONNs)因低能耗和高并行性而受到了广泛关注。非线性激活函数(NAFs)在提升网络性能方面起着关键作用。本文提出了一种由二维光子晶体(PhC)腔内的信号光诱导的非线性激活机制,利用嵌入的氧化石墨烯(GO)实现了复数值ONNs中强度和相位的大范围调制。该设备在分类准确性上表现出显著提升,在Fashion-MNIST数据集上的性能比最佳电子NAF高出6.07%,在CIFAR-10数据集上高出9.08%。该设备能够在宽强度范围内实现非线性激活,非常适合用于未来的大规模光计算网络,展示了PhC设备在这一领域的巨大潜力。

引言

近年来,人工智能计算需求的增加使得深度神经网络成为研究的热点。然而,随着电子芯片中晶体管的缩放接近物理极限,传统电子硬件已无法满足性能要求。光计算凭借其固有的并行性和高速度成为一种有前景的替代方案。特别是片上光神经网络(ONNs),它们利用光的传播特性执行矩阵运算,具有高带宽、低延迟和低互连损耗的特点[[1], [2], [3], [4], [5], [6], [7]]。
根据所携带信息的类型,ONNs可以分为实值光神经网络(RVONNs)和复值光神经网络(CVONNs)。CVONNs可以在光传播过程中自然地进行复数值运算,从而提高效率[[8], [9], [10]]。作为ONNs的关键组成部分,非线性激活函数(NAFs)可以有效缓解计算过拟合问题并提升模型性能[[11], [12], [13], [14]]。已经提出了多种基于复合材料和微环结构的全光NAFs[[15], [16], [17], [18], [19], [20]]。然而,随着ONNs的发展,推理任务的复杂性和精度要求不断提高,ONNs的规模已经从几个光子神经元扩展到数百甚至数千个[[21], [22], [23]]。在这些网络中,信息通常以光强度的形式传输。随着层数和节点数量的增加,光信号的相干或非相干叠加会导致输出强度急剧增加,超出了现有低阈值光非线性器件的毫瓦级动态范围[[24], [25], [26]]。这严重限制了大规模ONNs的准确性和可扩展性。
光子晶体(PhCs)由具有不同介电常数的材料周期性排列而成。当结构的周期性受到干扰时,会在光子带隙内形成缺陷模式,使光子在缺陷区域特定频率处局域化。在光器件设计中,二维(2D)PhCs可以利用成熟的微纳制造技术与其他光子芯片组件高效集成[[27]]。同时,PhC结构可以灵活嵌入各种功能材料。氧化石墨烯(GO)由于其优异的三阶非线性克尔效应,在光强度作用下能够产生显著的折射率变化,使其成为构建可控全光非线性调制器的理想材料[[28], [29], [30], [31], [32], [33]]。如果使用GO构建PhC缺陷,可以在确保光子局域化的同时引入可控的非线性调制能力,为实现高速、宽动态范围的全光非线性激活器件提供途径。
本文提出了一种基于2D PhC结构的全光非线性激活器件。通过模拟大规模光计算阵列中的高强度信号输出,信号光直接激发了GO缺陷区域中的克尔效应,实现了强度和相位的复数值非线性调制。表1展示了不同光NAF设备的准确性和响应范围的比较。与传统NAFs相比,所选设备在网络准确性和响应范围方面均有显著提升。该设备提供了从毫瓦到瓦级的宽响应范围和快速响应能力,大大扩展了光激活器件在大规模CVONNs中的应用范围。在构建的卷积CVONN中,该激活器件表现出优异的性能:在Fashion-MNIST数据集上的准确率为86.45%;在CIFAR-10数据集上的准确率为60.13%。与最优电子NAF方案相比,所提出的光非线性激活器件性能提高了6.07%和9.08%。该设备为大规模光计算架构中的NAFs实现提供了有前景的解决方案。

部分摘录

用于NAF的PhC器件

图1(a)展示了基于PhC的全光非线性激活器的工作原理。在CVONNs中,输入的复数幅度信号通过相应的光NAFs在强度和相位维度上进行非线性处理,实现复数值激活。如图1(b)所示,当前的片上CVONNs通常使用马赫-曾德尔干涉仪(MZI)阵列进行卷积运算,随后由NAFs处理卷积结果

结论

总之,我们成功开发了一种基于PhC的全光非线性激活器件,用于CVONNs。通过利用信号光调制材料的非线性响应,该器件实现了同时进行强度和相位调制的复数值激活。所提出的器件还展示了较大的响应范围,能够有效处理从毫瓦到瓦级的光输入。

资助

本研究得到了国家自然科学基金(项目编号12,274,478和62571562)的支持。

CRediT作者贡献声明

侯尧康:撰写 – 审稿与编辑,撰写 – 原稿,研究,形式分析,数据管理,概念构思。李大行:撰写 – 审稿与编辑,研究,形式分析,数据管理,概念构思。张国:撰写 – 审稿与编辑,撰写 – 原稿,研究。胡佩:资源获取,方法论。冯帅:撰写 – 审稿与编辑,撰写 – 原稿,监督,项目管理,资金获取,概念构思。

利益冲突声明

作者声明以下可能被视为潜在利益冲突的财务利益/个人关系:
冯帅报告称获得了国家自然科学基金的支持。如果还有其他作者,他们声明没有已知的可能会影响本文工作的财务利益或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号