反铁磁可编程神经元:结构创新、可控训练及其在模式识别中的应用

《IEEE Journal on Exploratory Solid-State Computational Devices and Circuits》:Antiferromagnetic Programmable Neuron: Structure, Training, and Pattern Recognition Applications

【字体: 时间:2025年11月23日 来源:IEEE Journal on Exploratory Solid-State Computational Devices and Circuits 2.7

编辑推荐:

  本刊编辑推荐:为解决传统反铁磁(AFM)自旋霍尔振荡器(SHO)神经元仅具单输入而限制其应用的问题,研究人员开展了基于AFM SHO的可编程人工神经元(P-neuron)研究。通过构建双层神经网络结构,实现了对多输入信号的独立实时调控,并演示了其在小图像(5×5像素)英文字符识别中的有效分类能力。该研究为开发超高速、低能耗的AFM基神经形态计算系统提供了重要思路。

  
在人工智能日益渗透至各领域的今天,开发高效、低功耗的神经形态计算系统成为迫切需求。传统基于冯·诺依曼架构的人工智能系统存在并行处理能力不足、能耗高等固有局限,而生物大脑在图像识别、自适应决策等任务上展现出的卓越效率,激励着研究人员寻求仿生解决方案。其中,利用非线性振荡器模拟生物神经元脉冲发放行为的神经形态电子学崭露头角,例如英特尔的Loihi和IBM的TrueNorth芯片。近年来,基于磁性材料的人工神经元因其潜在的高速度和低功耗特性受到广泛关注。特别是反铁磁(AFM)材料,由于其具有超快动力学特性(可达太赫兹频率)和极高的稳定性,成为实现超高速神经形态器件的理想候选者。
然而,尽管AFM自旋霍尔振荡器(SHO)已被证明能够产生皮秒量级的脉冲, mimicking生物神经元的反应,但传统的AFM神经元通常只有一个有效输入。无论其物理输入端口有多少,作用于神经元的最终都是这些输入电流的总和,这使得它本质上仍是一个单输入设备,极大地限制了其在复杂任务(如图像识别)中的应用灵活性。为了突破这一瓶颈,研究人员将目光投向了多输入可编程神经元的设计。
本研究发表在《IEEE Journal on Exploratory Solid-State Computational Devices and Circuits》上,提出了一种基于AFM SHO的可编程人工神经元(P-neuron)的创新实现方案。该方案的核心思想是将P-neuron构建为一个简单的双层神经网络。
如Figure 2所示,P-neuron的第一层包含多个(例如图中为两个)传统的AFM神经元(A和B),每个神经元拥有独立的输入,可以接收独立的直流(dc)和交流(ac)电流信号。这些第一层神经元的输出被连接到一个第二层的单一主AFM神经元(C)上。第一层神经元的功能类似于人工突触,通过调节施加在它们上面的直流电流密度(如jdc,A, jdc,B),可以独立且实时地改变整个系统对各个输入信号的“敏感度”,从而实现对P-neuron的“编程”。第二层神经元C整合所有来自第一层的脉冲信号,并产生整个P-neuron的最终输出。
为了验证P-neuron的功能,研究人员主要采用了数值模拟方法,核心是求解描述反铁磁层内奈尔矢量(Néel vector)动力学的非线性微分方程(Landau-Lifshitz-Gilbert-Slonczewski方程的简化形式)。通过分析不同直流偏置和交流信号激励下,各神经元奈尔矢量角速度的时间演化,来研究其脉冲生成特性。此外,研究还引入了基于Widrow-Hoff规则的学习算法,通过比较输出脉冲时间与目标时间的误差,反向调整第一层神经元的等效突触权重(即其直流偏置电流),实现了P-neuron的“受控训练”。模式识别任务的评估则是通过将5x5像素的英文字符图像编码为第一层25个神经元的输入状态来进行的。
P-neuron的运作机制与可控性
研究人员通过数值模拟详细分析了P-neuron的脉冲生成行为。模拟基于典型的NiO/Pt SHO参数,其动力学由方程(1)描述。当施加到神经元的总电流密度j(t) = jdc + jacsin(2πfact)超过阈值jth时,AFM层的磁亚晶格会发生180度翻转,产生一个短暂的输出电流脉冲。
如Figure 3所示,通过选择不同的直流偏置电流(jdc,1, jdc,2, jdc,C)以及交流信号的幅度和频率,P-neuron可以呈现出不同的脉冲输出模式:无脉冲、单脉冲(“One spike” regime)或爆发多个脉冲(“Bursting” regime)。这表明P-neuron的输出可以通过输入参数进行灵活调控。
P-neuron的“相图”与稳定性
为了系统性地展示P-neuron的可编程性,研究人员绘制了其在不同归一化直流输入电流(jdc,1/jth, jdc,2/jth)下的脉冲生成“相图”。
如Figure 4所示,相图清晰地展示了不同参数区域对应的操作模式。当输入交流信号不对称时,相图(a)也呈现不对称性;而当输入交流信号对称时,相图(b)则呈现对称结构。相图的边界存在模糊区域,暗示了系统中可能存在双稳态或混沌动力学行为。研究指出,在远离模式边界区域运行时,P-neuron表现出良好的稳定性,参数变化15-20%仍能保持模式不变。
模式识别应用与受控训练
本研究的一个重要贡献是演示了P-neuron通过受控训练执行模式识别任务的能力。研究人员构建了一个包含25个输入神经元(对应5x5图像像素)的第一层和一个输出神经元(T)的第二层网络(如Figure 5示意图)。每个黑色像素对应一个输入神经元接收触发信号(产生脉冲),白色像素则对应无输入信号。
训练过程基于监督学习。每个目标符号都有一个理想的“目标时间”td,即输出神经元产生脉冲峰值的时间。训练开始时,所有第一层神经元的“突触权重”(体现为直流偏置电流)被随机初始化。在每次训练周期中,系统输入一个编码后的符号,计算输出脉冲的实际时间ta与目标时间td之间的误差Δt。然后,根据Widrow-Hoff规则,利用误差Δt来调整第一层神经元的权重。
如Figure 6(a)所示,以字母“D”为例,经过60个训练周期后,识别误差从近30 ps显著降低到约0.4 ps。Figure 6(b)展示了对应突触权重的变化过程。训练结束时,不同符号的识别准确率存在差异,例如“K”、“V”、“H”等符号误差极小(~0.05 ps),而“L”、“R”等符号误差较大,这与其像素结构特征较少或与其他符号相似度高有关。总体识别准确率达到约98%。
如Figure 7所示,以字母“O”为例,训练初期权重分布随机,经过10个和60个训练周期后,权重分布逐渐呈现出与目标符号“O”形状相对应的模式,直观地展示了网络的学习过程。
结论与意义
本研究成功提出并验证了一种基于反铁磁自旋霍尔振荡器的可编程多输入人工神经元(P-neuron)。通过将其构建为双层神经网络结构,实现了对多输入信号的独立控制和实时编程,克服了传统AFM神经元单输入限制的缺点。P-neuron能够通过调节直流偏置电流在无脉冲、单脉冲和爆发脉冲等多种模式下灵活切换。更重要的是,该研究首次展示了P-neuron的受控训练能力,并成功应用于小规模图像(英文字母)的模式识别任务,取得了高达98%的识别准确率。
这项工作的重要意义在于:首先,它为构建超高速(太赫兹频率)、高能效(估算能耗低至10-3 pJ/操作)的神经形态计算系统提供了一种可行的硬件实现方案,其性能潜力远超现有技术(如CMOS神经元或Intel Loihi芯片)。其次,P-neuron的可编程性和学习能力使其成为实现自适应实时处理系统的有前途的构建模块。最后,该研究也为优化和开发基于反铁磁材料的其他超快自旋电子器件提供了新的思路和理论基础。尽管在系统扩展性和实际接口实现等方面仍需进一步研究,但这项工作是迈向实用化AFM基神经形态计算的重要一步。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号