从基于生物学原理的初级视觉皮层学习模型中,稀疏编码、平衡性和去相关性的出现
《PLOS Computational Biology》:Emergence of sparse coding, balance and decorrelation from a biologically-grounded spiking neural network model of learning in the primary visual cortex
【字体:
大
中
小
】
时间:2025年11月22日
来源:PLOS Computational Biology 3.6
编辑推荐:
该研究构建了一个基于生物神经动态原理的初级视觉皮层(V1)模型,通过突触时间依赖性可塑性(STDP)和自稳机制,验证了稀疏编码、兴奋-抑制平衡及活动去相关性的自发形成。模型显示,自然图像输入下,神经元可学习具有Gabor函数特征的多样性感受野,并呈现时间稀疏性和群体稀疏性,同时抑制性神经元通过STDP与兴奋性神经元形成去相关性,并通过动态调整阈值和权重实现网络稳定。研究还验证了模型对参数和规模变化的鲁棒性。
### 神经网络中稀疏性、平衡性与去相关性的形成机制研究
神经网络在大脑中展现出的稀疏性、平衡性以及去相关性一直是神经科学和计算神经学研究的核心议题之一。这些特性不仅影响着神经网络的信息处理效率,还与网络的稳定性、能量利用以及信息表征的精确性密切相关。尽管已有大量实验和计算模型试图解释这些特性为何能实现,但如何从生物机制出发,让这些特性自然地从神经网络中涌现,仍然是一个未解之谜。本文通过构建一个基于实验观察的神经网络模型,探讨了这些特性是如何在大脑中形成的。
#### 1. 为什么这些特性重要?
在初级视觉皮层(V1)中,神经元对视觉刺激的反应通常表现出稀疏性,即每个神经元只对少数特定的视觉特征做出强烈反应。这种稀疏性有助于减少冗余信息,使神经网络能够以更高效的方式处理复杂的视觉输入。此外,神经元的稀疏编码还与神经网络的稳定性有关,因为这种编码方式可以防止网络因过度活跃而出现病理性的神经活动。
平衡性是神经网络中的另一个关键特征,它指的是神经元在兴奋和抑制输入之间的动态平衡。这种平衡可以防止网络出现失控的活动,并且有助于保持神经元的稳定工作状态。同时,平衡性也被认为可以增强神经网络对输入信息的表示精度,使其能够更准确地编码外界的刺激。
去相关性则指的是神经元之间在响应上的不相关性,它有助于神经网络避免冗余的表征,从而最大化信息的编码效率。这种去相关性在视觉系统中尤为明显,因为神经元的响应往往呈现出一种“群体稀疏性”,即对某一特定刺激,只有少数神经元会表现出显著的活动。这种特性不仅体现了神经元之间的竞争关系,还反映了大脑在信息处理中的高效策略。
#### 2. 本研究的模型设计
为了回答上述问题,本文提出了一种基于生物机制的神经网络模型。该模型模拟了初级视觉皮层的神经活动,并引入了神经元的兴奋性和抑制性两种类型,以符合实验中观察到的Dale定律(即每个神经元只能对其他神经元产生单一类型的效应)。模型中的神经元采用了泄漏积分和发放(LIF)模型,这是一种能够准确反映神经元响应特性的计算模型,能够捕捉到神经元在时间上的整合行为以及非线性发放机制。
模型中的输入来自外侧膝状体(LGN)的ON和OFF神经元,这些神经元分别对局部亮度的正负变化做出反应。LGN神经元的输入经过空间滤波处理,以模拟视网膜和LGN对视觉信息的处理过程。这种处理方式使得模型能够更真实地反映视觉系统的生理特性,而不仅仅是使用简单的负输入来表示亮度低于平均的情况。
在学习过程中,所有突触都采用基于时间的突触可塑性规则(STDP),即根据突触前后神经元的发放时间差来调整突触权重。这种规则不同于人工神经网络中常用的全局优化方法(如反向传播),而是基于突触局部的信息进行学习。此外,模型还引入了稳态可塑性机制,通过调整神经元的发放阈值和突触权重,使得神经元能够维持其平均发放率在特定范围内。
#### 3. 模型中的关键特性
通过上述机制,模型中展现出多个与生物神经网络一致的特性。首先,模型中的神经元在面对视觉刺激时表现出时间稀疏性,即只有部分神经元对特定刺激做出强烈反应。这种时间稀疏性与神经元的稀疏编码机制相呼应,使得网络能够以最小的能量消耗来表征输入信息。
其次,模型中的神经元群体表现出稀疏性。对于每一个视觉刺激,只有少数神经元被激活,从而实现了群体稀疏性。这种特性不仅体现了神经元之间的竞争关系,还表明网络在信息表征上具有高度的选择性。此外,模型中的神经元还表现出平衡性,即兴奋性和抑制性输入在时间尺度上保持同步变化,从而防止网络出现失控的活动。
最后,模型中的神经元响应呈现出去相关性。这种去相关性不仅体现在神经元之间的活动模式上,还体现在它们的接收场(receptive field)上。通过STDP规则的学习,神经元的接收场逐渐变得不相关,从而避免了信息的冗余表征。
#### 4. 模型的鲁棒性
为了验证模型的鲁棒性,研究者对网络参数进行了随机扰动,并观察其对模型性能的影响。结果显示,即使在参数扰动的情况下,模型仍然能够保持其稀疏性、平衡性和去相关性。这一发现表明,模型中的机制具有一定的自适应能力,能够在不同的输入条件下保持稳定的神经活动。
此外,研究者还测试了模型在不同目标发放率下的表现。当兴奋性神经元的目标发放率被提高时,模型的稀疏性下降,而抑制性神经元的发放率则保持相对稳定。这表明,网络中的机制对目标发放率的变化具有一定的敏感性,但其整体行为仍然保持稳定。
#### 5. 神经网络的生物学意义
本研究的模型不仅在计算上具有鲁棒性,还在生物学上具有重要意义。它揭示了神经网络中稀疏性、平衡性和去相关性是如何通过突触可塑性和稳态机制自然形成的。这些特性并不是人为设定的,而是通过神经元之间的相互作用和学习规则自发产生的。
这一发现对理解大脑的功能具有重要价值。它表明,大脑中的神经网络并非简单的静态结构,而是通过动态的学习和调整,逐渐形成具有高效信息处理能力的结构。同时,该模型也为构建更节能的人工神经网络提供了启示。由于突触可塑性规则和稳态机制能够实现高效的神经活动,因此它们可能为未来的人工神经网络设计提供新的思路。
#### 6. 模型的局限性与未来方向
尽管本研究的模型在多个方面与生物神经网络相似,但它仍然存在一些局限性。例如,模型中的神经元并未表现出拓扑结构,这意味着它们之间没有基于距离的横向连接。这种结构在实际的大脑中是存在的,比如视觉皮层中的方向偏好图(orientation map)和超柱结构(hypercolumn)。因此,未来的研究可以考虑引入基于距离的连接机制,以更真实地模拟大脑的神经网络结构。
此外,模型中采用的是基于时间的突触可塑性规则,而实际的生物突触可能还涉及其他复杂的可塑性机制。例如,一些研究指出,突触的可塑性不仅依赖于发放时间差,还可能受到其他因素的影响,如神经元的活动水平和突触的强度。因此,未来的研究可以进一步探索这些因素对网络性能的影响。
最后,模型中的神经元仅使用了基于电流的突触连接方式,而实际的生物突触可能采用基于电导的机制。这种机制能够更真实地反映神经元的动态特性,因为它允许神经元的响应时间常数随着活动水平的变化而调整。因此,未来的研究可以尝试使用基于电导的突触连接方式,以更精确地模拟生物神经元的行为。
#### 7. 结论
本研究通过构建一个基于生物机制的神经网络模型,揭示了稀疏性、平衡性和去相关性是如何在大脑中自然形成的。这些特性不仅在实验中被观察到,而且在模型中也得到了重现。这表明,神经网络的这些特性并非仅仅是随机的结果,而是由特定的神经元行为和学习规则所驱动的。
模型的鲁棒性进一步表明,这些特性具有一定的适应性,能够在不同的输入条件下保持稳定。这为理解大脑的神经网络功能提供了新的视角,也为构建更高效的人工神经网络提供了理论支持。未来的研究可以在此基础上进一步拓展,引入更复杂的神经元结构和学习规则,以更全面地模拟大脑的神经网络行为。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号