能量效率驱动预测性重映射与 allocentric 编码——主动视觉循环神经网络模型的涌现机制

《Patterns》:Predictive remapping and allocentric coding as consequences of energy efficiency in recurrent neural network models of active vision

【字体: 时间:2025年11月21日 来源:Patterns 7.4

编辑推荐:

  本研究针对视觉系统在眼动过程中如何维持感知稳定性的“硬绑定问题”,探讨能量效率优化是否足以促发预测性重映射机制。研究人员通过训练循环神经网络(RNN)处理自然场景下的注视序列与扫视efference copies,以最小化神经前激活(preactivation)为目标,发现网络自发涌现出靶向抑制性预测重映射能力,并学会将自我中心(egocentric)眼动坐标转化为以环境为中心(allocentric)的参照框架。该成果表明复杂视觉计算可由能量约束等简单物理原则自然涌现,为理解感知稳定性机制提供了新视角。

  
当我们每秒钟进行三次眼动时,为什么世界在我们眼中依然保持稳定?这个看似简单的问题背后隐藏着视觉科学中的“硬绑定问题”(hard binding problem):尽管视网膜输入随着每次扫视(saccade)发生剧烈变化,我们却能体验到连续稳定的视觉场景。传统理论认为,大脑通过“预测性重映射”(predictive remapping)机制,利用运动指令的副本(efference copy)预测眼动后的视觉输入,从而弥合感知缝隙。然而,这种复杂计算能力的起源始终成谜——究竟是基因编码的精密电路,还是源于更基础的物理原则?
发表于《Patterns》的最新研究给出了一个令人惊喜的答案:能量效率这一简单约束,足以让神经网络自发发展出预测重映射能力。研究人员构建了一个包含两个隐藏层(各2048个单元)的循环神经网络(RNN)模型,模拟人类在自然场景中的主动视觉过程。模型接收来自MS-COCO数据集的注视斑块序列及其对应的相对扫视坐标,训练目标并非完成特定任务,而是最小化神经前激活(preactivation)——一种模拟生物神经能量消耗的指标。通过固定兴奋性输入与能量优化目标的巧妙平衡,系统被促使发展靶向抑制策略而非全面抑制。
关键技术方法包括:利用DeepGaze III模型生成人类注视序列模拟自然观看行为;采用六时间步处理每个注视斑块的RNN架构;通过最小化平均绝对前激活实现能量效率优化;使用线性解码器和硅内损伤(in silico lesioning)分析网络内部表征;设置七种控制条件(包括无efference copy输入、小视野等)验证现象特异性。
抑制性预测重映射作为能量效率的涌现结果
与所有控制条件相比,能量优化模型表现出显著更低的能量消耗损失(p<0.001)。当打乱注视坐标与视觉输入的对应关系时,模型性能急剧下降,证明其真正依赖efference copy信息进行空间预测。更关键的是,模型内部反馈显示出与理想抑制模式高度匹配的空间特异性抑制:
。这种抑制并非全局性,而是精确对准即将被注视的视觉区域,形成类似“空间指针”的预测机制。
Allocentric编码通过整合egocentric efference copies序列而涌现
线性解码器从隐藏层活动成功重建了注视点的全局坐标(x坐标R2=0.91,y坐标R2=0.93),表明网络将相对眼动命令转化为以场景为中心的全域参照系:
。聚类分析显示这些allocentric编码单元形成七个功能簇,分别对应上下左右及中心/周边等空间区域,呈现互补性空间覆盖特征。
Allocentric参照系单元作为预测单元运行
硅内损伤实验证实了allocentric单元的功能必要性:当仅损伤0.5%的关键单元(22个)时,模型能量损失显著增加(p<0.001),且抑制模式从预测未来输入退化为重复当前注视斑块。相关性分析显示完整模型的内部驱动与理想未来抑制高度相关(r=0.46),而损伤后相关性骤降至r=0.05,同时与当前输入的关联性增强(r=0.58)。这证明allocentric单元是实现靶向预测重映射的核心枢纽。
研究结论深刻揭示了能量约束对复杂计算的驱动作用:能量效率优化足以促使网络自发发展出allocentric编码框架,并以此为基础实现抑制性预测重映射。这种涌现机制避免了基因编码复杂电路的需要,为视觉稳定性问题提供了简约而有力的解决方案。更广泛地,该模型架起了视觉与空间导航研究的桥梁,提示海马-内嗅皮层(hippocampal-entorhinal circuits)等导航相关脑区可能采用类似机制编码视觉空间。未来研究可整合工作记忆与任务导向计算,探索能量原则在更复杂认知功能中的作用,同时向更生物可信的学习规则(如替代反向传播通过时间BPTT)和视网膜采样模型拓展。
这项由Thomas Nortmann、Philip Sulewski和Tim C. Kietzmann完成的研究,不仅为解决“硬绑定问题”提供了新范式,更示范了如何从简单物理原则出发理解大脑复杂功能的涌现,为计算神经科学开辟了新的研究路径。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号