非平稳感觉决策中内状态切换的调控因素识别及其计算建模研究
《Nature Communications》:Identifying the factors governing internal state switches during nonstationary sensory decision-making
【字体:
大
中
小
】
时间:2025年11月28日
来源:Nature Communications 15.7
编辑推荐:
本研究针对传统感知决策模型难以捕捉非平稳环境中动态策略切换的问题,开发了一种包含输入驱动转换和观测的先进内状态模型。研究人员将隐马尔可夫模型(HMM)与两组每状态广义线性模型(GLM)相结合:用于状态和刺激依赖性选择的伯努利GLM(GLM-O)及用于状态间输入依赖性转换的多项式GLM(GLM-T)。通过对国际脑实验室(IBL)小鼠决策任务数据的分析,发现四状态模型能准确描述行为特征,揭示小鼠在偏倚刺激块中优先使用对应偏倚策略,且过去奖励可预测向脱离状态的转换,可能与饱腹感相关。该研究为理解动态决策行为提供了新框架。
在复杂多变的环境中,生物体如何灵活调整决策策略是神经科学的核心问题。传统感知决策模型通常假设动物采用单一恒定策略,然而现实世界充满非平稳性——奖励规则和刺激概率会随时间动态变化。这种模型局限性使得我们难以理解动物在面对不断变化的任务环境时,如何快速切换内状态以适应新情境。
近日发表于《Nature Communications》的研究通过开发一种新型计算框架,揭示了小鼠在非平稳感觉决策任务中内状态切换的调控机制。研究团队结合隐马尔可夫模型(Hidden Markov Model, HMM)和广义线性模型(Generalized Linear Model, GLM),创建了能够捕捉行为策略动态变化的GLM-HMM模型。该模型的创新之处在于同时包含观测GLM(GLM-O)和转换GLM(GLM-T),分别描述不同状态下决策策略的特征以及驱动状态间转换的因素。
研究团队分析了国际脑实验室(International Brain Laboratory, IBL)收集的大规模小鼠行为数据,涵盖123只小鼠的数十万次试验。在这个视觉决策任务中,小鼠需要报告出现在屏幕左侧或右侧的正弦光栅的位置,任务设计包含随机交替的左侧偏倚和右侧偏倚区块,要求小鼠整合感官信息与先验知识以获得最佳表现。
研究采用最大后验估计(Maximum A Posteriori, MAP)和期望最大化算法(Expectation-Maximization, EM)进行模型拟合,使用5折交叉验证评估模型性能。观测模型包含刺激、过去选择等协变量,转换模型则纳入经过指数滤波的行为协变量。通过比较不同状态数量的模型,确定四状态模型在解释力和简洁性间达到最佳平衡。
通过比较不同状态数量模型的性能,研究人员发现四状态GLM-HMM在测试对数似然度方面表现优异,同时保持了良好的可解释性。状态特异性观察权重分析揭示了两种参与状态(Engaged-L和Engaged-R)和两种偏倚状态(Biased-L和Biased-R)。参与状态表现出较高的刺激权重和适度的偏倚权重,而偏倚状态则显示较低的刺激权重和强烈的方向性偏倚。
状态特异性心理测量曲线进一步证实了这些策略差异。参与状态的心理测量曲线斜率较陡,表明对刺激对比度变化敏感;而偏倚状态的曲线较平缓,反映了强烈的方向偏好。模型生成的心理测量曲线与实验数据高度一致,验证了GLM-HMM捕捉小鼠决策行为的能力。
转换GLM权重的分析揭示了状态间转换的规律性模式。左侧偏倚状态(状态1和3)与过滤选择和过滤刺激侧的负权重相关,而右侧偏倚状态(状态2和4)则显示正权重。更重要的是,过去奖励在预测参与和脱离状态间的转换中起关键作用——参与状态(状态1和2)中过滤奖励权重为负,而脱离状态(状态3和4)中为正,表明奖励积累可能导致向脱离状态的转换,可能与饱腹感相关。
研究还引入了三个时间基函数来捕捉每节实验开始时的"热身效应"。这些基函数有效建模了动物在实验初期行为策略的适应性变化,丰富了状态转换动态的描述。
通过分析后验状态概率的时间轨迹,研究发现小鼠在偏倚区块中确实更可能处于对应偏倚的状态。例如,在右侧偏倚区块中,状态2(Engaged-R)和状态4(Biased-R)的后验概率显著升高。从偏倚区块开始到首次转换至对应偏倚状态的中位时间为9次试验,表明小鼠能够相对快速地调整策略以适应环境变化。
状态占据比例分析显示,在偏倚区块中,小鼠约72%的时间处于相关偏倚状态(如右侧偏倚区块中的Engaged-R和Biased-R),而仅28%的时间处于不相关状态。这种策略匹配性使小鼠即使在脱离状态也能通过偏向当前高概率侧维持较好表现。
为验证模型的普适性,研究团队对每只小鼠的数据分别进行拟合。结果显示,大多数动物都表现出类似的四状态模式,观察权重和转换权重在不同个体间高度一致。所有37只小鼠的四状态GLM-HMM均优于单状态GLM,证明了该框架在描述小鼠决策行为方面的稳健性。
包含GLM-T的模型在多个方面表现出优势:能更好地区分参与和脱离状态的反应时间;更准确地捕捉实验开始时的热身效应和实验末期的饱腹效应;对具有试验依赖性转换的数据拟合更优。合成数据验证表明,当数据中存在试验依赖性转换时,GLM-T模型比非GLM-T模型性能提高0.009比特/试验,对于大规模数据集而言这一改进极为显著。
该研究开发的GLM-HMM框架为理解非平稳环境中的决策行为提供了强大工具。研究发现小鼠采用离散策略状态,并通过特定模式在状态间转换:过去选择和刺激驱动左右偏倚状态间的转换,而过去奖励则调控参与和脱离状态间的转换。奖励积累与脱离状态的关联提示饱腹感可能是影响任务参与度的重要因素。
这项研究不仅推进了对决策行为动态的理解,也为未来研究指明了方向:探索个体差异的持久性、比较离散状态与连续状态模型、整合神经活动数据以揭示决策的神经机制,以及开发分层模型进一步捕捉行为的复杂性。通过将计算建模与大规模行为数据相结合,这项工作为理解大脑如何适应动态环境提供了重要见解。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号