协变量如何影响 occupancy 模型下相机陷阱调查的最优设计:一项基于模拟的研究及其对野生动物监测的启示
《Remote Sensing in Ecology and Conservation》:Covariates influence optimal camera-trap survey design for occupancy modelling
【字体:
大
中
小
】
时间:2025年10月19日
来源:Remote Sensing in Ecology and Conservation 4.3
编辑推荐:
本文通过模拟分析,系统探讨了在 occupancy 模型中,协变量(如栖息地类型、温度等)对相机陷阱调查设计的影响。研究发现,增加相机数量能持续降低 occupancy(ψ)估计误差,而延长部署时间仅在 occupancy 受协变量影响时有效。忽略 occupancy 协变量会显著增加模型误差,即使投入最大调查努力(9000相机-天)也无法达到预设精度阈值(RMSE=0.15, 0.10, 0.075)。研究强调,在调查设计中必须优先考虑并准确建模 site-level 协变量,以确保资源高效利用并提升物种分布估计的准确性与精确性。
运动激活相机(“相机陷阱”)已成为野生动物监测不可或缺的工具。来自相机陷阱调查的数据可用于推断动物行为、空间利用和种群动态。Occupancy建模是分析相机陷阱数据常用的统计框架,它能在考虑不完全检测的情况下估计物种出现情况。在模型中包含协变量使得研究 occupancy 与环境之间的关系成为可能。调查设计研究帮助实践者决定部署相机的数量、部署时长和相机位置。然而,现有的评估通常假设 occupancy 和可检测性(detectability)是恒定的(即未考虑协变量),这在大多数现实场景中是不现实的。本研究调查了协变量对调查努力与 occupancy 模型的准确性和精确性(即误差)组合之间关系的影响。
监测物种分布并追踪其随时间的变化是生物多样性保护和生态研究的基本组成部分。它为评估脆弱物种的局部灭绝风险、理解人兽冲突以及预测全球气候变化对野生动物种群的影响提供了基本信息。收集广泛分布的陆生动物的行为和空间利用数据在后勤上具有挑战性,特别是对于稀有或隐秘物种,可能需要投入大量财力和人力资源。运动激活数码相机(“相机陷阱”)是近年来快速发展的多项技术之一,包括全球定位系统(GPS)设备和卫星图像,为科学家在大地理区域远程监测动物提供了新的机会。
相机陷阱相比传统监测技术(如直接计数和痕迹调查)具有优势,因为数据收集过程基本上是非侵入性的,并且需要相对较少的调查员努力。它们已被用于研究与种群密度、物种相互作用、时间活动和种群动态相关的广泛生物学问题。相机陷阱调查的可靠性和实用性取决于稳健的研究设计,该设计考虑了关键因素,如动物移动和栖息地偏好、引诱剂(如气味引诱剂)的影响,以及可能影响检测概率的环境条件(如栖息地类型)。一个精心设计的研究确保收集高质量、相关的数据,以满足研究目标。
Occupancy建模是分析相机陷阱数据广泛使用的框架,它考虑了两个因素:(1)物种 occupancy(存在/缺失)和(2)检测概率(即当物种存在时记录到它的概率)。由于检测概率通常小于1,未能考虑这一点会导致估计偏差。Occupancy模型通过使用跨多个站点的重复调查来估计检测概率并提高准确性,从而纠正这一点。该框架的主要好处之一是能够将每个概率建模为可能是站点特定(如栖息地类型、斑块大小和草料质量)和/或调查特定(如温度和月相)的协变量的函数。纳入协变量通常会提高估计的生物学真实性,因为假设跨站点和调查日的 occupancy 和可检测性相等可能是不合理的。此外,量化 occupancy 概率和可检测性如何随环境特征变化通常是主要的研究焦点。例如,捕食者-猎物相互作用、栖息地利用和种群生存力已使用 occupancy-协变量关系进行了探索。这些研究支持保护实践者将努力导向对焦点物种至关重要的景观特征。
通过评估 occupancy 估计的可靠性和推断来评估调查设计对于就相机数量、部署持续时间和位置做出决策至关重要。增加调查努力(即相机站点和调查天数)通常会提高 occupancy 估计的准确性和精确性(即减少误差)。然而,最优调查策略可能取决于目标物种的特征。例如,对于易于检测的稀有物种,通过增加相机站点数量可以最有效地减少误差,而对于难以检测但在空间上常见的物种,通过增加调查天数可以更有效地最小化误差。相机陷阱调查通常受到后勤问题的限制,包括设备成本、相机维护、站点访问和数据存储。因此,关于调查优化的研究为替代相机部署策略的相对成本和收益提供了有用的指导。
迄今为止,这些评估假设 occupancy 和检测在跨站点和调查日保持不变(即分析中未使用协变量),这在现实世界场景中很少见。因此,协变量在站点和调查之间的努力分配权衡上影响的程度仍然不确定。最优调查设计可能取决于协变量效应的大小以及它们是站点特定还是调查特定,因为这些因素决定了可用于建模的协变量数据的范围和数量。事实上,预测协变量与 occupancy 和检测关系的强度和方向可以在设计高效调查中发挥重要作用。然而,在许多情况下,关于给定协变量主要影响 occupancy 和/或检测的先验知识有限。因此,调查在估计偏差和浪费调查努力方面错误识别协变量关系的相对成本可以为指导相机陷阱调查设计提供有用信息。
使用实证数据评估替代调查设计具有挑战性,因为研究站点之间可能存在广泛的条件差异(如栖息地、天气和海拔),并且它们的影响可能因分类群而异。计算机模拟非常适合探索协变量对调查设计权衡的影响,因为可以操纵协变量属性(如空间范围和效应强度)以促进调查。尽管有模拟工具可用于探索研究设计(GENPRES;SODA),但这些程序的功能目前仅限于比较预定义站点组之间的 occupancy(即仅研究分类协变量的效应)。
本研究旨在调查协变量如何影响与调查努力相关的 occupancy 模型的准确性和精确性(即误差)。使用虚拟物种的模拟检测历史,我们评估了站点和调查特定协变量对 occupancy 和可检测性的影响。我们评估了调查设计因素(相机数量、部署持续时间、位置和协变量效应大小)如何影响参数误差,包括在 occupancy 模型中包含和不包含协变量的情况。我们假设最优调查设计取决于协变量效应的类型(即站点或调查特定)和大小,以及它们主要影响 occupancy 还是可检测性。此外,我们预期,在相同的调查努力水平下,正确包含有影响协变量的模型将比忽略它们的模型产生更低的误差。基于我们的发现,我们为当预期存在协变量效应时设计相机陷阱调查以估计物种 occupancy 提供了广泛建议,并强调了当此类效应未知时次优设计的潜在成本。
方法是Shannon等人使用的模拟方法的扩展。模拟参数化以研究2700种不同场景,这些场景因相机数量(站点:N=10, 30, 50, 70, 90)、调查天数(场合:S=20, 40, 60, 80, 100)、位于栖息地斑块中的相机比例(Prop=0, 0.2, 0.4, 0.6, 0.8, 1)以及影响可检测性的协变量类型(EffectType(p)=站点特定或调查特定)以及协变量对 occupancy 的效应大小(Magnitude(ψ)=无、弱或强)和可检测性(Magnitude(p)=无、弱或强)而异。
站点特定协变量被模拟以模仿斑块状分布的资源(如林地、水源和湿地),周围环绕着替代的、较低质量栖息地土地覆盖类型的矩阵。Prop代表位于这些栖息地斑块中的相机站点(N)的比例,反映了现实世界场景,其中观察到的协变量异质性可能源于其空间范围、分布或所使用的相机部署策略的变化。例如,当目标是估计栖息地偏好时,通常使用均匀采样。或者,当评估 occupancy 与栖息地斑块特征(如质量、盐度和植物物种丰富度)之间的关系是研究目的时,可能使用非均匀采样,或者需要跨栖息地类型分层采样。调查特定协变量被模拟以代表跨调查场合变化但不跨相机站点的环境或观测因素,如温度、儒略日或月相。
为每个组合(即N、S、Prop、EffectType(p)、Magnitude(ψ)和Magnitude(p)的组合,从k=1,…,2700)创建了500组检测历史。检测历史由N×S个事件组成,其中每个第i个相机站点被占用或不被占用(yi),从i=1,…,N,遵循概率为ψi的伯努利过程。在占用站点,然后确定物种在每个场合从j=1,…,S是否被检测到,遵循概率为pi或pj的伯努利过程,当EffectType(p)是站点特定或调查特定时。
Occupancy(ψ)被建模为站点特定协变量的函数,而检测概率(p)被建模为要么站点特定要么调查特定协变量的函数,取决于EffectType(p)。在每个模拟中,站点被认为处于焦点栖息地的斑块中(n=N×Prop)或周围矩阵中(n=N×(1-Prop))。对于栖息地斑块中的每个相机站点,从均匀分布生成0到10之间的随机值以代表斑块的某个特征(如栖息地质量)。矩阵中的相机站点被分配栖息质量值为0。使用逻辑模型计算概率ψ,其截距和斜率项如表1所示。概率ψ在矩阵站点是恒定的(0.4),并且随着包含它的相机站点的栖息地斑块质量的增加而增加,代表了一种机制,即物种使用一系列栖息地但偏好给定类型的更高质量斑块。相同的方程结构用于建模检测概率。对于EffectType(p)为站点特定的场景,可检测性p被建模为栖息地类型的函数,并假设在矩阵中较低(p=0.05,表1),代表物种在栖息地斑块中更易检测的场景(p=0.3,后文称为“斑块站点”,表1),可能是因为活动更高,或更容易识别游戏路径。对于EffectType(p)为调查特定的场景,使用与ψ类似的程序模拟p的协变量值。为每个调查日从均匀分布生成0到10之间的随机值以代表动态环境变量(如温度),并使用逻辑模型估计调查特定的p。
截距和斜率项被计算为代表具有低到中等 occupancy 和低可检测性的物种,当协变量值为零时(例如在矩阵站点或温度为0)。Occupancy和可检测性增加到中等或高水平取决于协变量效应的强度,弱效应导致中等增加,强效应导致高 occupancy 和可检测性。用于创建虚拟物种检测历史的参数值代表了在陆生哺乳动物实证研究中观察到的值范围。
Occupancy modelling and error estimation
使用“RPresence”包中的单季单物种 occupancy 模型分析模拟检测历史,该包实现了软件程序PRESENCE中可用的统计模型。假设(i)站点对 occupancy 变化是封闭的,(ii)物种检测和每个站点的检测历史是独立的,以及(iii)物种被正确识别(即没有假阳性)。
对于每个场景(即N、S、Prop、EffectType(p)、Magnitude(ψ)和Magnitude(p)的组合,从k=1,…,2700),我们拟合了四个模型:(1)“常数”:ψ(.)p(.),其中ψ和p保持不变,(2)“仅Occupancy”:ψ(栖息地质量)p(.),其中ψ随栖息地质量变化而p保持不变,(3)“仅Detection”:ψ(.)p(温度/栖息地类型),其中ψ保持不变而p随温度或栖息地类型变化,以及(4)“Occupancy和Detection”模型:ψ(栖息地质量)p(温度/栖息地类型),其中两个参数都随协变量变化。使用均方根误差(RMSE)计算误差,它是准确性和精确性的度量。
为了评估协变量对最优调查设计的影响,选择了三个不同的RMSE目标值(0.15、0.10和0.075)来代表不同的误差水平。与Shannon等人进行的分析一致,场合数(S)和相机数(N)被加权相等。最优调查设计被估计为估计 occupancy 达到所需误差水平所需的最小调查努力(N×S)。最后,为了评估未能考虑协变量效应的相对惩罚,我们计算了最优模型(例如,当协变量影响 occupancy 而不影响检测时应用的仅Occupancy模型)和忽略一个或多个有影响协变量的次优模型之间的误差差异(ΔRMSE=RMSEOptimal–RMSESub-optimal)。ΔRMSE相对于总调查努力和效应大小计算,其中负值表示由于协变量忽略导致的更差模型性能(即误差增加)。
需要注意的是,只有来自有效模型的输出才被包含在结果中。对于一个模型有效,它必须满足以下标准:(1)收敛到至少三位有效数字(在RPresence模型输出中提供),(2)无方差-协方差(VC)警告,(3)朴素 occupancy >0且<1,以及(4)β估计<=6.906755且>=-6.906755,这代表参数(ψ或p)估计对于协变量1个标准差单位变化的最大0.999变化(仅适用于协变量模型)。
增加相机数量在所有模拟场景中一致降低了 occupancy(ψ)估计的均方根误差(RMSE)。然而,一个关键发现是,增加调查天数仅在 occupancy 受协变量影响时减少误差,而当协变量影响可检测性时影响最小。当 occupancy 的协变量效应较弱时,需要更大的总调查努力(站点和调查),而当可检测性受调查特定协变量弱影响时,需要更多站点数量。相反,当可检测性协变量是站点特定时,效应大小影响最小。
忽略 occupancy 协变量显著降低了模型性能(即误差更大),特别是当效应大小很强且中间比例的相机位于栖息地斑块中时。此外,在 occupancy 和可检测性都受协变量影响的场景中,未考虑 occupancy 效应的模型无法达到任何预定义的误差阈值,即使使用最大调查努力(9000相机-天)。相反,忽略可检测性协变量对模型性能影响很小,无论效应大小如何,也无论协变量是站点特定还是调查特定。在 occupancy 协变量缺失或影响微弱的场景中,忽略协变量偶尔在较低调查努力水平下提高了性能,很可能是由于估计效应(即回归系数)的不确定性。
我们使用模拟方法评估了协变量对与相机陷阱调查努力相关的 occupancy 模型的精确性和准确性(即误差)的影响。结果表明,增加相机数量一致减少了误差。然而,较长部署的相对好处和实现精确目标所需的总调查努力取决于哪个模型参数(occupancy 或可检测性)受协变量影响以及效应的大小。此外,我们发现增加调查努力只有在 occupancy 相关协变量的效应在模型中得到适当考虑时才会减少误差。相反,未能包含影响可检测性的协变量影响很小。我们的发现强调了在调查设计过程中优先考虑生物学相关协变量以确保高效监测和精确 occupancy 估计的重要性。
最大化相机数量和考虑 occupancy 协变量效应的好处在所有调查设计场景中都很明显。协变量用于满足跨站点和调查的 occupancy 和检测概率异质性在每个参数建模中得到考虑的假设。在空间协变量(如栖息地类型或质量)是异质性来源的场景中,部署更多相机扩展了可用于建模的数据范围和覆盖范围。这反过来改善了效应估计和模型区分竞争假设(如评估栖息地偏好)的功效。重要的是,我们的结果表明,除非站点水平异质性使用协变量适当量化和建模,否则增加调查努力不太可能对模型性能提供任何好处。因此,在研究设计的最早阶段识别和考虑潜在有影响的协变量是提高估计精确性和防止额外相机或延长部署浪费使用的有效方式。
在现实世界场景中,occupancy 和可检测性可能受各种空间可变因素影响,其效应可能未知。此外,环境特征可能在多个层次水平上变化,如我们研究中使用的栖息地变量所示,该变量按类型(如森林和草原)和质量(低-高)变化。我们的发现表明,虽然标准化站点选择(例如通过选择所有相同栖息地类型的站点,在我们的模拟中由Prop=1表示)可以消除一个空间异质性来源,但假设恒定 occupancy 可能由于额外因素的未建模效应而不合适。这强调了在选择站点相对于协变量梯度时考虑研究主要目标的必要性。简单随机抽样非常适合识别跨广泛栖息地类型的栖息地偏好。然而,对于栖息地特化物种——其偏好是先验已知的——瞄准这些栖息地并将相机均匀分布在次要因素(如质量或草料可用性)的值范围内可能提供更有用的数据。结合这些策略对于调查稀有或未被充分研究的物种可能有用,其中有限的先验栖息地利用知识可用于通知站点选择。最初,相机可以部署在均匀网格中,然后重新部署到偏好的栖息地。
当异质性来源是时间动态因素(如月相或温度)时,直觉上增加部署持续时间可能有益于模型性能,因为更长的调查允许观察更广泛的协变量值以估计效应。然而,我们的结果不支持这一假设。增加部署长度仅在可检测性保持不变(即不受协变量影响)时减少误差。更长的相机部署通过增加累积检测概率(即在整个调查期间至少检测到物种一次的概率,p)帮助区分给定站点的未检测是由于真实缺失(即站点未被占用)还是低可检测性。随着p接近1,可检测性停止影响 occupancy 估计,额外的调查变得冗余。在没有协变量效应的情况下,我们研究中使用的基线检测概率(p=0.05)导致p范围从最短部署(S=20天)的0.65到80天或更長部署的0.98。模拟协变量将平均检测概率(即跨站点和调查的平均p)从0.05基线提高到弱和强效应的最小值分别为0.08和0.18。这些p值对应于最短部署的p估计值分别为0.81和0.98,仅随额外调查天数略微增加。这可能解释了为什么当可检测性受协变量影响时,延长部署持续时间对模型性能影响很小,以及为什么排除这些协变量的影响远小于忽略影响 occupancy 的协变量。
在基线可检测性非常低(即p<0.05)、可检测性受环境因素强烈抑制或部署少于20天的情况下,部署持续时间——以及忽略可检测性协变量的影响——可能对估计误差产生更强的影响。例如,爬行动物 occupancy 研究通常依赖于非相机调查方法,这些方法在后勤上通常限于非常少的重复次数(<10次)。在这些情况下,纳入可检测性协变量可能与考虑影响 occupancy 的因素同等重要。然而,20天部署反映了相机基 occupancy 研究通常使用的持续时间的较短端。此外,我们模拟中的基线可检测性和效应大小值代表了在实证研究中观察到的值,因此研究结果应适用于使用相机陷阱研究站点 occupancy 模式的广泛分类群和情况。
为方便起见,我们参数化我们的模拟,使得可检测性完全是站点特定或调查特定的。然而,有许多现实世界案例中影响可检测性的因素在空间和时间上都变化。例如,温度可能每天波动,但也可能在不同海拔的站点之间变化。在这种情况下,由于可检测性的额外空间异质性,更长持续时间的部署可能有益。这可以通过调整我们的代码来模拟既是站点特定又是调查特定的协变量来探索。我们的分析也可以扩展以探索 occupancy/可检测性的季节性变化如何影响调查优化。例如,如果物种在夏季比冬季更活跃,因为环境条件更有利,检测概率可能在夏季更高,意味着需要更少的重复调查来实现相同水平的估计准确性/精确性。此外,相机陷阱通常用于监测多个物种,每个物种可能对环境因素反应不同。在我们的模拟框架内使用多物种和/或多季节模型可能有助于评估这些更复杂条件下的调查优化。
与任何生态研究的设计一样,给定调查策略的潜在好处必须与实施的实际成本进行权衡。在计算实现误差低于目标值所需的最小调查努力时,本研究中的相机数量和调查天数被加权相等。在现实世界场景中,每个调查组件可能具有不同的人力和财务成本,需要在研究的后勤约束内考虑以找到有效的解决方案。还有与收集协变量数据相关的成本,这些成本可能因所需数据类型以及研究的生态背景和规模而有很大差异。遥感环境数据已为全球许多国家收集,并可从欧洲空间局和哥白尼全球土地服务等来源免费获取。然而,关于更精细尺度(如栖息地结构)或动态(如猎物可用性)协变量的数据可能更具挑战性和昂贵性。现实世界成本已在先前相机陷阱调查评估中进行评估,可以扩展到包括协变量数据的收集。
我们的研究证明了在相机陷阱调查设计中考虑协变量对 occupancy 和检测概率影响的基本重要性。虽然结果表明延长相机部署可能部分补偿未建模的可检测性协变量,但忽略对 occupancy 的影响不太可能通过任何水平的增加调查努力来缓解。因此,我们建议研究人员明确定义研究目标,并在设计过程早期优先识别关键协变量。当空间异质性是一个问题时,增加跨协变量梯度的相机覆盖可能增强模型性能。此外,明显同质协变量(如栖息地类型)的特征(如质量)可能在空间上变化,并应尽可能考虑。相反,时间协变量可能不值得证明更长持续时间部署的合理性,除非物种特别稀有和/或对可检测性的影响是负面的。
尽管模拟研究提供了有用的理论指导,但用实证数据验证我们的结果将很重要。建模协变量增加了复杂性,使得用实证数据验证非常具有挑战性,因为广泛因素可能影响观察到的协变量与 occupancy/可检测性之间的关系,包括空间和时间尺度、生态背景、群落组成和物种丰度。然而,诸如由Google支持的Wildlife Insights、Snapshot(欧洲、美国、日本和巴西)和eMammal存储库等倡议已经收集了来自世界各地的广泛物种的相机陷阱数据。这些大型、集中的数据集可能促进适当详细的分析,从中结果可以转移到一系列物种、生态背景和调查场景。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号