利用物种分布模型预测欧洲常见野生哺乳动物分布:现有出现数据是否充足?

《European Journal of Wildlife Research》:Predicting the distribution of common wild mammal species across Europe - are there sufficient occurrence data?

【字体: 时间:2025年10月26日 来源:European Journal of Wildlife Research 2

编辑推荐:

  本文推荐研究人员针对欧洲常见野生哺乳动物分布数据不足的问题,开展了基于物种分布模型(SDM)的预测研究。通过整合GBIF出现数据、IUCN专家分布图和随机森林模型,发现现有数据存在显著地理偏差(东/南欧不足),模型在训练数据环境范围内表现良好(AUC>0.7),但外推可靠性不足。研究创新性提出MESS分析框架,明确了数据收集优先级区域,为EFSA主导的ENETWILD项目及野生动物疾病风险评估提供了关键方法论支持。

  
在人类疾病和牲畜疾病中,超过60%的人类疾病和75%的牲畜疾病与多宿主野生动物疾病相关。理解这些疾病的风险和管理方法,关键在于了解分布广泛且常见的野生动物物种,因为它们是疾病维持的主要驱动因素。然而令人意外的是,即使是常见物种,其分布和数量也存在着巨大的不确定性。以英国相对完善的哺乳动物生物多样性调查为例,鼹鼠(Talpa europaea)、田鼠(Microtus agrestis)和兔子(Oryctolagus cuniculus)等常见物种的种群规模仍存在很大不确定性,这表明欧洲其他地区的调查情况可能更加不理想。
欧洲食品安全局(EFSA)于2017年启动了ENETWILD项目,旨在审查可用数据和建模方法,以预测涉及关注疾病的关键物种的分布。本研究基于现有出现数据开发了最新方法论,并将其应用于预测12种常见欧洲哺乳动物的分布。研究人员利用模型评估输出来突出显示哪些区域的进一步数据收集将最有帮助。
研究团队开发的三步建模框架包括:首先确定物种的长期"稳定"分布范围,排除扩散限制或近期入侵/退缩等因素影响;其次估计物种的相对可检测性/可报告性,识别"充分调查"的地点;最后评估栖息地偏好并预测全欧洲的适宜性。该框架应用于12种常见哺乳动物物种,这些物种涉及非洲猪瘟、狂犬病病毒(包括经典狂犬病)、媒介传播疾病和多房棘球绦虫(Echinococcus multilocularis)等寄生虫感染等多种关注疾病。
关键技术方法包括:基于GBIF的出现数据处理、LoCoH(局部凸包)稳定范围界定、目标群组报告率评估、扩展随机森林(extendedForest)建模以及多变量环境相似性表面(MESS)分析。训练数据来自全球范围内的出现-缺失数据集,环境变量涵盖气候、土地利用、地形和人类干扰等因素。
稳定性分析
通过结合专家绘制的分布图和GBIF的出现数据,研究团队确定了物种的稳定分布范围。他们将30年期间的存在数据划分为一系列滚动的10年窗口,使用局部凸包(LoCoH)方法包围出现点(包括代表专家绘制边界的顶点),假设最大邻域距离为50公里。稳定范围是所有时间窗口范围的交集,即存在一致物种出现证据的区域。
可报告性评估
为了评估物种的可报告性并推导严格的出现-缺失数据集,研究人员考虑了全球最近10年期间收集的观察数据。他们得出了一个二项数据集,描述了到某个地点(1x1公里网格单元)的不同访问(日期),其中要么报告了目标物种(检测),要么没有报告但报告了"相关"物种(非检测)。通过区域基础评估,计算了报告概率,并确定了宣布缺失的最小努力阈值。
适宜性预测
研究选择拟合随机森林回归模型来解释推导的出现-缺失数据。为了避免变量相关性对重要性评估的混淆,他们采用条件分支方法,仅保留每个聚类中的一个变量。对每个拟合进行了十次重复,聚合结果生成变量重要性图和部分依赖图,并预测欧洲范围内的出现可能性(栖息地适宜性)。
模型性能评估
在训练数据环境范围内的模型预测性能总体良好/可接受,基于AUC(曲线下面积)统计量,除棕背鼾(Myodes glareolus)仅达到0.66外,所有物种的AUC均显示0.7或更高。然而,当基于环境相似性故意分割折叠进行交叉验证时(从而评估模型在可用训练数据范围外的预测能力-外推),评估指标显著下降,没有一个物种保持在通常表示中等至良好性能的0.7阈值以上。
变量重要性评估表明,土地覆盖的重要性普遍低于气候(如bio15)、海拔(alt)和人口(hpop)等其他因素。然而,这很可能反映了这些变量之间的高度相关性。具体土地覆盖变量突出了各种符合预期的物种偏好。例如,麋鹿、红松鼠(Sciurus vulgaris)和马鹿(Cervus elaphus)都显示出森林覆盖(lc_1XX代码)的高变量重要性,棕野兔(Lepus europaeus)显示出农作物覆盖(lc40)的高重要性,狍子和欧洲兔(Oryctolagus cuniculus)显示出人口(hpop)的高重要性,岸鼠和戴氏鼠耳蝠(Myotis daubentonii)显示出水体(湖泊和河流;lc_80)的高重要性。
环境相似性分析
对每个物种进行的多变量环境相似性表面(MESS)分析结果被裁剪,以排除没有物种出现证据的单元格。 resulting maps were combined across all species, highlighting countries within Europe where targeted data collection may improve the transferability of model predictions.
总体而言,东欧和南欧国家(俄罗斯、乌克兰、土耳其、罗马尼亚等)的数据缺口广泛存在,将受益于全国性的努力;而北欧和西欧国家(瑞士、奥地利、安道尔和挪威)的数据缺口更为局部化(例如,阿尔卑斯山和比利牛斯山地区)。
研究结论与意义
尽管哺乳动物生物多样性数据记录现已非常广泛,但欧洲的数据收集存在显著地理偏差,主要偏向北部和西部国家。这种空间偏差会严重影响模型输出。本研究报告了一个基于机会性出现数据预测常见广泛分布的欧洲哺乳动物栖息地适宜性的通用框架的长期开发情况。
建模方法在可用训练数据的环境限制内表现良好,但正如预期,超出这些限制时性能和预测变得不可靠。考虑到建模的这种局限性,MESS分析在这些十二个物种中识别出如此大的地理区域是令人惊讶和担忧的。
模型在两种蝙蝠和两种田鼠物种上表现最差。这些物种主要通过特定方法(声学或小型哺乳动物陷阱)记录,小型啮齿类动物在其种群规模中的记录最少。声学监测小型陆生哺乳动物和蝙蝠的潜力可能会随着时间的推移增加这些记录,从而可能提高模型性能。
尽管存在数据限制,所提出的建模方法在所考虑的大多数物种(中型-大型哺乳动物)上表现良好。然而,框架的一些修改有潜力提高性能,值得进一步研究。这包括考虑更精细的空间尺度、更精细尺度划定报告实践、引入校准步骤、应用降采样随机森林来平衡类别,以及直接表示空间依赖性的方法。
MESS分析确定了欧洲进一步收集哺乳动物数据最有用的区域。这包括临时报告(如iMammalia或iNaturalist)和更系统的相机陷阱调查(如欧洲野生动物观察站EOW所使用的)。重要的是,MESS结果需要结合与此相关的物种数量和区域来考虑。
这项工作表明,尽管2023年GBIF在欧洲报告了超过60万条哺乳动物记录,但需要减少数据收集的地理偏差,以改进甚至最广泛分布的常见物种的物种分布模型。下一步是促进特定区域的数据收集,并监测模型输出的改进;将模型预测与密度估计相结合;并确保输出可用于支持相关疾病的风险评估。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号