首次利用来自多个数据源的信息,对欧洲三种不同类群的土壤动物群进行分布绘制的研究

《Applied Surface Science Advances》:First insights into soil fauna mapping across Europe using data from multiple data sources for three different taxa

【字体: 时间:2025年11月20日 来源:Applied Surface Science Advances 8.7

编辑推荐:

  土壤无脊椎动物分布研究整合欧洲多数据库数据,运用量化回归森林模型分析气候、地形、植被等环境因子对跳蚤、蚯蚓、蜈蚣物种丰富度及密度的空间分布影响,揭示北方和中部欧洲多样性较高,南方和东部数据不足且预测置信度低,指出气候变化和土地利用变化对土壤生物群落的潜在威胁,为欧盟土壤监测与政策制定提供依据。

  土壤生物多样性是土壤生态系统中不可或缺的一部分,其多样性极为丰富,构成了地球物种的约59%。土壤生物不仅在土壤功能中扮演着重要角色,如养分循环、土壤通气、有机物分解、水的调节、土壤结构的构建与维护以及土壤成土过程,还在维持生态系统服务方面发挥着关键作用。土壤动物是土壤生物多样性的重要组成部分,其中包括宏生物,如蚯蚓和千足虫;中生物,如跳虫和螨虫;以及微生物,如线虫和原生动物,它们共同参与了土壤中有机物的聚集和分解过程。跳虫和蚯蚓因其在土壤健康评估中的重要性,常被视为土壤生物多样性的良好指标。

然而,土壤生物多样性在管理决策中的应用仍然受到限制。这种限制部分源于大规模地图绘制和应用所需的数据和知识的缺失。在本研究中,我们的目标是通过绘制代表性的宏观和中型土壤动物的地理分布图,以揭示这些方面。我们使用了公开可用的数据,包括跳虫、蚯蚓和千足虫,绘制了它们在欧洲的丰富度、多样性和分布情况。我们还应用了机器学习技术,以理解这些土壤动物群落的地理格局,以及它们受到地形、气候、植被、土地利用和土壤性质的影响。

研究结果显示,跳虫的丰富度范围从每平方米1000到15000个个体,而稀有化物种丰富度则从每样方2到7种,其中山区的数值高于平原地区。蚯蚓的丰富度范围为每平方米20到300个个体,而物种丰富度则从2到6种,其中斯堪的纳维亚地区的数值高于中欧和东欧。千足虫的丰富度范围从每平方米20到400个个体,物种丰富度从1到6种,其中中央欧洲的数值最高,而北欧最低。尽管这三种分类群在空间模式上显示出显著的差异,但总体而言,土壤动物的多样性在北欧和中欧比南欧更高。然而,南欧的数据较少,这可能造成了该地区多样性低估的情况。

我们的研究进一步表明,跳虫、蚯蚓和千足虫的丰富度和多样性模式主要受到海拔、气候、植被和土地利用的影响,而丰富度则主要受植被和土壤性质的影响。研究结果指出,气候变化,特别是气温上升,可能会对土壤动物群落的演变产生重大影响,尤其是在山区。尽管地图可以提供土壤生态系统和保护趋势的视觉呈现,以及土壤生物多样性热点区域,但我们也发现土壤地图存在高度的不确定性,尤其是在数据不足的地区,如南欧。这种不确定性主要源于土壤动物的高度特有性和分散性,以及当前数据中存在显著的差异,包括历史方法、采样努力和研究范围的不同。

我们的地图绘制方法可以在区域、国家或欧洲尺度上应用,为管理决策和政策实施提供可行的途径。我们的研究强调了继续土壤生物多样性监测工作的必要性,特别是在数据较少的地区,同时推动数据共享,并开展进一步的土壤生物多样性保护和管理研究。

土壤生物多样性目前正面临来自城市化、污染、集约化农业、土地利用变化和气候变化等多重威胁。在地方尺度上,通常用α多样性来表示,影响土壤动物群落结构和功能特征的因素包括植被、气候因素、土壤性质以及生物之间的相互作用。近年来,一些研究开始描述土壤动物在景观尺度上的模式,即β多样性,这些研究显示了特定环境参数对土壤动物分布的影响,例如城市环境对蚯蚓的影响或跳虫的影响。尽管已有这些例子,土壤动物和土壤生物多样性仍常被低估研究,且大规模的空间模式尚不明确。

尽管近年来已经取得了一些进展,将土壤动物纳入大规模评估和地图绘制研究中,但大多数全球尺度的地图主要揭示了与生物群系分布相关的差异。为了实现土壤生物多样性保护,需要制定相关政策和相关立法。然而,目前仍缺乏这些政策和法规。然而,欧洲最近取得了一些进展,例如《土壤监测与韧性指令》,该指令强调了为政策制定者提供全面的土壤生物多样性数据和地图的必要性,并引入了土壤区和土壤单元的概念。这些地图对于研究和制定基于证据的环境和农业政策决策至关重要。需要地图和易于使用的数据表示,以将土壤生物多样性从理论概念转化为环境和农业政策的实际内容。地图可以支持决策者制定以保护土壤生物多样性为重点的政策和战略,同时确保土地资源的可持续利用。

近年来,一些地图已经绘制了土壤生物多样性相关的信息,包括某些物种在全球或欧洲范围内的分布情况,显示了通过整合不同来源的实证数据来创建大规模地图的可行性。地方行动需要高空间分辨率的地图,覆盖多个分类群。然而,发布这些地图并随着新数据的出现进行更新仍然是一个挑战。过去几年,一些土壤研究和监测项目产生了包含土壤生物多样性信息的国家或欧洲级数据集。然而,这些数据集在空间覆盖上存在显著差异,不同国家和地区之间在分类群的代表性上也存在差异。

这些年来,收集和整理土壤动物数据的工作已经取得了相当大的进展,但这些数据现在需要转化为全面的信息,以供政策制定者使用,这意味着需要进行地图绘制。对全面生物多样性评估的需求在过去十年中已被强调。然而,这一努力受到各种限制,例如从不同来源收集数据只有在有足够的元数据(如坐标和采样年份)时才有可能。此外,土壤生物多样性估计的准确性高度依赖于采样努力,这存在低估生物多样性的显著风险。同时,采样方法的不同,使得数据的同质化成为一个挑战,不同方法在分类学鉴定上也可能导致不同的结果。本研究建立在欧盟COST行动Edaphobase的基础上,以收集和整合土壤动物的相关数据,并存储在公共数据库中,同时进一步制作了欧洲土壤动物图集。我们通过检索不同的开放数据来探索土壤动物的模式和多样性,并主要依赖于Edaphobase数据查询门户,聚焦于三种主要分类群:跳虫、蚯蚓和千足虫。这些分类群在Edaphobase门户中最为常见,以确保数据量足够且空间覆盖良好。我们使用地图绘制技术来预测土壤生物多样性和指出土壤动物知识的空白。本研究主要关注三个目标:1)从现有数据库中构建一致的数据集并指出数据空白;2)构建预测模型并分析环境变量的作用;3)绘制欧洲土壤动物多样性分布的初步地图并讨论预测与现有文献的相关性。我们假设通过整合不同来源的数据并为各种土壤动物群落绘制生物多样性地图,虽然会遇到困难,但这是可行的,并且能够揭示我们在欧洲土壤动物多样性分布方面的优势和不足。据我们所知,我们的研究提供了首次涵盖多个分类群的欧洲范围内的评估,使用统一的建模框架。通过在不同分类群之间应用共享的模型参数,我们确保了方法的统一性,并能够直接比较环境驱动因素的响应。

本研究的范围包括44个欧洲国家,涵盖欧盟成员国以及冰岛、土耳其、格鲁吉亚、阿塞拜疆、亚美尼亚和俄罗斯西部地区。这一广泛区域具有从北极到地中海的各种气候条件。地形方面,该区域包括阿尔卑斯山、比利牛斯山和喀尔巴阡山脉等山脉,以及从大西洋沿岸延伸到东部山脉的大片平原。植被方面,该区域的植被类型显著不同,包括苔原、冷针叶林(泰加林)、温带混交林、温带落叶林和地中海灌木丛等五个主要生物群系。该区域的生物气候分层由Metzger等人(2005)完成,产生了84个层次,分布在欧洲的13个环境区域。

为了允许在不同地点之间的比较,我们使用了稀有化物种丰富度,该方法通过考虑采样努力的差异来标准化丰富度估计。由于较大的样本更容易捕捉到更多的物种,我们排除了那些个体数不足的样本,因为它们对采样努力的敏感性较高,容易反映采样不足而不是实际的群落组成。这一阈值是通过统计评估基于样本中个体数分布的直方图定义的。直方图显示了一个右偏分布,其中许多样本包含非常少的个体,这会降低稀有化物种多样性的估计的稳健性,因此需要移除这些样本。

这种排除可能导致某些高生物多样性地点的遗漏,尤其是那些虽然个体数较少但可能包含多种物种的地点。然而,我们的热图显示,个体数较少的样本通常具有较低的丰富度,而随着个体数的增加,丰富度分布变得更加均匀。此外,我们还测试了不同最小样本数的阈值(5、10和15个个体),并产生了预测地图以比较结果。这些比较显示,我们的结果对阈值的选择具有鲁棒性,而排除个体数少于10个的样本是为了确保我们的分析基于足够的个体数。同时,将低计数样本连接起来的模型会增加模型的不确定性,而不会为欧洲尺度的生物多样性地图提供额外的信息,也不会影响在这一尺度上识别生物多样性热点。因此,排除极端采样不足的地点对于确保我们稀有化过程的可靠性以及避免生物多样性模式的扭曲至关重要。

为了进一步扩展我们的数据集,我们纳入了Edaphobase门户中未包含的文献数据。我们使用了全球生物多样性信息设施(GBIF)的数据,以及Marcel Bouché的蚯蚓数据集,还结合了Potapov等人(2023)和Phillips等人(2019)的研究数据。每个数据集都经过了相同的预处理步骤。特定的过滤器被应用以去除机会性记录(例如,GBIF中仅关注一个物种观察的数据)。对于Bouché的数据集,我们仅使用那些与当前描述的土地利用类型相对应的记录,以确保时间上的栖息地一致性。

为了保持对土壤动物的明确关注,我们排除了通过非特定土壤采样方法收集的数据,例如植被击打或树冠扫除。我们还通过使用GBIF物种查找工具对分类学层级进行了统一,仅保留物种层级或属层级的数据。最后,我们通过比较所有数据来源的地理坐标和采样参考,去除了重复的记录。我们的数据集基于物种出现情况,这意味着我们仅考虑每个样本中物种的存在,而不考虑非采样区域中物种的缺失。整个清理过程导致了大量数据的移除,因为存在缺失或不一致的数据,使得数据集的初始规模显著减少。

我们计算了三种社区指标:稀有化物种丰富度、香农多样性指数和物种密度(即每平方米的个体数)。这些指标提供了对群落结构的互补见解,捕捉了多样性和丰富度的不同方面。稀有化物种丰富度通过标准化采样规模来衡量生物多样性,而香农指数则通过物种的相对丰富度来量化多样性,结合了丰富度和丰富度在不同物种之间的分布。物种密度则提供了对群落大小的估计,该指标要么直接从数据集中获得,要么基于采样面积或采样设备规格进行计算。我们的分析集中在α多样性上,所有描述指标都是在样本层面计算的,而不是在站点层面。由于站点可能包含多个在时间或空间上不同的样本,将每个样本独立处理可以捕捉到站点内部的变异,而不平均本地的波动。

我们收集了一组空间上全面的环境协变量,这些协变量已知会影响土壤动物群落的结构和空间分布。这组协变量包括21个气候、地形、土壤、植被和土地利用变量。例如,气候数据来自WorldClim,包括年均降水量、年均气温、气温季节性、气温年变化范围、降水季节性、最干燥季度的降水和干旱指数。地形特征包括海拔和坡度。土壤理化性质来自SoilGrids,包括水的pH值、质地、土壤有机碳浓度、容重等。植被指数包括增强植被指数(EVI)和归一化植被指数(NDVI),净生态系统生产力(NEP)以及土地覆盖和人口密度作为人类压力的指标。

为了使这些协变量具有相同的分辨率,我们使用了terra包中的project函数,将它们标准化为250米×250米的共同网格分辨率,采用双线性插值进行重采样。最后,这些协变量被投影到欧洲兰伯特方位等积投影(LAEA,EPSG:3035)坐标系统中。

在本研究中,我们采用了一种数字土壤测绘(DSM)方法,将土壤动物的丰富度和多样性测量值与环境协变量相关联,使用量化回归森林(QRF)方法。QRF是一种集成学习算法,其基础与随机森林相同。它通过袋外误差(即bagging)来聚合决策树。与标准的随机森林不同,QRF估计响应变量的整个条件分布,保留每个叶节点中的所有响应值,从而推导出条件分位数,实现预测区间估计。QRF有三个用户定义的参数:ntree定义了树的数量,Mtry对应于在树的分裂过程中随机选择的协变量数量,min.node.size是树停止分裂的最小叶节点大小。我们进行了网格搜索,以确定最佳的树的数量、Mtry参数和最小节点大小。我们调查了50到1000棵树的值,每次增加50;Mtry的值在5到50之间,每次增加5;最小节点大小在1到10之间,每次增加1。

QRF模型的构建分为四个步骤:1)模型拟合,使用匹配的环境协变量值对土壤动物的测量值进行校准;2)模型验证,使用空间加权交叉验证策略评估预测质量;3)预测,使用最终模型对研究区域进行预测;4)不确定性评估和适用性评估,使用90%预测区间和适用性区域(AOA)来量化预测不确定性。更多关于这些步骤的信息将在下一节中提供。

为了评估模型预测的质量,我们使用了10折交叉验证方法,将数据集分为10个子集。模型在9个子集上进行训练,并在剩下的子集上进行预测。这样可以确保每个子集都被用于测试一次。空间投影显示站点具有中度聚集性。为了避免由于误差的空间相关性导致的过度乐观的模型准确度评估,我们采用了de Bruin等人(2022)推荐的交叉验证策略,用于具有中度到强空间聚集性的数据集。这种方法通过协变量的分布来考虑空间密度,将交叉验证得到的残差(即测量值与预测值的差)赋予不同的权重。这确保了在计算验证统计时,采样密集区域的权重较低。权重来源于核密度估计的采样强度的倒数。我们使用这种方法计算了两个统计量:均方根误差(RMSE),衡量预测误差的平均大小,数值越小表示误差越小;模型效率系数(MEC),其最优值为1,但可能为负值。

在本研究中,我们发现不同的分类群和多样性指标在预测精度上存在差异。对于跳虫,稀有化物种丰富度和香农指数的预测精度较高,而丰富度的预测精度较低。对于蚯蚓,香农指数的预测精度最高,而丰富度和个体数的预测精度较低。对于千足虫,香农指数的预测精度较高,而丰富度的预测精度较低。这一差异可能与不同分类群的生态特征和数据的可得性有关。

我们的研究还表明,某些环境变量对土壤动物的丰富度和多样性具有显著影响。例如,跳虫的丰富度主要受到土壤性质,特别是土壤有机碳的影响,而蚯蚓的丰富度则主要受到土壤质地,尤其是沙含量的影响。千足虫的丰富度则主要受到植被相关变量,如NDVI和净生态系统生产力的影响。此外,土地覆盖作为人类压力的指标,也被证明是影响大多数分类群和指标的重要因素。

我们的研究结果也揭示了土壤动物生物多样性数据在欧洲地区存在显著的空间差距,特别是在南欧和东欧。这些差距导致模型的外推能力降低,并且在数据较少的地区,模型预测的可靠性受到影响。因此,需要通过系统性的实地调查和采样来填补这些地区的数据空白。此外,数据的同质化和共享对于提高模型预测的准确性以及支持土壤生物多样性监测和政策制定至关重要。

我们的研究还强调了数据同质化和共享的重要性。通过整合多个数据源,我们能够揭示土壤动物生物多样性的模式,但这一过程也面临挑战。数据的不一致性可能导致模型预测的偏差,因此需要对数据进行仔细的整理和校验。未来的研究需要更加注重数据的标准化和共享,以确保模型的可靠性。此外,还需要进一步研究土壤动物的生态特征,以便更好地理解其在不同环境条件下的分布和多样性模式。

总之,我们的研究为欧洲土壤动物生物多样性的地图绘制提供了重要的参考,同时也指出了当前研究中的局限性和挑战。通过整合多个数据源,我们能够揭示土壤动物的分布模式,但需要进一步的工作来提高数据的准确性和完整性。这些努力不仅有助于科学研究,还能为政策制定者提供可靠的数据支持,以制定有效的土壤保护和管理策略。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号