基于点样本驱动的去偏差和标签噪声学习的大规模潮汐湿地测绘:以亚洲为例的案例研究

《International Journal of Applied Earth Observation and Geoinformation》:Large-scale tidal wetland mapping based on point-sample-driven debiased and label noise learning: A case study in Asia

【字体: 时间:2025年10月19日 来源:International Journal of Applied Earth Observation and Geoinformation 8.6

编辑推荐:

  潮汐湿地分类存在样本稀缺和标注噪声问题,本文提出基于去偏抽样与噪声鲁棒学习的映射框架。通过历史点样本生成像素级伪标签,利用地理协变量建模纠正抽样偏差,结合类别条件噪声校正和均值教师训练提升模型鲁棒性。在亚洲沿海2022年Sentinel-2影像验证中,总体分类精度达85.32%,优于GWL_FCS30D等现有产品,有效支持了区域生态监测与可持续发展规划。

  ### 潮汐湿地遥感制图的挑战与创新方法

潮汐湿地是地球生态系统中极具生产力的区域,包括红树林、潮汐沼泽和潮汐滩涂等,这些区域位于陆地与海洋的交界地带,对于维持生态平衡、提供生态服务以及应对气候变化具有重要作用。然而,传统遥感分类方法在处理潮汐湿地这类复杂、动态变化的生态系统时面临诸多挑战。首先,潮汐湿地具有显著的时空异质性,其淹没模式随时间不断变化,使得样本数据难以全面覆盖其真实分布情况。其次,由于样本数量有限,特别是在大规模区域内的标注样本稀缺,限制了深度学习模型在潮汐湿地制图中的应用。此外,即使在生成伪标签的过程中,也存在一定的语义错误,例如类别间的混淆,这会进一步影响模型的分类精度。

为了克服上述问题,本研究提出了一种基于去偏采样和抗噪学习的点样本驱动的潮汐湿地制图方法。该方法首先将历史点样本转换为像素级别的伪标签,用于训练深度学习分类器。通过引入基于协变量一致性的去偏采样策略,可以有效缓解样本选择偏差问题,确保生成的伪标签更好地反映潮汐湿地的真实空间分布。同时,结合类别条件下的抗噪学习方法,利用类别间的混淆概率作为先验知识,有助于识别和抑制伪标签中的噪声,从而提高分类的准确性。该方法在亚洲沿海地区进行了测试,覆盖了约380万平方公里的海岸线,最终实现了85%的提取准确率。

### 研究区域与数据来源

亚洲作为世界上最大的大陆,拥有全球范围内最为丰富的潮汐湿地生态系统,这些系统涵盖了从北极到热带的多种生态环境。潮汐湿地不仅在维持水文循环、缓冲风暴潮、固碳和提供栖息地方面发挥重要作用,还在支持沿海地区的可持续发展方面具有重要意义。随着全球气候变化和人类活动的加剧,这些湿地正经历着显著的变化,包括面积减少和生态功能退化。

为了减少高纬度地区与潮汐湿地之间可能存在的复杂交互影响,本研究将研究区域限定在北纬60度以南的区域。研究区域被划分为六个子区域,包括潮汐湿地类型(潮汐滩涂、盐沼和红树林)以及非湿地类型(水体、陆地和水产养殖池)。通过结合地理特征和国家分布特性,确保研究区域划分具有空间连续性和生态类型区分度。此外,研究还考虑了跨境管理单位的兼容性,以提高数据在不同区域间的可比性。

研究过程中使用了多种卫星数据,其中Sentinel-2卫星影像因其高空间分辨率和短重访周期,成为潮汐湿地分类的重要数据来源。Sentinel-2卫星提供了10个波段的数据,包括可见光波段(B2、B3、B4)、近红外波段(B8)和红边波段(B5、B6、B7),以及窄近红外波段(B8A)和短波红外波段(B11、B12)。这些波段能够提供丰富的光谱信息,有助于识别潮汐湿地的特征。此外,为了弥补2022年数据缺失的情况,研究还引入了2021年的影像数据,以确保时间序列的完整性。

### 伪标签生成与样本去偏

在潮汐湿地分类任务中,样本选择偏差是影响模型性能的关键因素之一。样本选择偏差指的是在样本收集过程中缺乏随机性,导致样本无法全面反映整体分布情况,从而影响模型的泛化能力。为了应对这一问题,本研究提出了一种基于协变量信息的样本去偏方法。通过分析历史点样本与随机样本之间的协变量分布,可以识别出导致样本偏差的关键变量,并据此调整样本权重,使得生成的样本更接近真实分布。

具体来说,研究团队首先从历史点样本中排除了空间上相邻的样本(距离小于500米),并进行合并处理,最终筛选出13,868个有效数据点。这些数据点被用于生成像素级别的伪标签,从而驱动深度学习模型的训练。通过使用多种分类模型(如随机森林、XGBoost、LightGBM和支持向量机)进行训练,并采用投票机制确定每个样本的类别,能够有效提高模型的鲁棒性。此外,为了进一步减少伪标签中的噪声,研究还引入了类别条件下的噪声学习模块,通过计算类别间的混淆概率,指导模型在训练过程中进行错误修正。

### 抗噪学习与模型优化

在伪标签生成过程中,不可避免地会出现一定的语义错误,即标签噪声。这些噪声主要来源于分类模型的预测偏差和潮汐湿地的动态变化。为了提高模型的分类性能,研究采用了一种基于均值教师模型的抗噪训练方法。均值教师模型是一种半监督学习方法,它通过同时训练学生模型和教师模型,利用教师模型对学生的预测结果进行平滑处理,从而减少噪声的影响。

在训练过程中,学生模型使用标注数据进行训练,而教师模型则基于学生模型的历史权重进行指数平滑,确保模型参数的稳定性。通过引入一致性损失,可以确保在输入数据为原始数据或扰动数据时,学生模型和教师模型的预测结果保持一致。这种方法不仅提高了模型的泛化能力,还增强了其对噪声的鲁棒性。此外,研究还采用了一种基于多模型融合的策略,通过结合多个模型的预测结果,进一步提高分类的准确性。

### 结果分析与性能评估

本研究生成的潮汐湿地地图覆盖了亚洲沿海地区的10米分辨率,总覆盖面积约为312,002.57平方公里。通过与现有潮汐湿地制图产品进行比较,如ESA_WorldCover v200、GWL_FCS30D和EA_Wetlands,研究发现所提出的方法在分类精度方面具有明显优势。在低纬度的缅甸若开邦、中纬度的中国黄河三角洲和高纬度的韩国仁川等典型区域,所生成的地图与现有产品相比,不仅具有更高的空间分辨率,还能更准确地区分永久水体与水产养殖池,从而为水文分析和水产养殖监测提供更可靠的数据基础。

在精度评估方面,研究团队建立了一个独立的测试集,其中包括随机采样和人工验证的样本。测试结果显示,所提出方法的总体分类准确率为85.32%,其中水体的用户准确率(UA)为90.17%,生产者准确率(PA)为86.32%,而红树林的用户准确率为90.74%,生产者准确率为84.78%。盐沼和潮汐滩涂的分类精度相对较低,分别为83.34%和84.75%。这些结果表明,尽管在某些类别上仍存在一定的挑战,但所提出的方法在整体上表现优异。

### 分类模块的消融实验

为了进一步验证各模块对模型性能的影响,研究团队进行了消融实验。实验结果表明,样本选择去偏模块(SSDS)在减少样本分布不一致带来的误差方面发挥了关键作用,显著提高了模型的分类性能。像素级标签生成模块(PLG)通过生成伪标签,使模型能够进行更细致的像素级分类,从而提升空间分辨率和分类精度。类别条件下的标签噪声检测模块(LND)在识别和纠正类别相关的标签噪声方面表现出色,有助于减少标签错误对模型的负面影响。而基于均值教师模型的抗噪训练模块(MTT)则进一步提高了模型的泛化能力和预测精度。

通过结合所有模块,所提出的方法在多个评估指标上均优于其他方法。例如,在用户准确率(UA)和生产者准确率(PA)方面,所提出方法分别达到了84.88%和81.35%,而在总体准确率(OA)方面也达到了85.32%。这些结果表明,该方法在处理大规模、高分辨率潮汐湿地制图任务时具有显著的优势。

### 与其他方法的比较

本研究还与其他现有的标签噪声学习和分类方法进行了比较。例如,与SegFormer、Label smoothing、Mean teacher、Pi-model等模型相比,所提出的方法在多个指标上表现更优。具体而言,在用户准确率(UA)和生产者准确率(PA)方面,所提出方法分别达到了86.84%和81.35%,而在总体准确率(OA)方面达到了85.32%。这些结果表明,该方法不仅能够有效减少标签噪声的影响,还能在大规模数据集上保持较高的分类精度。

此外,研究还测试了多种基于全卷积网络(FCN)架构的语义分割方法,包括U-Net、DeepLabv3+、HRNet、PSPNet、SEM-FPN、UperNet-Swin和SegFormer。其中,基于Transformer架构的SegFormer在总体准确率(OA)方面表现最佳,达到了85.32%。这一结果表明,结合全球上下文聚合和长距离依赖建模的深度学习模型在潮汐湿地制图任务中具有重要价值。同时,研究还指出,所提出的方法是架构无关的,能够兼容主流的分类模型,从而提高了其适用性和灵活性。

### 大规模深度学习在潮汐湿地制图中的应用

本研究生成的10米分辨率潮汐湿地地图不仅提供了详细的地理信息,还揭示了亚洲沿海地区潮汐湿地的分布特征。例如,红树林主要分布在南亚和东南亚的低纬度区域,而盐沼则多见于中高纬度地区。潮汐滩涂广泛分布于沿海地带,尤其是在中国东南沿海。水产养殖池则在中低纬度的河流三角洲地区较为集中。这些结果与潮汐湿地的形成机制和植被的季节性变化相吻合。

然而,当前研究仍面临一些局限性。例如,多源协变量数据的分辨率较低,可能影响生态过渡带的界定。此外,历史样本可能无法充分反映快速变化的区域,从而限制了模型的泛化能力。因此,未来的研究可以考虑引入多时相、多源数据,并开发能够跨不同环境适应的深度学习模型,以进一步提高分类的深度和可扩展性。

### 结论

本研究提出了一种基于历史点样本的点样本驱动潮汐湿地制图方法,结合了去偏采样和抗噪学习技术,成功生成了亚洲沿海地区的10米分辨率潮汐湿地地图。该方法不仅能够有效解决样本稀缺和分布偏差的问题,还能提高分类精度和模型的鲁棒性。研究结果表明,所提出的方法在多个评估指标上均优于现有方法,为全球潮汐湿地分布评估和可持续发展提供了重要的数据支持。此外,该方法的架构无关性使其能够兼容主流的分类模型,具有较高的应用价值。未来的研究可以进一步探索多源数据融合和模型迁移能力,以提高潮汐湿地制图的精度和适用性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号