贝宁北部干旱预测与不确定性量化:基于卷积长短期记忆网络与保形预测的创新框架

《Environmental Data Science》:Prediction and uncertainty quantification of drought in North Benin

【字体: 时间:2025年11月25日 来源:Environmental Data Science 1.7

编辑推荐:

  本研究针对贝宁北部农业干旱预测中不确定性量化缺失的关键问题,通过整合六种机器学习模型和四种深度学习模型,创新性地应用集成批量预测区间(EnbPI)方法,成功实现了对标准化降水指数(SPI6)的高精度预测(R2最高达98.29%)与可靠的不确定性量化。研究首次在低收入国家验证了Conv1D-LSTM模型在平衡预测精度与不确定性覆盖方面的优越性,为决策者制定干旱适应性策略提供了科学依据。

  
在气候变化加剧的背景下,干旱已成为撒哈拉以南非洲地区最具破坏性的气候灾害之一。据统计,1900年至2013年间非洲共发生291次干旱事件,影响超过3.62亿人,造成84.7万人死亡,经济损失高达30亿美元。贝宁北部作为国家粮食安全的关键区域,贡献了全国36%的农业产出,但该地区特别容易受到气候变化的影响,预计到2025年干旱将使农业产量减少5-20%。然而,现有的干旱预测研究大多缺乏对预测不确定性的量化,这严重限制了机器学习模型在制定适应性政策中的实际应用价值。
为了解决这一关键问题,由Bernardin Marie Augustin Sèdjro Ligan领衔的研究团队在《Environmental Data Science》上发表了题为"Prediction and uncertainty quantification of drought in North Benin"的研究论文。该研究以贝宁阿利博里省的六个关键地区(巴尼科阿拉、戈古努、坎迪、卡里马马、马兰维尔和塞巴纳)为研究对象,旨在开发一个同时具备高预测精度和可靠不确定性量化的干旱预报框架。
研究人员采用了一套系统的技术方法体系:首先基于NASA POWER数据集获取1981-2021年的多变量气象数据,通过皮尔逊相关性分析和滞后变量生成进行特征工程;然后对比了六种机器学习模型(线性回归、岭回归、随机森林、XGBoost、LightGBM和SVR)和四种深度学习模型(Conv1D、LSTM、GRU和Conv1D-LSTM)的预测性能;创新性地采用专为时间序列数据设计的集成批量预测区间(EnbPI)方法进行不确定性量化;最后通过Borda计数法和泰勒图等多维度评估体系对模型性能进行综合排名。
2.2.1 标准化降水指数
研究使用SPI6(6个月时间尺度的标准化降水指数)作为干旱评估指标,其计算公式为SPIi = (Pi - P?)/σ,其中Pi为第i个月的降雨量,P?和σ分别为考虑时间尺度上的年平均降雨量和标准差。根据Lloyd-Hughes和Saunders(2002)的分类标准,SPI值小于-2表示极度干旱,-1.5至-1.99为严重干旱,-1至-1.49为中度干旱。
2.4.2 集成批量预测区间
针对时间序列数据的非交换性特点,研究采用EnbPI方法,通过自助采样和集成建模构建预测区间。该方法通过30个自助样本训练多个模型,利用历史残差构建经验分位数,生成适应性的预测区间,显著提升了在时间序列数据上的不确定性量化可靠性。
3. 结果与讨论
研究结果显示,深度学习模型在大多数地区表现出色。在马兰维尔,Conv1D模型以97.76%的R2和92.8%的覆盖率位居榜首;在卡里马马,Conv1D和Conv1D-LSTM模型并列第一,R2分别为97.072%和96.917%;在巴尼科阿拉,Conv1D-LSTM模型表现最为突出,取得了98.285%的R2和93.8%的覆盖率。
然而,研究也发现了一些有趣的区域性差异。在坎迪地区,虽然Conv1D-LSTM模型在预测精度上排名第一(R2=97.417%),但其覆盖率仅为77.3%,远低于90%的目标值,表明模型可能存在过度自信的问题。相比之下,传统的线性回归和岭回归模型在该地区表现出更可靠的覆盖率(约89.6%),尽管它们的预测精度稍低。这一发现强调了在不同地区需要根据具体需求权衡预测精度和不确定性可靠性。
从计算可持续性角度分析,传统机器学习模型展现出明显优势。例如,在坎迪地区,Conv1D-LSTM模型仅比XGBoost模型的R2高出0.7%,但二氧化碳排放量却是后者的126倍。这一发现引发了关于边际精度提升是否值得显著更高环境成本的思考,特别是在气候变化减缓的背景下。
4. 讨论与局限性
本研究在SPI6预测方面取得了显著成果,各地区的R2值在96.61%至98.29%之间,明显优于Vodounon等人(2022)在同一地区报告中80.17%的R2值。这种性能提升可能源于研究更好地考虑了数据的时空特征,而Conv1D-LSTM模型在整合卷积层和循环网络方面的优势使其能够同时捕捉局部模式和时间依赖性,这对涉及复杂动态的天气预报至关重要。
研究的实际意义在于强调了预测不确定性量化在农业应用中的重要性。高精度并不等同于高确定性,决策者需要了解模型的不确定性,才能充分理解使用预测结果的含义。特别是在干旱预警系统中,低估不确定性可能导致基于错误信心的决策,而高估不确定性则可能使有用的预测信息被忽视。
然而,研究也存在一些局限性。首先,分析未覆盖该国的所有农业区域,一些地区仍然缺乏相关信息;其次,研究侧重于回顾性预测,而利益相关者需要前瞻性的干旱预测以采取主动措施;第三,分析仅限于使用6个月SPI的短期干旱评估,未涉及长期干旱状况;最后,网格化数据集的使用引入了固有的不确定性,可能会增加预测模型的整体误差。
5. 结论
本研究成功开发了一个集成了机器学习和深度学习技术的干旱预测框架,并在贝宁阿利博里省的六个地区进行了验证。通过采用EnbPI方法进行不确定性量化,研究不仅提供了高精度的SPI6预测,还生成了可靠的预测区间,使决策者能够评估预测置信度并预测可能的变化。Conv1D-LSTM模型在多个地区表现出色,证明了其在时空干旱预测中的强大适用性。
这项研究的意义在于为资源有限地区提供了实用的干旱管理工具,特别是在像贝宁这样的低收入国家。通过平衡预测精度和不确定性可靠性,该框架支持更明智的决策制定,有助于提高农业社区对气候变化的适应能力。未来研究可以考虑使用更高分辨率的数据集,以更好地捕捉每个地区内的空间变异性,从而进一步提高模型性能和可靠性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号