基于堆叠机器学习技术的河流水质指数(WQI)预测精度提升研究——以南布格河为例

《Science of The Total Environment》:Enhancing estimation of water quality index using stacking machine learning techniques: The case of Southern Bug River

【字体: 时间:2025年10月26日 来源:Science of The Total Environment 8

编辑推荐:

  本文系统评估了11种堆叠机器学习(ML)技术在水质指数(WQI)预测中的应用。研究发现,虽然堆叠模型整体优于单一模型,但高斯过程回归(GPR)作为独立模型表现最佳(总排名指数为1)。研究强调了元学习器选择对性能的关键影响,并分析了计算成本与分类可靠性,为复杂环境数据的高精度预测提供了重要参考。

  
研究区域亮点
南布格河全长792公里,流域面积达63,700平方公里,是乌克兰第二长河(图1)。这条河流发源于斯摩棱斯克州埃尔尼亚附近的沼泽地带,最终汇入第聂伯河。其年均径流量为2.9立方公里,森林草原区贡献了56%的径流,而草原区仅贡献17.5%。研究中重点关注的中下游流域正面临着...
模型性能结果
本研究所有机器学习模型均采用表3优化的超参数进行训练,并从RMSE(均方根误差)、MAE(平均绝对误差)、R2(决定系数)、NSE(纳什效率系数)、MXARE(最大绝对相对误差)和MARE(平均绝对相对误差)六项指标进行评估。训练集的RMSE值范围在0到12.34之间,而测试集范围则为0.02到9.49。MAE值在训练集中介于0到7.41,测试集中为0到7.43。此外,训练数据的NSE和R2值均表现出色,分别在0.76到1之间波动,展现出模型强大的拟合能力。
结论
本研究通过11种堆叠机器学习技术对南布格河的水质指数(WQI)进行精准预测探索。这种堆叠方法通过元模型整合多个基学习器,巧妙融合了单一机器学习模型的优势,显著提升了复杂非线性环境数据的预测性能。结果表明,在面对多维环境参数时,堆叠方法在多数情况下能够超越独立模型的表现。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号