利用可解释的机器学习(Explainable ML)和图形用户界面(GUI)技术,模拟人工补给墙和截断墙在控制海水入侵方面的有效性
《CATENA》:Simulating the effectiveness of artificial recharge and cutoff walls for saltwater intrusion control with explainable ML and GUI deployment
【字体:
大
中
小
】
时间:2025年10月18日
来源:CATENA 5.7
编辑推荐:
咸水入侵楔形长度预测研究采用贝叶斯优化调参的梯度提升模型(SGB/HGB/XGB/LGB/CGB),通过五折交叉验证与SHAP可解释性分析,验证CGB模型最优(测试R2=0.856,RMSE=0.050),其人工回灌与截断墙协同作用效果显著,GUI工具提升应用便捷性。
盐水入侵(Saltwater Intrusion, SWI)是沿海地下水系统面临的一个严峻挑战,尤其是在人类活动加剧和气候变化影响日益明显的背景下。随着沿海地区人口密度的增加、基础设施的扩展以及生态系统的重要性提升,SWI对饮用水资源的威胁也愈发显著。然而,这些区域同时受到地下水过度开采、土地利用变化以及自然的海洋-地下水相互作用的影响,这些问题在人为气候变迁的推动下变得更加复杂。因此,海平面上升、降水模式的改变以及极端水文气象事件的增加,已经加速了沿海侵蚀、洪水的发生,并且对饮用水供应构成直接威胁的盐水入侵问题也愈发严重。这些风险在一些易受影响的低洼地区已经显现,例如尼罗河三角洲,该地区盐水侵入和地面沉降正在危及地下水资源。此外,除了缓慢的气候驱动因素,地震等突发的水动力负荷也可能显著加剧盐水入侵和区域盐碱化,为规划提供了新的挑战,必须明确考虑这一潜在的灾害路径。
盐水入侵不仅影响地下水的可用性,还同时威胁其质量。它会引发河流和泉眼系统的二次污染,改变同位素指纹,并对沿海生物群落造成干扰。从机制上看,潮汐波动可以在动态边界条件下部分抵消抽水引起的盐水入侵,而互补的地球化学和同位素示踪剂则有助于在复杂的地质环境中确定污染源和迁移路径,从火山岛到北非海岸均有应用。值得注意的是,盐水入侵不仅在海岸线附近横向扩展,还会在井下向上渗透;因此,有效的管理必须同时应对双向过程,并考虑表层特性对侵蚀、灌溉和排水的敏感性。为此,整合了物理模拟与现场观测的诊断框架变得尤为重要,这些框架能够区分驱动因素、量化不确定性并优先选择干预措施。
在此背景下,各种盐水入侵控制措施已经发展起来,从经典的综合方法到当代的系统性研究。在水力控制方面,措施包括减少地下水开采以帮助重新平衡地下水预算,通过井和扩散盆地增加补给,利用淡水注入或咸水/海水抽取创建正负水力屏障,以及优化空间和时间上的抽水模式,包括综合策略和土地恢复技术。此外,物理屏障如截断墙和地下坝可以减少截面流量并改变等势线,从而有效抵抗内陆盐水的推进。通过这些措施,可以实现对盐水入侵的有效控制。
同时,分析、实验室和数值研究也一致表明,更深、更靠近海岸线以及战略性位置的截断墙可以增强排斥作用并缩短楔形长度,混合屏障配置往往优于单一结构。基于SEAWAT的评估进一步证明了优化设计的成效,包括在非均质含水层中的多屏障系统和双墙设计。在此基础上,最近的研究探索了新的方法,如冷却辅助的淡水注入以增强正屏障,针对含水层分层设计的混合物理屏障,以及海岸线地下坝以应对海平面上升驱动的盐水入侵,同时提高近岸淡水储量。
近年来,机器学习(ML)和优化技术在补充传统物理建模方面变得不可或缺,特别是在快速预测、设计筛选和决策支持任务中。这些方法,尤其是结合可解释人工智能(XAI)时,提供了透明和可解释的途径,这对于利益相关方来说至关重要。已有研究展示了这些技术在不同应用中的有效性。例如,结合SHAP的混合随机森林(RF)模型可以实现对地下屏障配置的透明优先排序,而RF与元启发式优化相结合可以提高盐度预测的准确性。支持向量机(SVMs)与物联网和遥感技术结合,能够有效识别盐水入侵高风险区域。此外,回归和神经网络模型有助于从地下水化学成分推断盐度。
在这一领域,可解释的优化梯度提升模型已被证明能够准确估计倾斜沿海含水层中的盐水楔长度,支持屏障控制设计。替代模型或克里金模型有助于优化屏障位置,而优化的集成ML方法可以提高倾斜双截断墙的水力性能评估。基于过程的FEFLOW模拟可以量化淡水抽水的好处,而大规模的MODFLOW–SEAWAT情景模拟则展示了如何通过开采和人工补给策略影响盐水入侵范围。此外,由潮汐、降雨和地下水水平驱动的SVMs在预测淡水-盐水界面方面优于人工神经网络(ANNs)。对于注入-抽取井对的分析设计仍然在水力控制和基准测试中发挥着重要作用,随着技术的进步,这些设计正逐步整合到基于网络的决策支持工具中,以更好地应对沿海含水层的挑战。
尽管在SWI的分析、物理和数值建模方面取得了显著进展,但利用先进的机器学习技术来预测盐水入侵楔形长度比(L/L?)在人工补给和截断墙共同作用下的应用仍显不足,特别是在非承压的沿海含水层中。为了解决这一问题,本文提出了一种基于π项无量纲输入并经过严格验证的水文地质导向的机器学习框架。研究重点在于量化补给井(距离、位置等)和截断墙的联合效应,以及评估不同模型在预测L/L?时的表现。通过使用多种评估指标、残差误差曲线(REC)、预测-实际散点图、小提琴箱线图和基于SHAP的可解释性分析,结合五折交叉验证和排名分析,可以确保模型的稳健性和可靠性。
研究结果显示,所有模型在调参后都表现出显著提升,训练集的R2值均高于0.913。其中,CGB模型在准确性和泛化能力方面表现最佳,测试集的R2值达到0.856,测试集的RMSE为0.050,训练集的RMSE为0.032。在交叉验证中,CGB模型获得了最低的平均RMSE(约0.0417),并在两个折叠中分别达到0.0365和0.0336,同时在两个阶段均保持最陡峭的残差误差曲线。散点分析显示,预测值与实际值紧密聚集在1:1线上,且不确定性较低(训练集的U??约为0.089,测试集的U??约为0.139)。小提琴箱线图进一步验证了预测值与真实值在分布上的一致性,预测的测试集中位数(0.6243)与真实中位数(0.6237)非常接近。基于SHAP的可解释性分析指出,水力梯度、屏障深度和密度比是影响预测结果最重要的特征,这一发现与沿海含水层的水文机制一致。
此外,用户友好的图形用户界面(GUI)使得研究人员和从业者能够实时输入模型参数,进行L/L?的预测,从而显著提升实际应用的可行性。整体而言,CGB模型被证明是管理沿海含水层盐水入侵场景中最可靠和可解释的选择,它在准确性、稳健性和部署便捷性之间实现了良好的平衡。这一成果不仅有助于提升对盐水入侵问题的理解,还为制定有效的管理策略提供了坚实的技术支持。
为了确保模型的准确性和可靠性,本文采用了一套系统的方法论。首先,构建了一个包含340个数值生成场景的数据集,这些场景与非承压含水层的实际情况密切相关。随后,所有变量被转换为八个π项,即无量纲输入,以确保模型的学习过程不受尺度影响,并保持物理一致性。数据集的特征通过描述性统计和皮尔逊热图进行总结,以评估变量的多样性和相关性。接下来,使用五折交叉验证和排名分析对模型进行评估,确保其在不同数据子集上的表现具有代表性。此外,残差误差曲线(REC)和预测-实际散点图被用来分析模型的预测精度和误差分布,而小提琴箱线图则进一步验证了模型预测结果与真实数据在分布上的匹配程度。
模型的调参过程采用贝叶斯优化(Bayesian Optimization, BO)方法,通过搜索最优的超参数组合,提升模型的预测性能。贝叶斯优化作为一种高效的参数优化技术,能够在减少计算成本的同时,找到能够最小化预测误差的参数配置。在调参前,部分模型如HGB和LGB在训练集上表现出较高的RMSE,分别达到0.073,这表明这些模型在训练过程中存在较大的误差,而其他模型如SGB、XGB和CGB则在调参后表现出更好的性能。最终,CGB模型在所有评估指标中表现最佳,其测试集的RMSE仅为0.050,而训练集的RMSE为0.032,且在交叉验证中获得最低的平均RMSE(约0.0417)。这一结果表明,CGB模型不仅在训练阶段表现优异,而且在测试阶段也保持了良好的泛化能力。
在可解释性方面,SHAP(SHapley Additive exPlanations)方法被用来分析模型预测过程中各特征的重要性。SHAP提供了一种基于博弈论的解释框架,能够量化每个特征对模型输出的贡献程度。分析结果显示,水力梯度、屏障深度和密度比是影响盐水入侵楔形长度比(L/L?)预测结果的最关键因素。这一发现与沿海含水层的水文机制高度一致,即盐水入侵的强度主要取决于水力条件、屏障结构以及密度差异。因此,CGB模型不仅在预测能力上表现出色,还能够为决策者提供明确的解释,帮助他们理解哪些因素对盐水入侵的控制最为关键。
此外,为了提升模型的实际应用价值,本文开发了用户友好的桌面和网络版图形用户界面(GUI)。这些界面使得研究人员和从业者能够直观地输入模型参数,进行实时预测,并快速获得结果。这一设计不仅提高了模型的使用便捷性,还增强了其在实际场景中的适用性。例如,在沿海含水层管理中,决策者可以根据模型的预测结果,制定更加科学和有效的控制策略,如调整补给井的位置、优化截断墙的设计以及规划抽水方案。同时,这些界面还能够帮助用户更好地理解模型的输出,提高他们的决策信心。
本文的研究结果不仅揭示了不同模型在预测盐水入侵楔形长度比(L/L?)方面的性能差异,还为沿海含水层管理提供了新的技术手段。通过使用贝叶斯优化调参的梯度提升模型,研究人员能够在保持模型准确性的同时,提高其泛化能力,使其能够适应不同的环境条件和管理需求。此外,基于SHAP的可解释性分析使得模型的预测过程更加透明,有助于利益相关方更好地理解盐水入侵的驱动因素和控制措施。这一成果为未来的研究和实践提供了重要的参考,特别是在应对气候变化和人类活动对沿海含水层的双重压力方面。
在实际应用中,盐水入侵的控制措施需要综合考虑多种因素,包括水力条件、屏障结构、密度差异以及环境变化。因此,本文提出的模型不仅能够提供准确的预测结果,还能够帮助决策者制定更加科学和有效的管理策略。例如,在非承压含水层中,补给井和截断墙的联合效应可以通过模型进行量化,从而为设计优化提供依据。此外,模型还可以用于评估不同控制措施的有效性,如调整截断墙的位置、优化补给方案或改变抽水模式。通过这些分析,研究人员能够更好地理解盐水入侵的动态过程,并制定针对性的干预措施。
总之,本文的研究为沿海含水层盐水入侵的预测和控制提供了一种新的方法。通过使用贝叶斯优化调参的梯度提升模型,研究人员能够在保持模型准确性的同时,提高其泛化能力,使其能够适应不同的环境条件和管理需求。此外,基于SHAP的可解释性分析使得模型的预测过程更加透明,有助于利益相关方更好地理解盐水入侵的驱动因素和控制措施。这一成果不仅有助于提升对盐水入侵问题的理解,还为制定有效的管理策略提供了坚实的技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号