一种基于半监督学习的框架,用于量化河流系统中的 litter(枯枝落叶等有机物质)通量
《Water Research》:A semi-supervised learning-based framework for quantifying litter fluxes in river systems
【字体:
大
中
小
】
时间:2025年10月28日
来源:Water Research 12.4
编辑推荐:
本研究提出一种结合半监督学习(SSL)和切片增强超推断(SAHI)的框架,用于量化河流中漂浮垃圾的横截面流量。通过预训练ResNet50提取通用特征,再以少量标注数据微调,有效解决了传统监督学习依赖大量标注数据的问题。SAHI通过切片和放大图像提升对小垃圾的检测能力,实验表明其F1分数提升19%。尽管模型低估了流量(因子3-4),但相比基线监督学习框架,流量估算接近人工计数结果,Pearson相关系数达0.99。该框架在荷兰、印尼和越南的河流中验证,适用于宽截面河流污染监测。
塑料污染在水体中是一个全球性问题,它不仅对水生生物构成威胁,还可能影响人类健康。河流作为陆源性塑料垃圾进入海洋的主要通道,其污染情况对于评估整个流域的污染水平至关重要。然而,现有的研究在利用深度学习方法对河流中的漂浮垃圾进行量化评估方面仍存在不足。一方面,大多数研究集中于检测漂浮垃圾,但缺乏对宽河段中垃圾流量的准确量化。另一方面,传统的监督学习(SL)模型依赖大量的标注数据,而这些数据获取成本高且耗时。此外,现有的深度学习模型在识别小型垃圾时往往表现不佳。为了解决这些问题,本文提出了一种基于半监督学习(SSL)的方法,并结合Slicing Aided Hyper Inference(SAHI)技术,用于量化河流中的横截面漂浮垃圾流量。
本文提出的框架包含四个步骤:首先,使用数字相机在河流的不同采样点采集图像;其次,利用SSL方法开发一个强大的垃圾检测模型;然后,应用该模型与SAHI技术对图像中的垃圾进行识别和计数;最后,对检测结果进行后处理以量化垃圾流量。在SSL方法中,首先通过自监督学习对ResNet50模型进行预训练,使用大量未标注数据,随后在有限的标注数据上进行监督微调。研究中使用了来自荷兰、印尼和越南的水道图像进行模型预训练和微调,并在越南案例研究中评估了模型的零样本跨域检测性能和垃圾流量量化能力。
实验结果表明,SSL模型在使用更多预训练时间和更大数据集时,检测性能得到显著提升。在域内检测任务中,F1分数增加了0.2,而在零样本跨域检测任务中,F1分数的提升可达0.14。此外,SAHI方法能够识别出45个额外的小型垃圾(面积小于1000 cm2),使得F1分数提升高达0.19。这些结果表明,SSL结合SAHI的方法在提升垃圾检测性能方面具有巨大潜力。
尽管SSL框架在垃圾检测方面表现出色,但其在量化垃圾流量时仍存在一定的局限性。具体而言,SSL框架在越南案例研究中低估了垃圾流量,比人工测量低3到4倍,主要原因是透明垃圾和被水葫芦遮挡的垃圾未能被正确识别。相比之下,SSL框架的垃圾流量估计值比传统SL框架高近两倍,更接近人工测量值。这些发现强调了SSL框架在提升垃圾流量测量方面的潜力,并指出扩大数据集和优化模型结构可以显著提升其性能。
研究还指出,目前的垃圾流量测量方法存在诸多挑战。传统的人工观测虽然准确,但难以在高流量的河流中持续进行,且在极端天气条件下可能存在安全隐患。而现有的监督学习模型由于依赖大量标注数据,难以在不同地理区域和环境条件下推广使用。因此,开发一种能够有效识别小型垃圾和跨域检测的模型对于建立全面的垃圾监测系统至关重要。
为了提高模型的检测性能,本文建议采取多种措施。首先,增加未标注数据的规模并延长训练时间,可以提升模型的泛化能力。其次,收集少量的标注图像用于微调,有助于解决数据不平衡问题,特别是在处理特定类型的垃圾(如透明垃圾和被水葫芦遮挡的垃圾)时效果显著。此外,应用数据增强技术可以增加特定垃圾类型的标注实例数量,从而提升模型的鲁棒性。最后,可以考虑将ResNet50骨干网络替换为更先进的架构,如Transformer,这些模型在基础模型(如GPT、DINOv2和Prithvi)中展现出强大的性能。
研究还指出,当前开发的模型在识别连续图像中出现的同一垃圾时,未能自动将其识别为单一实例,导致垃圾流量的高估。虽然可以通过手动校正来解决这一问题,但更自动化的跟踪方法(如DeepSORT)可以进一步提高模型的准确性。
总体而言,本文提出的SSL框架结合SAHI方法为量化河流中的漂浮垃圾流量提供了一种新的思路。该框架在减少对标注数据的依赖的同时,显著提升了检测性能,尤其是在识别小型垃圾和跨域检测方面。然而,为了实现全球范围内的垃圾监测,仍需进一步扩大数据集的规模,并优化模型结构。未来的研究可以探索如何将这些方法扩展到更广泛的地理区域和环境条件,以支持更全面的垃圾监测系统。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号