基于可变形卷积与多模块优化的YOLOv8s水下目标检测框架研究

《Scientific Reports》:Optimized YOLOv8s framework with deformable convolution for underwater object detection

【字体: 时间:2025年11月28日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对水下目标检测中因图像质量低、目标形态多变、尺寸小及遮挡严重导致的识别精度低等问题,提出了一种优化的YOLOv8s框架(O-YOLOv8s-DC)。通过引入可变形卷积模块(C2f_DC)、深度加权双向特征金字塔(DeepBiFPN)、内容感知特征重组(CARAFE)和高效多尺度注意力(EMA)四项核心改进,显著提升了模型在复杂水下环境中的检测性能。实验结果表明,该模型在LFIW和OI数据集上的AP@0.5和AP@[.50:.05:.95]均优于主流检测器,尤其在小型目标和遮挡目标检测方面表现突出,为水下生态保护和作业提供了可靠技术支撑。

  
在蔚蓝的深海世界,隐藏着无数亟待探索的奥秘。随着水产经济的蓬勃发展,水下目标检测技术成为深海矿产勘探、水下文化遗产测绘以及自主水下航行器(AUV)协同作业的关键支撑。然而,与陆地环境相比,水下目标检测面临着独特挑战:光线衰减、水体浑浊导致图像质量严重下降;水下生物和人工结构形态各异、尺寸差距悬殊;成群游动的鱼群容易相互遮挡;更棘手的是,小型目标在低对比度背景下难以捕捉。传统依赖人工判读或声纳配合经典算法的方法效率低下、适应性差,而现有深度学习模型(如YOLO系列、DETR等)多针对陆地场景设计,缺乏对水下特殊问题的针对性优化,导致在实际应用中仍存在精度不足、误检漏检率高的问题。
为了突破这一技术瓶颈,河海大学与南昌工程学院的联合研究团队在《Scientific Reports》上发表了题为“Optimized YOLOv8s framework with deformable convolution for underwater object detection”的研究论文。该研究提出了一种名为O-YOLOv8s-DC的创新框架,通过四项核心模块的协同优化,显著提升了水下目标检测的鲁棒性和准确性。
研究团队采用以CNN为核心的混合架构,基于以下考量:首先,卷积神经网络(CNN)擅长捕捉局部空间细节,能有效应对水下目标边缘模糊问题;其次,CNN模型推理效率高,更适合部署在资源受限的水下设备(如AUV)上;此外,核心优化模块(如C2f_DC、DeepBiFPN)与CNN架构天然兼容。在数据预处理阶段,针对水下图像特点,采用暗通道先验算法去除水雾、伽马校正增强局部对比度、高斯滤波抑制颗粒噪声,确保模型输入质量。
关键技术方法包括:
  1. 1.
    可变形卷积特征模块(C2f_DC):通过可变形卷积层动态调整卷积范围,增强对不规则形态目标的特征提取能力;
  2. 2.
    深度加权双向特征金字塔(DeepBiFPN):增加极小目标检测层,引入双向跨尺度连接和快速归一化融合机制,提升小目标检测精度;
  3. 3.
    内容感知特征重组(CARAFE):通过内核预测和内容感知重组模块优化上采样过程,减少遮挡导致的误检;
  4. 4.
    高效多尺度注意力(EMA):结合坐标注意力和空间注意力,强化关键特征表征,抑制冗余背景干扰。
    实验采用LFIW(Labeled Fish In The Wild)和OI(Open Image)两个公开数据集,使用精确度(P)、召回率(R)、F1分数、平均精度(AP)等指标进行评估。
模块有效性验证
通过设计六种变体网络(Net1-Net6)的消融实验证实了各模块的贡献。Net6(集成全部四个模块)在LFIW数据集上AP@0.5达到87.3%,较基线YOLOv8s提升1.8%;AP@[.50:.05:.95]达到53.0%,提升1.4%。可变形卷积(C2f_DC)专注于不规则局部特征提取,DeepBiFPN通过浅层特征强化提升小目标识别,CARAFE通过边缘重组降低遮挡误差,EMA则通过注意力权重抑制背景干扰。
对比实验分析
与Faster R-CNN、SSD、YOLOv5s-YOLOv8s、DETR等主流模型的对比显示,O-YOLOv8s-DC在复杂水下场景中全面领先。在LFIW数据集上,其AP@0.5(87.3%)显著高于DETR(81.8%)和YOLOv6s(84.8%);在OI数据集上,AP@0.5达到83.4%,较YOLOv8s提升1.5%。视觉对比结果进一步验证了该模型在特征缺失(如部分遮挡目标)、弱特征(低对比度目标)和相似干扰场景下的优越性。
尺寸敏感性分析
小目标检测(APs)指标凸显了模型优势:在LFIW数据集上,O-YOLOv8s-DC的APs为17.7%,优于YOLOv8s(16.6%)和DETR(14.5%);在OI数据集上更是达到18.9%,较YOLOv8s提升31.3%。这归功于C2f_DC对细粒度纹理的提取能力以及DeepBiFPN的跨尺度特征融合机制。对于大目标(APl),模型在LFIW和OI数据集上分别达到67.5%和64.3%,与DETR(68.2%)相当,表明CARAFE的边缘优化有效提升了边界定位精度。
泛化性与鲁棒性验证
通过“OI训练→LFIW测试”的跨数据集实验验证了模型的泛化能力。在未增强的LFIW数据上,AP@0.5达到60.4%;经过图像增强后进一步提升至61.3%,证明模型能适应不同退化程度的水下环境。尽管小目标检测精度(APs)仍受限于数据集的固有挑战,但模型在浑浊、运动模糊等真实退化条件下的稳定表现,为其实际部署提供了有力支撑。
本研究通过可变形卷积、特征金字塔优化、内容感知上采样和多尺度注意力的有机融合,构建了一个高效适应水下复杂环境的目标检测框架。实验证明,O-YOLOv8s-DC在提升整体检测精度的同时,显著改善了小目标和遮挡目标的识别能力,解决了水下检测中的关键痛点。尽管当前模型在极端环境适应性和弱特征小目标检测方面仍有提升空间,但其为水下生态监测、资源勘探等应用提供了可靠的技术方案。未来工作将聚焦于扩展数据集多样性、引入环境自适应机制以及进一步优化小目标特征表征,推动水下人工智能感知技术向更精准、更鲁棒的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号