USVRT-DETR:面向水面无人艇场景的多尺度特征融合与跨尺度交互Transformer检测器

【字体: 时间:2025年09月24日 来源:Obesity Research & Clinical Practice 2.3

编辑推荐:

  本文提出了一种基于Transformer的高效水面目标检测框架USVRT-DETR,通过引入轻量化CSP-EPNet主干网络、TIFI模块和SOFP特征金字塔,显著提升了复杂水面环境下小目标检测性能(mAP@0.5达84.3%)。模型仅需15.2M参数即可实现62.6 FPS的实时检测,为无人艇(USV)在资源受限条件下的智能感知提供了突破性解决方案。

  

Highlight

本研究针对水面无人艇(USV)在复杂水域环境中小目标检测的挑战,提出了一种创新性的Transformer检测框架USVRT-DETR。该框架通过三大核心模块实现突破:轻量化CSP-EPNet主干网络实现高效多尺度特征提取,TIFI模块通过Token统计自注意力机制降低计算开销,SOFP特征金字塔专为小目标检测优化。在自建数据集USV-MSOD(涵盖河流、湖泊、海岸等多场景)上的实验表明,模型在精度、速度和轻量化方面均超越主流检测器。

Proposed method

为应对USV目标检测中面临的小目标密集、背景复杂及边缘计算资源受限等挑战,本研究基于RT-DETR-R18框架构建了USVRT-DETR模型。如图6所示,模型包含三大组件:主干网络(Backbone)、混合编码器(Hybrid Encoder)以及带辅助预测头的Transformer解码器。其工作流程紧密围绕USV场景的特殊需求设计,通过EPNet实现感受野扩展与冗余计算削减,TIFI模块替代传统MHSA以保留全局上下文建模能力,SOFP则通过引入P2检测层与SPDConv、COK-Fusion机制强化细粒度特征融合。

Experimental results and analysis

本章通过系统化实验验证USVRT-DETR在水面目标检测任务中的有效性。实验选用三个代表性数据集:USV-MSOD、WSODD和FloW-IMG(详细描述见第2章),从检测精度、推理速度、模型参数量等多维度进行综合评估。结果表明,所提方法在复杂水域环境下显著优于现有主流模型,特别是在小目标检测和实时性方面表现突出。

Conclusion

本文提出的USVRT-DETR是一种面向复杂水域无人艇目标检测的高效轻量化Transformer模型。其在RT-DETR基础上引入三大关键创新:EPNet多尺度特征增强主干网络、结合局部与全局建模的TIFI高效特征交互模块,以及专为小目标检测设计的SOFP特征金字塔结构。这些模块协同实现了精度与效率的平衡,为USV在资源受限条件下的智能感知提供了实用化解决方案。

CRediT authorship contribution statement

Qingfa Zhang: 文稿撰写与修订、可视化、验证、监督;Xin Liu: 监督、资金获取、数据分析、概念化;Mingzhi Shao: 方法论;Tengwen Zhang: 可视化、验证;Yuhan Sun: 调研;Haiwen Yuan: 验证。

Declaration of competing interest

作者声明不存在可能影响本研究结果的已知竞争性经济利益或个人关系。

Acknowledgements

本研究得到山东省“星海互联”重大创新项目(科技示范项目)(编号:2024SFGC0201)支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号