NMPC行为克隆中的对比学习方法用于海洋车辆的通用轨迹跟踪

《IEEE Journal of Oceanic Engineering》:Contrastive Learning in NMPC Behavior Cloning for Generalized Trajectory Tracking of Marine Vehicles

【字体: 时间:2025年11月19日 来源:IEEE Journal of Oceanic Engineering 5.3

编辑推荐:

  模仿学习与神经网络在非线性模型预测控制轨迹跟踪中的应用研究,提出对比学习方法学习轨迹表示,减少专家数据需求并降低控制计算量,适用于小型海洋车辆高效自主导航。

  

摘要:

最近的研究广泛探讨了利用神经网络表示控制策略的方法,这些网络具备强大的通用函数逼近能力。模仿学习能够复制专家的熟练程度,从而大幅减少部署专家所需的资源。在这项研究中,我们旨在使用神经网络来模仿非线性模型预测控制(NMPC)策略,从而降低优化的计算需求。在轨迹跟踪问题中,虽然运动状态的范围(如操作速度)可以很容易地确定,但为可能的轨迹定义数据分布仍然具有挑战性。为了提高模仿学习的效率并学习通用的轨迹跟踪策略,我们提出了一种利用对比学习来学习轨迹表示的方法。通过使用该方法学习到的特征,我们可以识别出具有代表性的轨迹,并用较少的示范数据来模仿NMPC策略。此外,作为神经网络表示的训练好的策略可以显著减少控制计算时间,这对小型海洋车辆来说非常有益。

引言

移动车辆的导航主要面临两个任务:路径规划,即制定绕过障碍物的路线;以及控制机制,确保车辆遵循这些规划好的路线。在路径规划中,我们区分了路径(简单的位置序列)和轨迹(根据时间指定的期望位置)。对于高级自主性而言,轨迹跟踪至关重要,它使车辆能够在动态环境中(存在移动障碍物的情况下)精确地跟随预定义的轨迹。由于期望的轨迹会随时间变化,轨迹跟踪通常被构建为一个最优控制问题,该问题需要实时计算必要的控制输入。模型预测控制(MPC)常用于此目的,因为它在考虑时间约束的同时持续优化控制输入。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号