学习任务:多输出深度神经网络中用于梯度冲突缓解的优选推理路径
《IEEE Transactions on Pattern Analysis and Machine Intelligence》:Learning Task-Preferred Inference Routes for Gradient De-Conflict in Multi-Output DNNs
【字体:
大
中
小
】
时间:2025年11月25日
来源:IEEE Transactions on Pattern Analysis and Machine Intelligence 18.6
编辑推荐:
多输出深度神经网络中共享过滤器导致任务间梯度冲突,影响模型性能。提出的DR-MGF算法通过动态路由和元加权梯度融合机制,学习任务特定的推理路径,根据共享过滤器对不同任务的重要性动态调整权重,有效降低跨任务干扰。实验表明DR-MGF在CIFAR、ImageNet、NYUv2等数据集上优于现有方法,且可扩展至一般多任务网络。
摘要:
多输出深度神经网络(Multi-output Deep Neural Networks,简称MONs)包含多个用于不同任务的输出分支,这些任务通常会共享部分网络滤波器,从而导致网络内部不同任务之间的推理路径相互交织。由于优化目标存在差异,训练过程中各任务的梯度会在共享路径上相互干扰,从而降低整个模型的性能。为了解决这个问题,我们提出了一种名为DR-MGF(Dynamic Routes and Meta-weighted Gradient Fusion)的新颖梯度冲突缓解算法。与现有的冲突缓解方法不同,DR-MGF通过学习任务优先的推理路径来实现MONs中的梯度冲突缓解。该方法的提出基于我们的实验发现:共享滤波器对不同任务的重要性并不相同。通过设计可学习的任务特定重要性变量,DR-MGF能够评估滤波器对不同任务的重要性。通过使任务对滤波器的支配程度与滤波器的任务特定重要性成正比,DR-MGF可以有效减少任务之间的干扰。这些任务特定重要性变量最终在训练迭代结束时决定了任务优先的推理路径。在CIFAR、ImageNet和NYUv2数据集上的广泛实验结果表明,DR-MGF的性能优于现有的冲突缓解方法。此外,DR-MGF可以在不修改整个网络结构的情况下应用于一般的MONs。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号