
-
生物通官微
陪你抓住生命科技
跳动的脉搏
工业物联网中点引导范例提示的新型少样本目标计数范式研究
【字体: 大 中 小 】 时间:2025年06月10日 来源:Future Generation Computer Systems 6.2
编辑推荐:
为解决少样本目标计数(FSOC)中依赖边界框提示导致的泛化性受限问题,研究人员创新性提出点引导范例提示网络(PEPNet)。该研究通过多尺度注意力融合模块(MAFM)和迭代编码匹配模块(IEMM),在FSC-147等数据集上实现MAE降低1.9%、RMSE提升21.5%的突破,为工业物联网(IIoT)智能检测提供新范式。
在工业物联网(IIoT)和智能城市快速发展的背景下,目标计数技术成为处理海量视觉数据的关键。传统方法依赖特定类别的密集标注或边界框提示,面临标注成本高、泛化能力弱的核心痛点。尤其当面对产线零件、交通流量等工业场景时,现有少样本目标计数(Few-Shot Object Counting, FSOC)方法因受限于轴对齐边界框的结构约束,难以适应复杂场景中物体的任意朝向和遮挡问题。这种局限性严重制约了智能检测系统在真实工业环境中的部署效率。
针对这一挑战,中国研究人员在《Future Generation Computer Systems》发表创新研究,提出点引导范例提示网络(Point-guided Exemplar Prompting Network, PEPNet)。该研究首次将稀疏点注释作为视觉提示,通过两个核心技术模块——集成空间与通道注意力的多尺度注意力融合模块(Multi-scale Attention Fusion Module, MAFM),以及采用动态卷积核策略的迭代编码匹配模块(Iterative Encoding Matching Module, IEMM),实现了对任意类别物体的精准计数。实验表明,该方法在FSC-147验证集上MAE(平均绝对误差)和RMSE(均方根误差)分别较最优基线提升1.9%和12.3%,在测试集上RMSE改进幅度更高达21.5%。
关键技术包括:(1)基于FSC-147和COCO等基准数据集构建点标注范例;(2)MAFM模块的多级特征金字塔融合策略;(3)IEMM模块中创新的多头相似性匹配(Multi-head Similarity Matching, MSM)机制;(4)端到端的密度图回归框架。
【研究结果】
结论部分强调,该工作开创了点引导FSOC新范式,其重要意义体现在三方面:(1)将标注成本降低至单点级别,使工业现场快速部署成为可能;(2)提出的MSM机制为小样本学习中的特征匹配提供新思路;(3)在ShanghaiTech人群数据集上的迁移实验证明,方法可扩展至其他密集计数场景。讨论指出,未来研究需重点解决高相似物体区分难题,这将推动IIoT环境下的设备缺陷检测等应用发展。
生物通微信公众号
知名企业招聘