基于权重多样性与因果分析的会话推荐长尾效应通用缓解框架

【字体: 时间:2025年06月10日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对会话推荐系统(SBRS)中长尾效应导致的样本分布失衡和多样性不足问题,研究人员提出融合权重多样性与因果分析的通用框架GLA-WDCA。该框架通过do-calculus因果干预降低流行度偏差,结合时序权重和DeepWalk算法重构长尾项集,在Digientica等数据集上实现推荐精度0.2%-7.4%的提升,为平衡准确性与多样性提供新范式。

  

在信息爆炸的数字时代,推荐系统已成为电商、短视频等平台的核心技术。然而,当前会话推荐系统(SBRS)普遍存在"马太效应"——系统过度推荐热门商品(Head items),而忽视占据商品库80%以上的长尾内容(Long-tail items)。这种偏差不仅导致推荐结果同质化,更使用户错失潜在兴趣的发现机会。以天猫数据集为例,前20%的商品占据85%的交互量,形成典型的"长尾分布"。现有解决方案往往陷入两难:要么牺牲推荐精度强推长尾商品,要么依赖特定场景的图嵌入技术难以泛化。

为破解这一困局,研究人员提出名为GLA-WDCA的通用框架。该框架创新性地将因果推断与权重多样性相结合:通过do-calculus数学工具剥离流行度的混淆影响,保留用户一致性(User Consistency)作为中介变量;同时引入时序权重动态划分长尾项集Zlong tail
与热门项集Zshort head
,结合DeepWalk算法构建带权重的商品图谱。在推荐后处理阶段,采用评分替换策略平衡两类商品曝光。实验表明,该框架在Diginetica等三大基准数据集上,不仅将推荐精度提升最高达7.4%,还显著改善覆盖率(COV)和基尼系数(Gini)等长尾指标。

关键技术包括:1)基于do-calculus的因果干预模型,消除流行度偏差;2)时序权重动态划分商品类型;3)DeepWalk图谱嵌入计算商品相似度;4)融合用户一致性嵌入向量的后处理策略。研究团队特别从Tmall、Yoochoose1/64等真实场景采集用户会话数据验证效果。

【方法论】
框架首先构建因果图模型,通过"do-操作"切断流行度与推荐结果的虚假关联,保留用户一致性作为正向调节变量。随后利用滑动时间窗计算商品累积权重,将低频但稳定出现的商品纳入Zlong tail
。在DeepWalk生成的商品嵌入空间,引入权重多样性因子优化会话表征。

【实验结果】
在Digientica数据集上,GLA-WDCA使长尾商品曝光率提升23.6%,同时保持NDCG@20指标增长2.1%。消融实验证实,单独使用因果模块可使基尼系数下降0.15,而权重多样性模块能将商品覆盖率提升18.4%。框架运行效率测试显示,相较基线模型,额外计算开销控制在15%以内。

这项发表于《Expert Systems with Applications》的研究,首次将因果推理与动态权重分配相结合解决SBRS的长尾问题。其创新点在于:1)提出可解释的因果干预方案,区分流行度的正负向影响;2)设计通用性框架,适配GRU4Rec、NARM等主流会话模型;3)通过可控的计算代价实现"鱼与熊掌兼得"。未来工作可探索多模态场景下的长尾推荐,以及基于强化学习的动态权重调参机制。Yang, F等研究者强调,该技术尤其适合短视频平台等需要平衡商业价值与用户体验的场景,为构建负责任的AI推荐系统提供新思路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号