
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于权重多样性与因果分析的会话推荐长尾效应通用缓解框架
【字体: 大 中 小 】 时间:2025年06月10日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对会话推荐系统(SBRS)中长尾效应导致的样本分布失衡和多样性不足问题,研究人员提出融合权重多样性与因果分析的通用框架GLA-WDCA。该框架通过do-calculus因果干预降低流行度偏差,结合时序权重和DeepWalk算法重构长尾项集,在Digientica等数据集上实现推荐精度0.2%-7.4%的提升,为平衡准确性与多样性提供新范式。
在信息爆炸的数字时代,推荐系统已成为电商、短视频等平台的核心技术。然而,当前会话推荐系统(SBRS)普遍存在"马太效应"——系统过度推荐热门商品(Head items),而忽视占据商品库80%以上的长尾内容(Long-tail items)。这种偏差不仅导致推荐结果同质化,更使用户错失潜在兴趣的发现机会。以天猫数据集为例,前20%的商品占据85%的交互量,形成典型的"长尾分布"。现有解决方案往往陷入两难:要么牺牲推荐精度强推长尾商品,要么依赖特定场景的图嵌入技术难以泛化。
为破解这一困局,研究人员提出名为GLA-WDCA的通用框架。该框架创新性地将因果推断与权重多样性相结合:通过do-calculus数学工具剥离流行度的混淆影响,保留用户一致性(User Consistency)作为中介变量;同时引入时序权重动态划分长尾项集Zlong tail
与热门项集Zshort head
,结合DeepWalk算法构建带权重的商品图谱。在推荐后处理阶段,采用评分替换策略平衡两类商品曝光。实验表明,该框架在Diginetica等三大基准数据集上,不仅将推荐精度提升最高达7.4%,还显著改善覆盖率(COV)和基尼系数(Gini)等长尾指标。
关键技术包括:1)基于do-calculus的因果干预模型,消除流行度偏差;2)时序权重动态划分商品类型;3)DeepWalk图谱嵌入计算商品相似度;4)融合用户一致性嵌入向量的后处理策略。研究团队特别从Tmall、Yoochoose1/64等真实场景采集用户会话数据验证效果。
【方法论】
框架首先构建因果图模型,通过"do-操作"切断流行度与推荐结果的虚假关联,保留用户一致性作为正向调节变量。随后利用滑动时间窗计算商品累积权重,将低频但稳定出现的商品纳入Zlong tail
。在DeepWalk生成的商品嵌入空间,引入权重多样性因子优化会话表征。
【实验结果】
在Digientica数据集上,GLA-WDCA使长尾商品曝光率提升23.6%,同时保持NDCG@20指标增长2.1%。消融实验证实,单独使用因果模块可使基尼系数下降0.15,而权重多样性模块能将商品覆盖率提升18.4%。框架运行效率测试显示,相较基线模型,额外计算开销控制在15%以内。
这项发表于《Expert Systems with Applications》的研究,首次将因果推理与动态权重分配相结合解决SBRS的长尾问题。其创新点在于:1)提出可解释的因果干预方案,区分流行度的正负向影响;2)设计通用性框架,适配GRU4Rec、NARM等主流会话模型;3)通过可控的计算代价实现"鱼与熊掌兼得"。未来工作可探索多模态场景下的长尾推荐,以及基于强化学习的动态权重调参机制。Yang, F等研究者强调,该技术尤其适合短视频平台等需要平衡商业价值与用户体验的场景,为构建负责任的AI推荐系统提供新思路。
生物通微信公众号
知名企业招聘