基于权重多样性与因果分析的会话推荐长尾效应通用缓解框架

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月10日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　针对会话推荐系统(SBRS)中长尾效应导致的样本分布失衡和多样性不足问题，研究人员提出融合权重多样性与因果分析的通用框架GLA-WDCA。该框架通过do-calculus因果干预降低流行度偏差，结合时序权重和DeepWalk算法重构长尾项集，在Digientica等数据集上实现推荐精度0.2%-7.4%的提升，为平衡准确性与多样性提供新范式。

在信息爆炸的数字时代，推荐系统已成为电商、短视频等平台的核心技术。然而，当前会话推荐系统(SBRS)普遍存在"马太效应"——系统过度推荐热门商品(Head items)，而忽视占据商品库80%以上的长尾内容(Long-tail items)。这种偏差不仅导致推荐结果同质化，更使用户错失潜在兴趣的发现机会。以天猫数据集为例，前20%的商品占据85%的交互量，形成典型的"长尾分布"。现有解决方案往往陷入两难：要么牺牲推荐精度强推长尾商品，要么依赖特定场景的图嵌入技术难以泛化。

为破解这一困局，研究人员提出名为GLA-WDCA的通用框架。该框架创新性地将因果推断与权重多样性相结合：通过do-calculus数学工具剥离流行度的混淆影响，保留用户一致性(User Consistency)作为中介变量；同时引入时序权重动态划分长尾项集Z_{long tail}
与热门项集Z_{short head}
，结合DeepWalk算法构建带权重的商品图谱。在推荐后处理阶段，采用评分替换策略平衡两类商品曝光。实验表明，该框架在Diginetica等三大基准数据集上，不仅将推荐精度提升最高达7.4%，还显著改善覆盖率(COV)和基尼系数(Gini)等长尾指标。

关键技术包括：1)基于do-calculus的因果干预模型，消除流行度偏差；2)时序权重动态划分商品类型；3)DeepWalk图谱嵌入计算商品相似度；4)融合用户一致性嵌入向量的后处理策略。研究团队特别从Tmall、Yoochoose1/64等真实场景采集用户会话数据验证效果。

【方法论】
框架首先构建因果图模型，通过"do-操作"切断流行度与推荐结果的虚假关联，保留用户一致性作为正向调节变量。随后利用滑动时间窗计算商品累积权重，将低频但稳定出现的商品纳入Z_{long tail}
。在DeepWalk生成的商品嵌入空间，引入权重多样性因子优化会话表征。

【实验结果】
在Digientica数据集上，GLA-WDCA使长尾商品曝光率提升23.6%，同时保持NDCG@20指标增长2.1%。消融实验证实，单独使用因果模块可使基尼系数下降0.15，而权重多样性模块能将商品覆盖率提升18.4%。框架运行效率测试显示，相较基线模型，额外计算开销控制在15%以内。

这项发表于《Expert Systems with Applications》的研究，首次将因果推理与动态权重分配相结合解决SBRS的长尾问题。其创新点在于：1)提出可解释的因果干预方案，区分流行度的正负向影响；2)设计通用性框架，适配GRU4Rec、NARM等主流会话模型；3)通过可控的计算代价实现"鱼与熊掌兼得"。未来工作可探索多模态场景下的长尾推荐，以及基于强化学习的动态权重调参机制。Yang, F等研究者强调，该技术尤其适合短视频平台等需要平衡商业价值与用户体验的场景，为构建负责任的AI推荐系统提供新思路。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号