基于知识图谱与对比学习的细粒度用户偏好建模及其在个性化推荐中的应用研究

《Tsinghua Science and Technology》:Learning Fine-Grained User Preference for Personalized Recommendation

【字体: 时间:2025年11月21日 来源:Tsinghua Science and Technology 3.5

编辑推荐:

  本文针对推荐系统中用户偏好建模粒度不足及向量表示区分度低的问题,提出了一种基于知识图谱(KG)与对比学习的细粒度用户偏好学习模型(LFUP)。该模型通过融合用户-项目交互数据与KG中的关系信息,实现了对用户兴趣的深层挖掘,并利用对比学习优化用户向量空间分布,显著提升了推荐结果的个性化程度与可解释性。实验表明,LFUP在多个公开数据集上均优于现有基线模型,为推荐系统研究提供了新思路。

  
在当今信息过载的时代,推荐系统已成为连接用户与内容的重要桥梁。然而,传统的推荐算法如协同过滤(CF)和基于内容的方法,往往只能预测用户行为,却难以深入理解用户偏好背后的原因。例如,当用户观看电影《当幸福来敲门》时,系统无法判断其兴趣点是励志题材还是著名导演。此外,基于图神经网络(GNN)的推荐模型虽能捕捉高阶关联,却易导致用户向量在空间中聚集于狭窄区域,使得个性化推荐效果大打折扣。
针对这些问题,清华大学期刊《Tsinghua Science and Technology》发表了一项名为《Learning Fine-Grained User Preference for Personalized Recommendation》的研究。该研究通过融合用户-项目交互数据与知识图谱(KG),提出了一种细粒度用户偏好学习模型(LFUP),旨在从多视角挖掘用户兴趣,并利用对比学习优化用户表示的空间分布,从而提升推荐的准确性与可解释性。
为开展研究,作者团队设计了四大关键技术模块:首先,基于用户-项目交互数据,通过余弦相似度阈值过滤噪声邻居,聚合高阶邻居信息以增强表示学习;其次,在KG视图中,利用可学习权重矩阵刻画用户对不同关系(如电影导演或类别)的偏好强度,并通过关系重要性加权聚合实体信息;接着,采用求和或拼接操作融合双视图信息,减少语义差异;最后,引入对比学习损失函数(InfoNCE)优化用户向量空间分布,最大化不同用户表示的距离。实验使用ML-1M、Last.FM和Amazon-Books三个公开数据集,评估指标包括Recall@K和NDCG@K。
模型架构与实现
LFUP模型包含四个核心组件:交互视图嵌入、KG视图嵌入、全局信息聚合以及优化预测模块。在交互视图中,通过计算节点与邻居的余弦相似度,筛选相关性高的邻居信息,并逐层聚合高阶连接信息。在KG视图中,用户表示由关系向量加权求和得到,项目表示则通过聚合多跳邻居实体信息增强语义。双视图信息通过L2归一化后求和或拼接融合,最终通过二元交叉熵损失和对比学习损失联合优化模型参数。
实验设计与性能对比
在三个数据集上的实验表明,LFUP在Recall@10和NDCG@10指标上均显著优于基线模型(如DMF、NNCF、RippleNet等)。例如,在Last.FM数据集上,LFUP的Recall@10较最优基线提升7.93%。可视化分析进一步显示,LFUP生成的用户向量在空间中分布更分散,印证了其个性化推荐优势。
参数敏感性与消融实验
超参数分析表明,当温度参数τ=0.1、邻居数O=8、跳数H=2时模型性能最优。消融实验验证了对比学习模块和双视图信息的重要性:移除对比学习导致用户区分度下降,仅使用单一视图时性能显著劣化。
案例研究
以ML-1M数据集中的用户u256和u284为例,LFUP生成的推荐列表分别聚焦于动作/惊悚片和冒险/喜剧片,体现了模型对用户兴趣的细粒度捕捉能力。多视图学习机制通过历史交互数据和KG关系共同支撑了推荐结果的可解释性。
本研究通过多视图偏好学习和对比学习优化,实现了对用户偏好的细粒度建模与个性化推荐。LFUP模型不仅提升了推荐准确性,还通过KG关系增强了结果的可解释性。未来工作可引入社交网络或多媒体内容等辅助信息,进一步丰富用户偏好建模的维度。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号