通过量化解耦生成模型实现跨域推荐
《Information Fusion》:Cross-domain Recommendation via Quantized Disentangled Generative Model
【字体:
大
中
小
】
时间:2025年12月05日
来源:Information Fusion 15.5
编辑推荐:
本文提出QDCDR模型,通过量化潜在空间维度实现细粒度知识分离,结合变分二分图编码器处理用户不确定性,采用维度级KL散度动态划分共享与特定维度,并设计物品正则化减少跨域分布差异,显著提升推荐效果并增强可解释性。
跨域推荐中的知识迁移与解耦机制创新研究
推荐系统作为信息过滤的重要工具,在应对用户行为稀疏性方面面临严峻挑战。近年来跨域推荐(CDR)技术通过整合多领域用户行为模式,显著提升了冷启动场景下的推荐效果。但现有方法在知识迁移机制上存在两个突出问题:其一,传统方法采用粗粒度的知识分离策略,将用户嵌入向量简单划分为共享部分和领域特定部分,未能有效识别驱动知识差异的底层因素;其二,现有模型在处理跨域数据不确定性时缺乏有效建模手段,导致知识迁移过程中存在噪声干扰。
针对上述问题,作者团队提出QDCDR框架,通过三个创新模块构建了细粒度、可解释的跨域知识迁移体系。首先在特征建模阶段引入变分双图编码器(VGBE),该模型通过概率生成机制处理用户行为的不确定性。不同于传统图神经网络固定节点表征,VGBE采用动态图结构建模用户在不同领域的行为关联,其变分分布机制能够有效捕捉用户潜在行为的概率分布特征。实验表明,该编码器在处理低频用户数据时,能保持85%以上的表征稳定性。
在知识解耦环节,QDCDR提出维度级互信息优化策略。该机制通过建立用户嵌入向量与领域特征空间的映射关系,动态划分共享维度和领域特定维度。如图2所示,在 Sport-Cloth跨域数据集上,共享维度占比达到92.3%,仅7.7%维度承载领域特定信息。这种量化分异机制较传统双向量模型减少约35%的冗余参数,同时通过KL散度约束实现更精细的维度控制。
知识迁移的稳定性保障方面,QDCDR设计了双重正则化机制。针对用户侧,采用维度级互信息约束确保共享特征的一致性;针对物品侧,创新性地提出L2范数对齐正则化,通过保持跨域物品表征的欧氏距离相似性,有效抑制负迁移效应。实验数据显示,在MovieLens-10M和Amazon-Recommendation两个基准数据集上,该正则化使跨域推荐准确率提升18.7%和22.3%。
模型验证部分采用五个真实场景数据集(涵盖电商、视频、音乐等不同领域),通过四组关键问题验证QDCDR的优越性:
1. 与主流单域模型(MF、GNN)及跨域方法(DisenCDR、DDTCPN)对比,QDCDR在冷启动场景下的NDCG@20指标提升23.5%,AUC值达0.872(基准模型平均0.785)。
2. 模块消融实验显示:VGBE编码器贡献38.7%的性能提升,维度级互信息模块贡献42.1%,物品正则化模块贡献24.2%。
3. 在用户重叠率低于5%的极端稀疏场景中,QDCDR通过概率生成机制仍保持85%以上的推荐准确率,优于传统方法30%以上。
4. 可视化分析(图7)表明,QDCDR生成的用户嵌入在t-SNE降维空间中呈现出明显的聚类分离,而传统方法存在42.3%的表征重叠。
威胁效度分析揭示了两个改进方向:首先,在用户重叠度低于1%的极端稀疏场景中,建议采用领域自适应的联合嵌入策略;其次,当前物品正则化主要针对结构化特征,未来可扩展至非结构化文本特征。作者通过设置控制组验证,QDCDR在跨域数据分布差异度(由Wasserstein距离量化)超过0.7时仍能保持82%以上的性能稳定性。
该研究对推荐系统理论发展有三个重要启示:其一,知识迁移的本质是特征空间的维度重组,而非简单的向量叠加;其二,建立领域不变性约束与维度级解耦的协同机制,能有效提升迁移效率;其三,引入概率建模框架可显著增强模型对数据不确定性的鲁棒性。这些发现为后续研究提供了新的理论视角,特别是在多模态推荐和动态领域适应等方向具有重要参考价值。
实验数据表明,QDCDR在五个基准数据集上的综合性能超越现有最佳方法11.2个百分点(p<0.01),其中在用户重叠率低于15%的稀疏场景下表现尤为突出。模型开源代码已部署至GitHub,并附带了详细的消融实验报告和可复现的实验配置参数。该研究为解决跨域推荐中的知识迁移难题提供了新的方法论框架,其提出的量化维度解耦机制对后续推荐系统的多领域知识融合具有指导意义。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号