陈冲:清华大学人工智能实验室信息检索组 (THUIR) 三年级博士生,本科毕业于清华大学计算机科学与技术系。研究方向包括基于深度学习的推荐系统,可解释推荐系统,以及高效快速的推荐系统。目前已经在WWW,SIGIR,WSDM,TOIS,AAAI等国际会议和期刊上发表了多篇学术论文。
报告题目:个性化推荐系统中的非采样学习 (Non-Sampling Learning for Personalized Recommendation)
报告摘要:近年来,深度学习技术在许多领域展现出非凡的应用效果。然而,现有的将深度学习应用到推荐系统任务的工作主要集中在探索和引入不同的神经网络框架,在模型学习算法方面的研究相对较少。为了优化模型,现有的工作往往使用负采样策略 (Negative Sampling) 进行训练。虽然负采样方便并且易于实现,但是许多最近的研究表明负采样策略的鲁棒性较差,可能会忽略掉重要的训练样例从而导致模型无法收敛到最优的状态。清华大学信息检索课题组 (THUIR) 首次探索了将非采样策略 (Non-Sampling, Whole-data based Learning)应用到基于神经网络的推荐系统中。通过严格的数学推理,我们设计了一系列高效的非采样学习算法,将从整体数据中学习的时间复杂度从理论上降低了一个数量级。基于所设计的高效非采样算法框架,我们分别设计了不同应用场景下的神经网络推荐模型,并在多个现实数据集上相比于已有state-of-the-art方法在训练时间和模型表现上均取得了非常显著的效果。
Spotlight:
通过严格的数学推理,我们设计了一系列高效的非采样学习算法,将从整体数据中学习的时间复杂度从理论上降低了数十倍,所设计的高效学习算法可以广泛的应用于多个机器学习任务;
基于所设计的高效非采样算法框架,我们分别设计了不同应用场景下的神经网络推荐模型,并在多个现实数据集上相比于已有state-of-the-art方法获得非常显著的提升;
所设计的高效非采样算法填补了非采样神经网络推荐模型研究的空白,为基于神经网络的推荐模型的研究开辟了一个新的方向。
1. Efficient Neural Matrix Factorization without Sampling for Recommendation
推荐理由:该篇论文设计了一系列高效非采样学习算法,在基础推荐场景上 (只使用用户和商品ID信息)达到了SOA效果:推荐效果提升5%以上,训练时间快30倍以上。
2. An Efficient Adaptive Transfer Neural Network for Social-aware Recommendation
推荐理由:该篇论文提出了一个高效自适应迁移学习模型,结合非采样学习进行训练,在包含社交关系的推荐场景上达到了SOA效果:推荐效果提升4%以上,训练时间快7倍以上。
3. Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation
推荐理由:该篇论文提出了一个高效的利用用户和商品的多种行为信息(如点击,加入购物车,购买等)的推荐模型,在包含多行为数据的推荐场景上达到了SOA效果:推荐效果提升40%以上,训练时间快10倍以上。
4. Efficient Non-Sampling Factorization Machines for Optimal Context-Aware Recommendation
推荐理由:本文进一步对非采样学习算法进行拓展,提出了一个高效的非采样分解机模型,在包含特征(feature)和上下文(context)的推荐场景上取得了SOA效果:推荐效果提升9%以上,训练时间快5倍以上。