徐亦达团队在IEEE Transactions on Knowledge and Data Engineering 的发表了一篇机器学习论文
- Magnitude Bounded Matrix Factorisation for Recommender Systems(模限界矩阵分解)
论文第一作者:姜帅,徐亦达老师和北理工李侃老师的共同博士生
徐亦达教授简介:
现任悉尼科技大学教授,UTS 全球数据技术中心机器学习和数据分析实验室主任。主要研究方向是机器学习,数据分析和计算机视觉。他在国际重要期刊与会议发表数篇高影响因子论文;编写了大量的数理统计、概率和机器学习教材。
徐老师的 github:
https://github.com/roboticcam
优酷:
http://i.youku.com/i/UMzIzNDgxNTg5Ng
论文介绍
1. Magnitude Bounded Matrix Factorisation for Recommender Systems
论文作者:
Shuai Jiang, Kan Li, and Richard Yi Da Xu
论文链接:
http://arxiv.org/pdf/1807.05515
论文摘要
模限界矩阵分解
低秩矩阵分解常被用在推荐系统中,作为提取潜在特征的方法。当处理大规模稀疏数据时,传统推荐算法存在预测值大量越界且波动的问题。增加限界约束已被证明是解决这一问题的有效方案。然而,现有限界算法只能处理一对固定的边界,且在应用于大规模数据时非常耗时。在这篇文章中,我们提出一种全新的算法,称为模限界矩阵分解(Magnitude Bounded Matrix Factorisation, MBMF)。它允许每个用户或物品的边界不同,并且能高效处理大规模数据集。这一算法的核心思想是,构造一个能对每个用户或物品特征向量模长进行约束的模型。通过坐标系变换,设置球面坐标系中向量半径为相应模长,该算法可将上述约束优化问题转变为无约束优化问题,后者能被无约束优化算法轻松求解,例如随机梯度下降。同时,我们探索了一种加速计算方法,并给出了如何从历史数据中提取模长约束。模拟数据集和真实数据集上的实验表明,在大多数情况下,MBMF在准确率和时间复杂度上均优于现有算法。
在Synthetic 数据集上的效果
在两个数据集上的效果
总结
论文下载:http://arxiv.org/pdf/1807.05515
不多说了,徐亦达老师团队出品,必属精品,建议下载慢慢看。