首页 > 其他分享 >读论文-电子商务产品推荐的序列推荐系统综述与分类(A Survey and Taxonomy of Sequential Recommender Systems for E-commerce Prod

读论文-电子商务产品推荐的序列推荐系统综述与分类(A Survey and Taxonomy of Sequential Recommender Systems for E-commerce Prod

时间:2024-04-11 22:26:20浏览次数:16  
标签:commerce Product 顺序 项目 Taxonomy 推荐 系统 用户 序列

前言

今天读的这篇文章是于2023年发表在"SN Computer Science"上的一篇论文,这篇文章主要对序列推荐系统进行了全面的调查和分类,特别是在电子商务领域的应用。文章首先定义了用户和产品集合,以及用户与产品的交互序列。然后,它解释了序列推荐系统的目标,即生成一个个性化的Top-K排名的候选项目列表,以最大化用户的未来需求。这种系统通过建模用户和产品之间的交互序列(如点击、查看或购买在线购物平台上的物品)来建议可能对用户感兴趣的项目。文章还讨论了一些用于改进推荐系统效果的方法,例如使用时间戳来表示用户的行为序列,以及使用“兴趣序列”来描绘用户的兴趣演变模式。

Nasir, Mahreen, and C. I. Ezeife. "A Survey and Taxonomy of Sequential Recommender Systems for E-commerce Product Recommendation." SN Computer Science 4.6 (2023): 708.

Abstract 摘要

E-commerce recommendation systems facilitate customers’ purchase decision by recommending products or services of interest (e.g., Amazon). Designing a recommender system tailored toward an individual customer’s need is crucial for retailers to increase revenue and retain customers’ loyalty. As users’ interests and preferences change with time, the time stamp of a user interaction (click, view or purchase event) is an important characteristic to learn sequential patterns from these user interactions and, hence, understand users’ long- and short-term preferences to predict the next item(s) for recommendation. This paper presents a taxonomy of sequential recommendation systems (SRecSys) with a focus on e-commerce product recommendation as an application and classifes SRecSys under three main categories as: (i) traditional approaches (sequence similarity, frequent pattern mining and sequential pattern mining), (ii) factorization and latent representation (matrix factorization and Markov models) and (iii) neural network-based approaches (deep neural networks, advanced models). This classifcation contributes towards enhancing the understanding of existing SRecSys in the literature with the application domain of e-commerce product recommendation and provides current status of the solutions available alongwith future research directions. Furthermore, a classifcation of surveyed systems according to eight important key features supported by the techniques along with their limitations is also presented. A comparative performance analysis of the presented SRecSys based on experiments performed on e-commerce data sets (Amazon and Online Retail) showed that integrating sequential purchase patterns into the recommendation process and modeling users’ sequential behavior improves the quality of recommendations.

电子商务推荐系统通过推荐客户感兴趣的产品或服务来促进客户的购买决策(如亚马逊)。设计一个针对个别顾客需求的推荐系统对零售商增加收入和保持顾客忠诚度至关重要。由于用户的兴趣和偏好随时间而变化,用户交互(点击、查看或购买事件)的时间戳是从这些用户交互中学习顺序模式的重要特征,从而了解用户的长期和短期偏好,以预测下一个要推荐的项目。本文提出了顺序推荐系统(SRecSys)的分类,重点介绍了电子商务产品推荐的应用,并将SRecSys分为三大类:(i)传统方法(序列相似性,频繁模式挖掘和顺序模式挖掘),(ii)分解和潜在表示(矩阵分解和马尔可夫模型)和(iii)基于神经网络的方法(深度神经网络,高级模型)。这种分类有助于加强对现有文献中电子商务产品推荐应用领域的SRecSys的理解,并提供了现有解决方案的现状以及未来的研究方向。此外,还根据这些技术支持的八个重要关键特征及其局限性对调查系统进行了分类。基于电子商务数据集(亚马逊和在线零售)的实验,对所提出的SRecSys进行性能对比分析表明,将顺序购买模式集成到推荐过程中并对用户的顺序行为建模可以提高推荐的质量。

摘要部分主要介绍了电子商务推荐系统以及针对个体用户需求设计定制化推荐系统的重要性。随着用户兴趣和偏好随时间变化,用户交互(点击、浏览或购买事件)的时间戳成为学习用户交互序列模式和理解用户长期和短期偏好的重要特征。本文提出了顺序推荐系统(Sequential Recommender Systems, SRecSys)的分类法,并以电子商务产品推荐为应用领域进行了分类。分类包括传统方法(序列相似性、频繁模式挖掘和顺序模式挖掘)、分解和潜在表示(矩阵分解和马尔可夫模型)以及基于神经网络的方法(深度神经网络和高级模型)。该分类有助于增进对现有SRecSys在文献中的理解,并提供了当前可用解决方案的现状以及未来的研究方向。此外,还根据技术支持的八个重要关键特征以及它们的局限性对调查系统进行了分类。对基于电子商务数据集(如亚马逊和在线零售)进行的实验进行了比较性能分析,结果表明将顺序购买模式整合到推荐过程中并建模用户的顺序行为可以提高推荐的质量。

引言

文章的摘要部分主要介绍了电子商务推荐系统(RS)以及它们在帮助用户做出购买决策方面的重要性。推荐系统根据用户的兴趣提供建议,许多公司和服务提供商如亚马逊、Facebook、Netflix和Career Builders都提供针对产品、朋友、电影和工作的推荐。电子商务推荐系统帮助客户做出决策,通过推荐可能符合他们兴趣的商品,缩小了在成千上万种可用产品中的选择范围,节省了客户的时间。顶级科技电子商务公司(如亚马逊、阿里巴巴)采用定制化的推荐系统来满足不断增长的客户需求并保持市场份额。其中最常用的推荐技术之一是协同过滤(CF),它根据其他相似用户的喜好推荐给用户可能感兴趣的产品。然而,CF存在一些限制,如评分矩阵稀疏(用户只对少数几个商品进行评分)和冷启动问题(新商品在没有评分的情况下无法进行推荐)。为了解决这些问题,引入了混合推荐系统,综合考虑用户对商品的偏好和商品的内容特征来生成推荐。电子商务推荐系统面临的挑战包括冷启动问题、数据稀疏性以及推荐多样性等。

首先,作者提到推荐系统在帮助用户做出购买决策方面的重要性。通过根据用户的兴趣和喜好提供个性化的推荐,推荐系统可以大大改善用户的购物体验,并帮助用户发现他们可能感兴趣的产品。这对于电子商务公司来说尤为关键,因为它们需要增加收入并保持客户的忠诚度。

接下来,作者介绍了协同过滤(CF)作为一种常用的推荐技术。CF基于用户之间的相似性来进行推荐,即如果两个用户具有相似的喜好和行为模式,那么他们可能对相似的产品感兴趣。然而,CF也存在一些限制,如评分矩阵的稀疏性和冷启动问题。评分矩阵的稀疏性指的是用户只对少数几个商品进行评分,导致推荐系统难以准确地了解用户的喜好。冷启动问题则指的是新商品在没有足够的评分数据的情况下无法进行有效的推荐。

为了应对这些挑战,作者提出了混合推荐系统的概念。混合推荐系统综合考虑了用户对商品的偏好以及商品的内容特征,从而生成更准确和多样化的推荐结果。这种方法可以弥补传统协同过滤方法的局限性,并提供更好的推荐性能。

在电子商务推荐系统中,还存在一些挑战需要克服。其中包括冷启动问题,即如何在新用户或新商品加入系统时进行有效的推荐;数据稀疏性,即评分矩阵中的缺失数据导致难以进行准确的推荐;以及推荐多样性,即如何确保推荐结果既满足用户的兴趣又具有多样性。

总之,引言部分详细介绍了电子商务推荐系统的重要性,并讨论了相关的挑战。这为后续的论文内容和研究方法提供了背景和基础。

Overview of Sequential Recommendation 序列推荐综述

顺序推荐系统通过对用户-物品交互(例如,在在线购物平台上点击、查看或购买物品)的顺序依赖关系进行建模来建议用户可能感兴趣的物品[12]。通过反映事件(例如,点击或购买)对前一个事件的顺序依赖关系,学习项目之间的顺序依赖关系有助于对用户偏好进行建模。顺序推荐器将用户交互视为一个序列,并预测用户将与之交互的下一个项目。用户与之交互的物品(例如,点击、评分或购买)可以强烈地表明用户的兴趣,并有助于了解良好的用户资料,从而提供符合其兴趣的推荐。然而,用户的兴趣和偏好会随着时间而变化。用户交互(点击或购买事件)的时间戳是一个重要的属性,学习基于时间戳的用户交互的顺序模式对于(i)理解用户的长期和短期偏好以及(ii)预测用户购买的下一个项目是有用的,因为任何此类交互之间的时间间隔提供了关于用户行为的有用见解。在现实世界中,用户与物品的交互(例如,购物行为)大多是顺序依赖的。例如,在图2中,我们可以看到用户Smith的顺序依赖关系。在史密斯购买了相机、存储卡和相机外壳之后,他下一步将购买什么物品?这种顺序依赖关系在交易数据中普遍存在,但传统的协同过滤和基于内容的推荐系统无法捕获这些顺序依赖关系,因此需要开发顺序推荐系统。

Taxonomy of Sequential Recommendation 顺序推荐分类法

序列推荐系统分为三大类:

  1. 传统方法(序列相似性、频繁模式挖掘和序列模式挖掘),

  2. 因子分解和潜在表示方法(矩阵分解和马尔可夫模型),

  3. 基于神经网络的方法(深度神经网络,高级模型),并详细介绍了其理论方面的细节、解决问题的潜力和局限性。后续章节将回顾在序列推荐系统中用于学习物品之间的序列关系以进行下一个物品推荐的相关方法。

Sequence Similarity Based 基于序列相似性

这些方法的目标是通过基于相似度度量计算相似度来发现项目或序列之间的关系,然后利用与目标用户序列相似的序列来推荐下一个项目。这些关系反映了事件(例如,点击或购买)对其前一个事件的顺序依赖性。顺序依赖关系的粒度可以在项目级别(单个项目)或序列级别(包含多个项目集,其中每个项目集可以是单个项目或项目集合)。

Frequent Pattern Mining 频繁模式挖掘

频繁模式挖掘的目标是找到事务数据库中频繁出现的项目之间的关系(模式),然后利用挖掘的模式指导后续的下一个项目建议。

首先引入关联规则[21]来发现超市数据中商品之间的关系。考虑一个客户购买的事务数据库,T = {T1, T2,…, Tm},包含m个事务,这些事务定义在项目i上。

每个事务Ti是i中项目的一个子集。为了找到项目之间的这些关系,使用了两个度量,支持度和置信度。项的支持度是对该项在事务数据库中出现的频率(出现次数)的度量。最小支持阈值用于确定项目是否频繁。如果一个项目的支持度大于或等于最小支持度,那么它就被称为频繁项目。这些频繁项目或频繁模式可以用于提供有关客户购买行为的有价值的见解。

例如,考虑表1中客户购买的数据。行对应客户,列对应项目。“15”指的是某一位顾客购买了某件商品的情况。这些被划分为两组密切相关的项目。其中一组是{苹果,橘子,香蕉},另一组是{面包,黄油,牛奶}。这些是仅有的至少包含三个项目的项目集,它们也至少支持0.2。因此,这两个项目集都是频繁项目集或频繁模式。

找到这种高支持的模式对商家很有用,因为他可以使用它们来提出建议和其他有针对性的营销决策。例如,可以得出结论,用户2最终可能会购买面包,因为他已经购买了{黄油,牛奶}。同样,用户5也可能购买橙子,因为他已经购买了{苹果,香蕉}。从顺序推荐系统的角度来看,这样的推断是非常有用的。使用关联规则和置信度的概念,可以根据这些相关性的方向获得另一种见解。关联规则以X→Y的形式表示,它表示项目X和Y之间的相关性。例如,{黄油,牛奶}→{面包}这样的规则对于向User2推荐面包非常有用,因为它已经知道他购买了牛奶和黄油。这种规则的力量是由它的信心来衡量的。

规则X→Y的置信度是“假设T中的交易也包含X,它包含Y的条件概率”。信心值越高,总是表明规则的强度越大。关联规则是在最小支持度s和最小置信度c的基础上定义的。频繁模式挖掘和关联规则挖掘中最早的工作之一是Apriori算法[21]。给定一个事务数据库和最小支持阈值,该算法挖掘事务数据库以查找关联规则的频繁项集。该算法基于两个重要步骤,即(a)连接和(b)修剪。下面是使用Apriori算法生成候选项的步骤[21]。

结尾

今天的论文就先读到这了,明天见朋友们!2024-02-06 10:04:21 星期二

标签:commerce,Product,顺序,项目,Taxonomy,推荐,系统,用户,序列
From: https://www.cnblogs.com/wephilos/p/18119913

相关文章

  • 读论文-基于序列模式的电子商务推荐系统综述(A Survey of Sequential Pattern Based E
    前言今天读的论文为一篇于2023年10月3日发表在《算法》(Algorithms)的论文,这篇文章综述了基于序列模式的电子商务推荐系统,强调了通过整合用户购买和点击行为的序列模式来提高推荐准确性、减少数据稀疏性、增加推荐新颖性,并改善推荐系统的可扩展性。文章详细分析了现有推荐系统的......
  • vue2.x版本中productionTip=false设置无效
    引用自:https://www.cnblogs.com/javaxubo/p/17397457.html  首先,我们看到vue官网中关于productionTip的API使用:但是,我在本地中使用却无效,代码如下:<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metahttp-equiv="X-UA-Compatibl......
  • 论文阅读:A new approach solve the multi-product multi-period inventory lot sizing
    论文:Anewapproachsolvethemulti-productmulti-periodinventorylotsizingwithsupplierselectionproblem期刊:Computer&OperationsResearch1.模型建立:具有供应商选择问题的多产品多周期库存批量确定1.1问题定义将具有供应商选择问题的多产品多周期库存批......
  • SQL95 从 Products 表中检索所有的产品名称以及对应的销售总数(sum() ,group by..)
    selectprod_name,sum(quantity)asquant_soldfromProductsPinnerjoinOrderItemsOIonP.prod_id=OI.prod_idgroupbyprod_name;......
  • 解决:NuxtJS项目 ,刷新localhost:3000/product/details/111页面的时候useFetch不工作!
    背景在nuxt项目中,点击产品列表跳转到详情页是正常的,路径为:localhost:3000/product/device?id=111但是对着浏览器刷新之后,发现不在执行请求了。要解决问题:刷新浏览器之后正常展示产品内容。   目录层级|pages|product|device.vue|......
  • Atcoder ABC245H Product Modulo 2
    发现这个\(m\)很大,且这个式子是\(\times\)。一个想法是拆成\(m=\prod{p_i}^{e_i}(p_i\in\mathbb{P})\)然后对于\(M=p_i^{e_i}\)依次考虑\(b_i=a_i\bmodM\)和\(N=n\bmodM\)。根据\(\text{CRT}\),对于任意一个\(M\)得到的不同的\(b_i\)对于最后的\(a_i......
  • P10189 [USACO24FEB] Maximizing Productivity B 题解
    先说说暴力做法:每次遍历一遍,看看是否满足\(t_i+s\lec_i\),满足就计数,不满足就挂。单次时间复杂度显然为\(O(N)\),总得时间复杂度约为\(O(NQ)\),TLE是肯定的~暴力代码//Problem:Problem3.MaximizingProductivity//Contest:USACO-USACO2024FebruaryContest,......
  • Large Scale Product Graph Construction for Recommendation in E-commerce论文阅读
    Abstract​ 大规模的推荐系统通常严重依赖于预先构建的产品索引来加速推荐服务,从而使等待时间较长。一个重要的索引结构是产品-产品索引,在这里可以检索给定种子产品的排名产品列表。该指数可以看作是一个加权的产品-产品图。​ 在本文中,我们提出了一种能够有效地构建这类索引产......
  • 读论文-基于序列模式的电子商务推荐系统综述(A Survey of Sequential Pattern Based E
    前言今天读的论文为一篇于2023年10月3日发表在《算法》(Algorithms)的论文,这篇文章综述了基于序列模式的电子商务推荐系统,强调了通过整合用户购买和点击行为的序列模式来提高推荐准确性、减少数据稀疏性、增加推荐新颖性,并改善推荐系统的可扩展性。文章详细分析了现有推荐系统的......
  • CF1872G Replace With Product
    刚看到这道题的时候就第一感觉应该是乘积比加和更优。发现如果序列中所有数的乘积比\(2\times10^{14}\)更大,在区间左右端点不为\(1\)时,全乘起来一定更优。若左右端点为\(1\),则找到两端的第一个非\(1\)位置即为答案。否则,发现\(2^{49}>2\times10^{14}\),则区间内非\(1\)......