首页 > 其他分享 >快手长短期序列建模论文CLSR

快手长短期序列建模论文CLSR

时间:2024-01-22 20:33:06浏览次数:32  
标签:长期 CLSR 快手 长短期 用户 建模 短期 兴趣

背景

用户是否点击一个物品可能受长期兴趣和短期行为的影响,用户的长期兴趣一般比较稳定,短期兴趣会不断变化。现有的工作中对长期兴趣和短期兴趣的建模师混合在一起的,这片论文提出了一种对长期兴趣和短期兴趣分开建模的方法。

 

方法

用户兴趣建模

U:用户属性,包含了用户ID和行为序列

Ul:用户的长期兴趣表示

Us(t):用户在t时刻的短期兴趣表示

V(t-1):t-1时刻交互的item

Y(t):融合用户的长短期兴趣,表示t时刻用户是否会和V(t)发生交互

 

  • 长期兴趣:长期兴趣相对稳定,因此这里是从整个序列中提取。
  • 短期兴趣:随着用户不断与推荐商品进行交互,短期兴趣会不断变化。例如,用户可能会在点击某个商品后建立新的兴趣。同时,用户也可能逐渐失去某些兴趣。也就是说,短期利益是时间相关的变量,因此利用前一时刻的兴趣来建模当前时刻的兴趣。
  • 交互预测:利用长短期兴趣和交互数据进行预测。

下面详述具体的建模过程

为长短期兴趣生成查询向量

得到长短期新闻的query表示之后,分别对长短期兴趣进行编码,得到长短期兴趣的表示:

 

长期兴趣编码

长期兴趣编码就是一个self-attention结构,公式如下,其中W为可学习参数,τ表示多层MLP,||表示拼接,E(x)表示商品的embedding

 

短期兴趣编码

利用循环神经网络捕获短期兴趣,其中W为可学习参数,ρ表示循环神经网络模型,例如LSTM,GRU等

利用长期兴趣中计算注意力系数的方式可以同样利用现有的v可以求得短期兴趣的注意力系数b。加权求和后得到短期兴趣embedding,如下:

 

自监督解耦长短期兴趣

上面提到了使用两个编码器来分别建模用户的长短期兴趣,但是对于用户的长短期兴趣,我们是无法获得显式label的,那么如何训练呢?

论文采用了用户整个交互历史的平均表征作为长期兴趣的代理(label),并使用最近 次交互的平均表征作为短期兴趣的代理:

有了label之后,我就训练用户的长期兴趣和短期兴趣表示,具体的,我们希望:

以长期兴趣为例,长期兴趣保证和长期兴趣代理表征的相似度要大于长期兴趣和短期兴趣的表征,并且大于短期兴趣和长期兴趣代理之间的相似度

论文中采用BPR损失或Triplet loss来对上述的约束关系构建损失函数,公式如下:

损失函数就是把四个损失函数相加,如下,其中f()表示上诉两种损失函数之一:

 长短期兴趣融合

有了长短期兴趣表示后,我们需要融合用户的长短期兴趣预测用户下一刻的兴趣。简单的聚合器,如sum和concatation,假设长短期兴趣的贡献是固定的,这在许多情况下是无效的。事实上,长期还是短期更重要取决于历史顺序。例如,当用户持续浏览同一类别的物品时,他们主要是受短期兴趣的驱动。同时,长期利益的重要性也取决于target。例如,一个运动爱好者可能仍然会因为长期的兴趣点开一个推荐的自行车,即使他/她已经浏览了几本书。因此,我们将历史序列和目标项都作为聚合器的输入,其中历史序列使用GRU进行压缩。

最后再经过两层MLP进行预测:

 

标签:长期,CLSR,快手,长短期,用户,建模,短期,兴趣
From: https://www.cnblogs.com/xumaomao/p/17981010

相关文章

  • Python采集快手直播间并做热门预测
    最近那个直播比较火?哪种类型直播间受欢迎?今天我将用我们所学的爬虫知识,通过技术手段抓取热门直播间并做预测,轻松帮公司做大数据分析,红包拿的手软,啊~真香!以下是用Python编写的快手直播间采集爬虫程序。注意,这只是一个基本的示例,实际的程序需要根据具体的采集需求进行修改和优化。im......
  • matlab使用长短期记忆(LSTM)神经网络对序列数据进行分类|附代码数据
    全文下载链接:http://tecdat.cn/?p=19751本示例说明如何使用长短期记忆(LSTM)网络对序列数据进行分类。最近我们被客户要求撰写关于LSTM的研究报告,包括一些图形和统计输出。要训练深度神经网络对序列数据进行分类,可以使用LSTM网络。LSTM网络使您可以将序列数据输入网络,并根据序列......
  • 快手无人直播防封软件——《小星星去重播放器》实时修改视频,最大程度去避免违规!
     做快手无人直播的朋友们,你是否还在靠剪辑拼接来达到视频去重的效果呢?是否也对平台的封禁处罚束手无策,万分苦恼?来看看这款专为无人直播而生的《小星星去重播放器》。只需要简单几个设置就能对视频进行全面去重,还不影响视频效果,让你的快手无人直播无需剪辑拼接,永远快人一步!如果你......
  • 【专题】2023快手母婴行业数据报告PDF合集分享(附原数据表)
    原文链接:https://tecdat.cn/?p=33866原文出处:拓端数据部落公众号品牌一直在思考如何更好地了解消费者的需求,特别是在年轻化和线上消费趋势加强的母婴行业。根据《2023母婴行业数据报告合集》,短视频直播平台成为该行业新的增长点。报告合集显示,母婴商品的消费人数在2022年全年和2......
  • 用Python写的一个采集快手直播间的程序
    今天给大家分享的是一个用python写的一个采集快手直播间的程序,内容非常简单,并且每个代码都有详细的中文解释,让我们一起来学习一下吧。```pythonimportrequestsfrombs4importBeautifulSoup#设置代理信息proxy_host="https://www.duoip.cn/get_proxy"proxy_port=8000......
  • 【专题】2023快手母婴行业数据报告PDF合集分享(附原数据表)
    原文链接:https://tecdat.cn/?p=33866原文出处:拓端数据部落公众号品牌一直在思考如何更好地了解消费者的需求,特别是在年轻化和线上消费趋势加强的母婴行业。根据《2023母婴行业数据报告合集》,短视频直播平台成为该行业新的增长点。报告合集显示,母婴商品的消费人数在2022年全年和2......
  • 快手原始ID转二维码工具,3m开头UID,一键转二维码跳转APP
    之前客户定制过一个工具,就是它从直播间或者评论区提取的ID都是3m开头的,这个不是快手id,类似于微信的原始ID,通过这个ID我们在快手客户端是搜不到的,但是通过浏览器能访问对方主页,比如”3xe9azfmv3396qq“这种形式的,我就开发了一个转二维码工具,就是把这个原始ID转换成二维码,然后通过扫......
  • 快手视频作品评论区提取工具,可采集UID,真实ID,评论内容开源版!基础代码
    之前给客户定制了一个提取视频评论区用户数据的功能,这个就是POST抓包解密形式的,所以都是公开的的,网页端提取,输入视频链接导入COOKIE【浏览器F12可提取COOKIE】就能自动提取作品下的所有评论内容用户di等信息,我这边直接把所有源码都分享出来。设计界面:  COOKIE输入:【浏览器F......
  • 快手视频评论区提取工具,抓取评论内容UID用户信息,采集精准关键词,开源版!
    快手评论区里面其实有很多精准的关键词用户,我们可以提取这些关键词用户来实现企业的营销和提取,那么今天我就给大家推荐这么一个软件源码,易语言开发的,用的鱼刺_http模块,和gzip.dll,提取的时候需要用到COOKIE,这个在浏览器开f12刷新,然后选择快手主页,抓包复制cookie就可以了。软件截图......
  • 快手视频评论区用户ID提取工具,可采集UID快手号,评论内容时间,易语言开源版!
    这是之前给某个客户开发的,定制的,可以输入用户的作品连接,然后导入COOKIE后就会自动提取评论区下载的所有用户评论内容用户di,快手号这些信息,用的是鱼刺_http模块,和“gzip.dll”组件,具体源码和界面我下面会开源出来,仅供大家学习。软件界面: 采集效果: 源码分享:==============......