BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer

时间：2023-02-11 15:45:30浏览次数：56

标签：Transformer bm BERT4Rec token Sequential mathcal Encoder

概
基本框架
代码

Sun F., Liu J., Wu J., Pei C., Lin X., Ou W. and Jiang P. BERT4Rec: Sequential recommendation with bidirectional encoder representations from transformer. In International Conference on Information and Knowledge Management (CIKM), 2019.

概

BERT 用在序列推荐之上. 其实, 从序列角度, 之前 NLP 用过的 RNN, Transformer 似乎都可以套用在序列推荐之上, 但是总有一种感觉, 它们的效果并不是那么好 (真的是纯纯的主观感觉).

基本框架

给定用户 \(u\) 的过去的历史纪录 \(\mathcal{S}_u = [v_1, \cdots, v_t, \cdots, v_n]\), 将其中的部分替换成 [mask] token, 训练的目标就是用左右的信息来预测中间的 mask;
通过 embedding layer 获得各 token 的 embedding, 需要注意的是, 虽然这里也加入了 positional 信息, 但是不是通过固定的 sinusoid embeddings 得到, 而是直接学习的, 所以这里会有一个问题, 就是输入的序列长度是受到限制的;
通过一系列的 attention 得到每个 token 的表征;
再通过两层的变换得到最后的输出:

\[P(v) = \text{softmax}(\text{GELU}(\bm{h}_t^L \bm{W}^P + \bm{b}^P)\bm{E}^T + \bm{b}^O); \]
通过如下的损失进行训练:

\[\mathcal{L} = \frac{1}{|\mathcal{S}_u^m|} \sum_{v_m \in \mathcal{S}_u^m} -\log P(v_m = v_m^*| \mathcal{S}_u'). \]

代码

BERT4Rec

BERT4Rec-VAE-Pytorch

标签：Transformer,bm,BERT4Rec,token,Sequential,mathcal,Encoder
From： https://www.cnblogs.com/MTandHJ/p/17111798.html

《Towards Cooperation in Sequential Prisoner’s Dilemmas: a Deep Multiagent Rein
致力于序贯囚徒困境中的合作：一种多智能体深度强化学习的方法总结主要是针对复杂的序贯囚徒困境的合作提出的方法，目的是为了提高合作程度最终达到提高社会总收益的。该方......
kettle 报错 org.owasp.encoder
在生成xml时候需要对密码加密处理也可以注释StringtransXml=transMeta.getXML();maven<dependency><groupId>org.owasp.esapi</groupId>......
了解 Transformers 是如何“思考”的
Transformer模型是AI系统的基础。已经有了数不清的关于"Transformer如何工作"的核心结构图表。但是这些图表没有提供任何直观的计算该模型的框架表示。当研究者对......
springboot3 security 从始至终--02 PasswordEncoder
接下来几个章节，将逐个介绍身份验证流程中主要接口接口描述UserDetails代表SpringSecurity所看到的用户GrantedAuthority定义应用程序目的范围内允许用户执......
DyTox Transformers for Continual Learning with DYnamic TOken eXpansion----阅读笔
摘要：深度网络架构努力不断学习新任务而不忘记以前的任务。最近的一个趋势表明，基于参数扩展的动态体系结构可以在持续学习中有效地减少灾难性遗忘。然而，现有的方法存在一些......
Hugging News #0203: 3.3 MB 的文生图模型、RHLF 训练框架、手机上能跑的 Transformer
每一周，我们的同事都会向社区的成员们发布一些关于HuggingFace相关的更新，包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等，我们将其称之为......
[spring security]错误使用spring security内置加密工具BCryptPasswordEncoder引发的
参考博文实战代码（十）：SpringbootRestTemplate连接池记一次使用BCryptPasswordEncoder，设置了不合理参数导致耗时严重的坑高安全加密BCrypt及其性能缺陷背景项目上线前......
从attention到transformer
从attention到transformer总体看transformer首先说明的是NLP中一类做向量集到向量集任务的模型统称为seq2seqtransformer的结构分为encoder和decoder：encoder通过enc......
Continual Learning with Lifelong Vision Transformer----阅读笔记
ContinualLearningwithLifelongVisionTransformer----阅读笔记摘要：在本文中，我们提出了一种新的基于注意力的框架LifelongVisionTransformer（LVT），以实现更好的稳定......
transformer 的发展历史
最近看了很多关于transformer的教程，做一个阶段性的总结。也是写博客的试水文章啦~今天也要加油呀！参考资料：b站up去钓鱼的程序猿的课程：https://www.bilibili.com/video/B......

BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer

概

基本框架

代码

相关文章

赞助商

阅读排行