首页 > 其他分享 >七月在线公开课笔记-二十一-

七月在线公开课笔记-二十一-

时间:2024-10-23 18:37:02浏览次数:1  
标签:这个 一个 二十一 笔记 公开课 然后 一些 我们 就是

七月在线公开课笔记(二十一)

人工智能—推荐系统公开课(七月在线出品) - P16:快速入门推荐系统串讲 - 七月在线-julyedu - BV1Ry4y127CV

今天跟大家分享的是深入浅出推荐系统啊,然后我们会围绕着推荐系统,它的核心内容呃,想召回排序重排,这些核心模块进行展开介绍,那首先做下自我介绍。

我是7月在线推荐系统老师啊,ok。

推荐系统呢现在其实呃随着互联网发展,数据也越来越多,那我们如何去找到,或者说如何去推荐合适的一些,不管是商品音乐视频啊,我们平时刷的一些短视频呀,对我们看的一些文章对啊,那是海量的数据里面。

那如何快速去找到诶用户所感兴趣的,那这是一个非常具有挑战性的一个工作,那而且很多公司对吧,他们也是以这种推荐系统对吧,个性化推荐啊,来作为一个,也是一个比较高收入的一部分啊,因为这里面会涉及到一些呃。

如果说你给用户推,荐商品对吧,他的一个并不符合用户的预期,或他的一个兴趣,那你在相同的流量下对吧,你的整体的转化就变得非常低,那这样的话,我们的收入肯定会有所降低的嘛,那如果像一些广告对吧。

那广告也是一样的,广告主在平台里面去投放广告啊,这种广告的话它可以实现商品广告啊,也可以是一些app的一些广告,那这种话它是以用户的点击,或者说用户去点击或下载来去进行计费的,对啊。

同样的也是去找到用户的兴趣,推荐合适的广告,来去促使发生这样的一些交互啊。

那我们来去看一下推荐系统,它的一个结构啊,这里的话我们是以电商推荐,我们是以电商推荐系统啊,来作为我们的一个介绍的一个内容啊,因为我们经常会去像逛淘宝呀,逛京东,逛拼多多,那首先呢是用户行为日志。

就是说在我们平台里面啊,它所浏览的一些商品,点击商品购买的一些商品啊,那这就是我们的日志数据,那核心呢我们从日志数据里面来,去提取到用户的兴趣啊,比较简单,或者说直观的说就是说他最近对吧。

可能突然间将某个衣服啊,加入到他的购物车里面了,这种架构行为是非常强的,我们可以去思考一下,我们一般对吧去购买商品,那我们,可能不会直接去购买,而是先加入购物车,加购物车的话。

他最后的一个下单的概率可能是比较高的,那那也说明他对这个商品对吧,比较感兴趣,他也可能就是说先加入购物车,然后再去对比多家的啊,多个店铺的商品啊,那这时候的话,我们就可以根据这样的一个行为来去推荐。

和购物车里面比较相似的一些商品,让用户有更多的一个选择,或者说诶用户它加入购加入购物车之后,它还没有发生转化,那这时候的话也许用户它有一些犹豫,那这时候我们可以给用户推荐一些优惠券,不。

管是推荐商品也好,推荐优惠券也好,都是为了能够快速的来去,而使用户对或者促进用户去发生转化,当然呃可能很多用户他还没有加入购物车,他可能只是浏览了些商品,购买了一些商品啊,这种的话都可以从里面。

能够挖掘出用户的兴趣啊,他最近看到的商品比较多,或者说最近他去购买了一些商品,这些我们都可以考虑过滤掉,那有这样的一些数据,或者说有这样的思路之后呢,我们就开始利用推荐系统技术,帮助我们去解决问题啊。

那我们的商品池里面,可能有上千万或者上亿,个商品,那这个时候呢,那我们可能要去进行像呃,从这里面去筛选出几百个或几千个,这个所要求的一个基础点,就是说你的一个整体的效率,当然准确度也是一个对啊。

就是在比较准的情况下,尽量将用户感兴趣的商品全部筛选出来,那这就是一个召回的工作了,对我们尽量将用户可能感兴趣的全部找到,这是第一步啊,就是一个快速从大的物料池里面,商品池里面去做快速的一个筛选啊。

这第一步啊,这一步,其实我们可以借助一些专家的一些策略,那也可以去借助一些啊模型来去,解决,接下来的话,我们为了想更加准确的给用户做出推荐,那我们到了排序和重排阶段,那排序阶段的话。

就是我们的召回商品已经变得比较少了,可能就几百个,为了更加准确啊,那我们可以让我的模型变得更加复杂,或者说去增加很多的一些特征,这样的话会使得我们最终的一个准确率,得到提升。

或者说我们将用户出感兴趣商品,然后展现给用户,那rank的话是其实最前面,工作做了一个,我觉得做一个完善,做一个补充啊,因为很多的一些商品,它可能诶可能他比较感兴趣,但他之前也购已经购买过了对啊。

当然有的商品它可能是那种快销品啊,这种不影响对啊,可能短短时间内它可能会重复购买,但是有些商品的话它并不属于快消品啊,比如说像京东里面的一些3c家电对吧,你买完之后,你可能在等上很久啊,几年啊。

你才会再再去购买,那这时候他如果发生购买,发生转化之后呢,那我们要对这些商品给过滤掉,避免重复的推荐啊,这样的话啊,就会有所变差,同样呢我们要用户兴趣可能是单一的对啊,但是我们的推荐系统呢不能是单一的。

我们尽量要去挖掘用户它更多的潜在兴趣,用户可能近期有个短期兴趣,也可能有个长期兴趣啊,那我们今天的话,让我们推荐商品具有多样化,这也是我们再去体验一首,比如说我们平时去刷抖音对吧。

那可能你比你对那种美食商品,美食的一些短视频比较感兴趣,但是如果说系统一直给你推,一直给你推啊,也不替换一些其他的一些短视频内容,那你其实已经会变得非常的暴躁,其实哈,啊这也是很多的一些平台。

它是比较欠缺的,就是去挖掘用户潜在的兴趣啊,而不能完全依赖于用户的兴趣,而去推荐他兴趣类的一些拍视频呀,或者说一些商品啊,不管是哪种啊,哪种平台,我们都需要考虑这个问题,最后呢我们去筛选出合适的商品。

展给到用户啊,就是展示给用户,那我们有很多的一些广告位,或者说推荐位对吧,那就把这些商品展示到上面就可以了,这就是召回排序推荐,那整体的一个流程,从我们的行为日志到利用技术,最后推荐合适商品。

刚才我们已经讲过了,对,就是说推荐系统两个阶段,一个是召回,一个是排序,让大家再去想一下,对刚才我也提到了,召回是干什么的,排序又是干什么的,召回呢,我们处理大的数据,大的数据啊,我们可能百万千万对吧。

当然有的平台他可能后续机比较少,比如说a p p推荐,比如说像一些小说推荐啊,音乐推荐啊,那这时候的话,我们其实哎可以把召回可以做的,就像一个出牌一样啊,那同样呢用户他要去浏览我们的商品对吧。

那我们要快速给用户展示出来这样的结果,所以说你不管是召回还排序速度一定要快,一般都是在呃多少毫秒之内吧,我们就要去反馈到具体的一个商品,结果的召回阶段,你想快,那就模型不能太复杂,使用比较少少的特征。

排序阶段呢我们处理的数据量变少了,那这时候我们想要我们的准确性的提高,那我们就要模型变得复杂,而我们如果大家了解过排序模型对吧啊,那从最开始的l r到后面慢慢的复杂dn。

那更复杂的加入transformer,加入bot来去解决啊,那就是模型上面不断的进行优化,慢慢慢的变得非常的复杂,ok这是召回和排序两个部分。

接下来我们再去深入的去了解召回,对啊,缩小搜索范围,这样的一个啊,从几百万到几百个对啊,另外一个比较重要的是通过局部拟合整体,虽然我们缩小了范围啊,可能只是几十个几百个商品。

涵盖更多用户或者用户可能感兴趣的内容,这里面,其实召回能做的事情是非常非常多的,你其实有时候很难去考虑到,或很难去预测到用户他所购买的一些商品,这个怎么理解,呢用户他的行为比较少,力和行为比较少。

那数据一少的时候,我们就很难去挖掘到他的兴趣,还有一些用户呢他可能漫无目的啊,只是去逛一些对啊,那这时候的话,我们可能去考虑一些,最近比较热门的一些东西对吧,那有的用户他可能是爱跟兴趣结合,比较密切。

那这就要考虑从这方面进行进行,解决问题了,所以说我们需要从不同角度去进行召回啊,这也是很多的公司里面对吧,召回阶段可能有十几路召回,最后进行整合的,那每一路召回的话可能就是召回几十个啊,然后最后整合。

完之后到几百个,然后再去推到啊,排序阶段就像是盲人摸象一样对吧,那可能我摸到的是象鼻子,那另外一个人他可能摸到的是上推,那我们要尽量的去将这些每一个部位对吧,全部能够去你和它像的完整的一个部分。

评估阶段也是我们需要去考虑的对啊,除了cctr c ctr是什么呢,就是对应的一个嗯它的一个点击率啊,点击率预估啊,有c t r c vr对吧,cvr是转化率预估,那除了这种点击率和转化率。

我们去考虑一个问题的时候,大家再去思考一下,如果说我们再去看还是短视频啊,啊那或者说我们经常可能在群里面对吧,唉长辈给我们发来了一个视频,那我们点进去之后诶,可能因为他这个标题吸引了我们。

我们点进之后诶,它本身那个点击率是不变比较高了,但,是呢里面内容是完全没有关系的,可能我们点进去之后立马就退出来了,因为我看和标题完全没有关系啊,所以这个要考虑就是什么呢,点击率以及对应的一个停留时长。

对啊,这是在像类似于像文章呀这种啊,像视频啊这些对吧,这种这种这种类似于这种,非得流量的一个场景里面,我们需要去考虑的问题啊,不仅要考虑它的点击率,当然还有更多的,如果说我们的平台对吧。

像微信的视频号对吧,它里面会带有很多的一些社交属性,那我们除了考虑它的点击率啊,停留时长,那我们还会,考虑它是否会转转发,是否会进行关注啊,这也是像短视频它变得比较复杂的,可能考虑像多任务的建模啊。

然后结合这几个它点击关注转发哎,收藏啊,这些对应的都是一些二分类问题对吧,将这些对应的分数我们整合起来进行优化,这就变得比较复杂了,除此之外呢,还有像覆盖度啊,你能覆盖尽量覆盖到整体对交互体验。

运行运行策略,那我们离线评估呢,还是用lost或者人工评估它的准确度,开度线上a b test的话,那我们就要看他的ctrl c v r,或者人均的一个阅读,或者说是jj mv啊。

我,们的一个整体的一个收益情况,ok下面是一个比较经典的协同过滤,协同过滤的话是使用user和item的一个相似性,来进行推荐啊,比如如果用户a与用户b比较相似,然后并且呢用户也喜欢视频,一则系统呢。

我们可以向用户a推荐视频一样,那我们就可以去,这其实也可以理解成什么呢,像物以类聚,人以群分这一个意思啊,那你们两个走的比较近,那你们很肯定有很多的一些共同的喜好,对啊,比如说都喜欢去看电影啊。

都喜欢去旅行啊,那我知道了a它的一个喜好之后,那我们也可以去推测b的一个喜好,那这就是协同过滤啊,这里的话我们可以对我们这个矩阵对吧,哎小美这三个三个小朋友啊,小美小丽小红啊。

他们对应不同的一些化妆品的一些打分,当然有些是缺失的,这样的话我们可以构建出一个对应的向量,对吧,像小米的话是4005100啊,那有了销量之后呢,我们就可以计算两两用户之间的一个这块。

用的是余弦相似度的一个计算对啊,那小美小丽呢是0。38,小美小红的是0。32,这里的话我们想要看它对于某个化妆品的,一个喜好对吧,那我们发现其实这里面我们用零,有一些缺失的,比如说小米对吧。

它对这个这个是粉底啊,假睫毛对吧,这块是缺失的,用零来进行填充,这其实用零填充有点有点武断了对啊,我没有接触过,或者说我没有看过这个商品,没有看过这个视频啊,就不代表我不喜欢他,所以说你用零填充。

直接反映出用户不喜欢它,这样是不合适的啊,所以说我们可以考虑用一个均值,或者说用一些其他的一些手段,拿去进行填充啊,也是可以。

ok呃关于协同过滤的划分成两种啊,一种是基于用户的协同过滤啊,就是usc f它是有更强的社交属性的,那我们得到了就是说用户的一个相似之后,对啊,比如相似用户喜欢什么,那我们就推荐什么啊。

这种话他想发现热点,追踪热点趋势,虽然推荐是比较合适的,那第二个话是基于商品的协同过滤,就是item cf,用户兴趣变化的话是比较稳定的啊,就比如电商场景里面对吧,商品的性质它是很。

它可能变化并没有用户的性质变化更快,怎么理解呢,用户它是你购买完一个商品之后,你可能之后不会再去购买这个商品的,你的兴趣不断的发生变化,但是商品它的本质也好,或者说一些表现形式也好,就很难发生变化啊。

除非或者说他可能会当然也会变化对吧,只是相对来说更稳定一些啊,嗯会变化是因为什么呢,因为这种时间的一个衰减,对时间的一些因素的影响啊,比如说最近啊哪个手机对吧,新款的手机对吧,然后刚刚一上市对啊。

他就比较热门对啊,就他就是一个非常热门的商品的,但是过了12年之后或者半年,之后几个月之后他就没有那么热门了,可能被另外一个热门商品给替换掉了,但不管怎么样,他本身商品的性质是规范生变化的对啊。

这也是比用户的一个稳定之处啊,这个item cf嗯,一般两者的话,我们再去做召回的时候都会去用到的,对啊,不管你是电商推荐还是用推荐,因为这两者之前我们其实做过实验,这两者他们得到的结果对吧。

他们之间的一个重合度并没有那么高啊。

所以说我们可以都去使用的,下面的话是关联召回,他也是属于协同过滤的一种啊,那我们来去看看他怎么去,做的啊,嗯如果说我们要去找到用户,未来可能交互商品,那我们就可以挖掘商品的关联关系啊。

根据用户历史交互商品,找到这些商品的一个关联品啊,这个其实就呃比如说我们去超市里面对吧,那超市里面的话,他们再去做一些呃一些像一些物品的,或者说货品的一些摆放手对吧,他们会考虑这两者可能有一个强关系。

对你买买了商品a你就可能去买商品b啊,这类似于比较经典的一个问题啊,经典的一个呃数据分析问题就是啤酒尿布,对吧啊,那很多男人对吧,他们去买尿布说对,吧或者买啤酒的时候,他们实在会把尿布买。

那这两个就是有比较强的关系了,又或者说像手机和手机壳对吧,我们买了手机之后就大概率会买手机壳,那这就是这就是一个a到b的一个关系了,但是b到a的话就会变得比较弱,我们很少先买手机壳啊。

因为一个手机壳我们再去买一个手机,这种是不是概率是非常非常小的,对当然也是有的啊,这个话我们可以根据我们的一个历史行为,在日志里面来去做统计啊,是a到b的更多一些,还是b到a的更多一些。

这样的话其实就已经给,就是关联分数,这种分数的话,我们如果说用户他买完a之后对吧,那我们就可以将b推荐给他。

我们看下面,当然我们可以考虑一些更细的,比如说小冯对吧,他买了一些商品啊,呃一些牛奶啊,饼干啊这些饮料对吧,这里面的话它有一个正向和逆向,就是我们刚才说的从a到b,从b到a,正向的话。

就是其实我们按时间从远到近对吧,那远到近,那其实就是一个正向的关系,从近到远就是一个逆向的关系,这个画的话我们可以加上一个乘法项,正向的话它的,分数乘以一个一,那逆向的话我们乘以一个0。7啊。

这是只是一拍脑袋这样的一个设定,那是不是就是说明,正向他的一个分数更高一些啊,这是第一个第二个距离或者说时间啊,我买完商品为a之后对吧,我过了五六天才买商品b,那我买了商品a之后,过了一两天买商品c。

那这两个距离就是一个是二,一个是可能是五对吧,那是不是越近的,它的相关性更高一些,大家可以想一想,对啊,你近期去看的东西,他们之间相关因素比较高,再对比你去年啊,或者说几个月前看东西啊,是不是。

差异性就没有那么的就变得比较大了,这时候的话我们可以我们下面有公式对吧,距离哎也是一个作为我们的一个系数对啊,来去调节,最后去得到对应的两个商品的一个分数啊,得到分数之后呢,他最近买这些商品。

那每个商品它都有一些关联商品的,关于商品它的对应关联分数,就刚才我们这个公式打分得到的结果,那我们可以将这些分数进行一个排序,或者排在第一个位置啊,这就是关联召回它的一个流程,大家可以再去诶思考思考对。

看看能不能这块能不能这块能不能看懂,对啊。

ok那我们继续,下面刚才我们讲的是,像类似于协同过滤的那种方式对吧,那接下来的话我们再去看一下,基于向量的召回,下令召回的话也是一个比较经典的队,我们就是说将用户或商品转换成向量,有了向量之后。

那比如说我们看这个框架对吧,这框架划分成两个部分呃,第一个部分的话是离线部分,离线啊,离线的话,我们对应的是一个可以理解成,简单的一个dna的一个模型,那我们输入是有两个部分,一个是用户特征啊。

一个是物品特征,然后输到模型里面,我们可以去得到用户的in bedding,这in bean就是它隐藏层的输出结果了,以及物品的100点,我们可以将其存储起来啊,但这里有个问题。

用户的in bing对吧,它的兴趣会不断地发生变化的啊,所以这里面我们一般都是先去存储物品的,embedding,然后线上的时候呢,我们再去生成用户的embedding,然,后到我们的数据库里面对吧。

快速的来去进行查找与他相似度高的物品,这里面的话是用了一个方法啊,就是一个fast,就是一个呃facebook的一个呃,一个a n n的一个方式,就是呃近似最近零,就是进行一个快速查找的对吧。

快速搜索的一个算法啊,不然的话我们商品,而千万两具商品,你每个都去计算它的余弦相似性啊,那可是会非常费时间的,可能原本你需要三小时,但是你用这个fast之后对吧,它就缩短到了十几20分钟了。

还有的话像比较经典的有土地,嗯2018年的时候啊,是发表了一篇论文,分为排序,分为召回和排序两个部分啊,它的模式就跟刚才是一样的对啊,当然这里面并没有去,并没有去分成两个部分啊,两个什么部分。

一个用户特征,一个是那种商品特征那种双塔形式啊,他在提取用户隐bedding和商品引白灵,是分成两个部分啊,用户in bedding呢,是在最后一层的隐藏层去提取的,那商品的in bin的话。

是在soft max部分来去进行提取的啊,同样的也是经过那种a n n的方式来去,进行快速查找,啊我们先去保存商品的in bin,然后线上的时候来得到用户隐白点,然后快速去搜索,然后推荐给用户啊。

ok下面的话是一个典型的一个状态啊,d s m m d s s m啊,分成两个部分啊,最开始他是在那种信息检索的时候啊,会去用到的啊,一边是我们,比如说我们去做百度的搜索对吧,我们输入query啊。

然后他会去计算和很多的doo啊,抬头呀,去计算它们之间的相似性啊,将高相似的推荐给用户啊,但现在的话他也会用到这种电商啊,音乐中推荐里面也会去使用的啊,我们分成了两路啊,一个是我们的。

比如query的话是作为用户特征啊,darkle,wavector的话是作为我们商品的一个特征了,然后经过对应的表示层之后,来去得到对应的q和d,然后计算你可以计算它们的点击。

也可以计算两者的一个相似性,然后再去,输入到最后的soft max,得到最终的结果就是d s s m,它整体的一个结构啊。

那刚才我们讲的是比较简单的啊,或者考虑到用户的一个单一的一个兴趣,但是我们有没有想过,用户的兴趣其实非常多的,他可能在一个阶段对吧,有多个兴趣啊,可能啊我想看一些电电子产品啊,但是我的老婆对吧。

他又让我去哎买一些其他的,比如说家庭用品对吧,哎两个我都顺带一块看了对啊,那是不是用户的兴趣,它的向量当前是两个,而不是一个,所以呢慢慢的就会有类似的一些模型出现,就是m i n d啊。

这种多引bt向量推荐,这个,他再去得到多白领的一个核心的是,经过一个胶囊网络,它分成两个部分的一个胶囊,一个是你的行为胶囊,就是你的行为的一个embedding啊,一个是你的兴趣的胶囊。

就是你的兴趣的一个向量与白领啊,这是其实就是一个聚合过程,从多聚合到少的一个过程啊,然后最后对每一个兴趣我们都去召回,然后排序到最终的结果啊,这就是多in白点三辆,召回他大概的一个思路啊。

ok我们再去往下看,还有一些的话我们会考虑到像一些graph啊,结合图当然更复杂一些的话,会考虑到像g n这样的一些,或者说gcn图卷积网络,这里面的话就是为了去增加一些,图的属性或者说社交属性。

那上比较经典的像deep work对吧,depk的话它是分成两个部分的,或者说细分点分成三个部分,我们先去构建我们的图,构建图过程的话,就是根据用户它的一个行为日志,比如说我们先看对应的a这个图对吧。

我们有三个用户u1 u2 u3 ,他们分别都会去点击一些物品啊,比如说ue点击d a b对吧,那这时候的话,第1b它其实就是有这边的关系了啊,怎么理解呢,就是由d到a啊,是不是这种关系啊,看完d之后。

d完d之后点a那点完a之后点b是不是,这样的话,我们是不是构建出来了这样的一个边点,就是商品编就是他们之间的关系,他们之间的一个点击的关系啊,那u2 呢同样的话带到里面对啊,比如说b e啊。

然后像d e r e f u3 也是一样的,这里面中间它还有一个就是分段的部分啊,这是考虑到就是说你b e和d e f,这两个点击的一个群体的,它可能时间离得比较远一些,时间越远。

他们之间的相关性就比较高了,这时候他们之间可能就没有类似关系,你就没有必要把它去构建成我们的边和点,构建完之后呢,我们再去借助random work进行随机游走,从里面去生成对应的这种关系。

比如说a b e f,这是我们最后是右走完结果,这可以看作一个文本啊,然后将其输入到word tactor里面,就是这skyram这样的一些模型,最后去得到对应,每一个商品的一个向量表征。

当然更复杂一点,我们可以使用not not not to actor,对啊,这里面的话它是考虑两点啊,一个是b f s和d f s啊,一个是呃对应的广度唉,一个是广度呃,优先搜索一个深度,优先搜索对。

ok那再往下的话是已经e了啊,e d e s的话好像也是阿里的一个论文,对他所考虑的是,我们如果只是考虑商品本身的id信息的话,那会存在一些问题啊,有些商品它的行为比较稀疏,或者说是一个新品啊。

那这个点的话,它的意义就没有那么强了对吧,他是个人品,那这时候的话我们可以去添加一些什么呢,side information就是其他的一些信息,除了商品id以外,我们可以添加它对应的品类id对吧。

还有品牌id啊,一级品类,二级品类,三级品类这些都可以看的,这样的话这是这个eges里面的一个核心,也是很多的一些模型里面对吧,我们需要考虑的就说我们将这向量对吧,进行累加完之后,累压是最基本的。

当然这个模型里面,它会动态来去调整里面的权重啊,哪个装性高一些啊,对应就是a0 a1 a a2 打a n对啊,来进行这种自动化调整啊。

那再复杂一些的话,相对应的像知识普知识图谱的召回对啊,那基于商品知识图谱,它有效的建模新品啊,比如最近我们有新品了,小米手机啊,小米10但啊,小小米11 22这些的吧,这新品的话刚一出来。

他可能没有对应的一些行为,但是如果说我们构建了这种商品的图谱,之后啊,但我们可以有效地从里面提取出来,而小米刚一上市的手机对吧,它的热度可是非常高的,那这是不是就有效的去建模新品了。

或者是或者说一些活动这种一些新品呀,时尚热点呀,时效活动呀,精准搭配,这些都可以去借助知识图谱来去进行召回。

或者从里面来去生成对应的商品销量,这里的话是去,比如说我们如何去搭建知识图谱对啊,那一个是商品多层次与一息息抽取啊,商品啊,比如小米手机,小米手机对吧,那他要对应那些属性尺寸,内存空间颜色了。

那复购周期是多少,还有用户商品关系建模,基于用户图谱交互关系建模,用户兴趣概念完成新品推荐,然后基于用户图谱交互关系,实现精准复购周期预测,基于用户图谱交关系,实现用户兴趣演变呃这种graph对吧。

呃像,比较新的论文里面也有去讲到一些对啊,这种实体的关系,通过这种实体的关系,我们去生成向量啊,当然这个实体关系他可能描述比较多,然后再去结合attention,就是注意力机制啊。

将这些描述去聚合起来,然后的话我们还是要考虑一些细节,比如说像孤立行为建模,就是我们每个行为之间前后是没有关系的,还有连续的session啊,就是间隔半小时对吧,我们去切分一下,还有用户意图建模啊。

比如说原本的话,可能是具体到它对应的商品对吧,我们可以考虑这种c1 c2 c3 啊,对应到兴趣或者说品类啊,这样的话,我们能够了解到它大概的一个意图,而不是具体到某个商品,这样的话我们推推荐。

或者说可能更加具有一定的泛化性。

ok我们继续往下,下面呢就到了我们的排序模块了啊,这点也是非常重要的,那我们再去回忆一下,排序模块是干什么的啊,我们召回先是去筛选了商品对吧,从几千万个筛选到几百个排序呢,我们基于复杂的模型。

复杂的特征去进行对应的cpr,cvr的一个预测,然后做出对应的一个排序,这时候才真正的将那些商品从高到低,进行排序,这种概率分数啊,他可能对他的一个兴趣的概率来排序对啊,当然也有可能将多个分数整合起来。

进行排序对,所以说它主要是两个部分,特征工程和模型两,个部分啊。

ok那我们这里着重去讲模型模型的发展,模型的演变,让大家快速去了解推荐系统,它的一个大致的发展方向,以及之前是怎么做的,现在又是怎么做的,以后又该怎么去做,最初期呢是人工特征,再去结合线性模型。

国内做推荐对吧,比较早的是百度对吧,都是从百度过去的对啊,因为确实做的非常厉害,最开始对吧,可能在还是在一几年的时候,因为那时候其实还是会用l r模型,然后去结合百万亩百万特征啊,百万人工特征对。

因为你的人你的,特征已经做的非常非常的全了,因为特征它会影响到我们,如果说能够加上一些信息对吧,通过特征构建出来,那这时候模型也就没有什么事儿了,因为我们特征已经够多了,够大家复杂了对啊。

模型它只是从数据里面更好去训练,这些数据,提取出关键信息,但如果说我们特征,已经将这些信息呈现出来了,那模型是不是都可以变得非常简单了,那当然现在慢慢的有很多的,但这种只是一个假设对啊。

但这样需要这样做好的话,是变得非常非常困难的,你怎么样才能将所有特征,所有的一些点全部涵盖到呢,这个是消耗,成本消耗人力对啊是非常大的,而且特征我们需要做很多事情啊,所以说这是最开始的时候对吧。

当然那个时候对吧,我们的模型,我们的机器我的配置还跟不上对,所以说只能用这种线性模型。

再往后的话就是在20110年,到2015年,这个时候的话,我们可以去自动特征交叉加线,线性模型阶段精准推荐啊,就是我们要去能够精准,能够个性化的对啊,力度非常细的去得到,或者说去挖掘到用户的兴趣。

可能我们在扣过在构建特征的时候,我们就需要去构建很多的一些交叉特征,对啊,我们人工需要去做一个事情啊,但是如果说我们模型也能做这个事情的时,候,我们是不是可以减少一定的工作量呢,比如经典的fm fm。

它就可以实现这种特征的交叉啊,g b t t x t boost也可以实现特征交叉,它怎么实现呢,数在分裂的时候,第一棵树它选的是性别,ok分分成了左子树,右子树,下一棵树呢我们选择的是年龄,这是不是。

就实现了性别和年龄的一个交叉了,这就是在2010年到2015年,自动特征交叉加线性模型阶段。

ok这里的话是fm和f fm,这两个话现在其实也呃,fm其实用的比较多啊,为什么呢,因为fm的话,它里面引入了一个f一的厂的,这样一个概念,考虑到特征交叉时对吧,不同特征的交叉对吧。

他们之间的一个重要性应该是不一样的啊,比如说我们a和b交叉对吧,哎我们的我们的这个向量嗯,是等于a和c交叉的,但实际当中a碰见b和碰见c,这两个向量应该是有差异的,重要性应该是不一样的呀。

所以呢引入了一个厂对啊,这就看下面这个公式里面对吧,原本只是v i v g对吧啊,就说mv ok是对应的一个向量啊,g也是对应商量,就是商品i和g啊,或者特征i和g啊,但是呢。

但是呢考虑到我们刚才那个问题对吧,变得更加复杂了,对我们i里面它又分成了f1 f2 f3 ,他碰见摘的时候,他就用f2 啊,你碰见什么时候,你就用不同的,f设备的参数量又有所增加了。

原本的话可能是常数项哎,你就变成了二次项,时间变得更复杂了,成本唉,这时候我们可能就等不及了对啊,而且效果对比上说其实两者差不了多少的,所以后面才会有像deep fm这样的一些演变。

也有一些很多的一些结构对吧。

它叫fm作为其中的一个子结构来去使用,下面的话是gbt和rr的一个结合过程,怎么结合呢,这可能是facebook 2019年的手机版,他们使用的啊,当然我们也去用过,发现没什么效果对啊。

这个也是有很难去嗯,很难解释对啊,大家可能经常能看到一些论文对啊,像阿里系论文或其他一些论文对啊,那呃换长之后就没有效果了,那这个是为这个是为什么呢,我觉得这也是值得我们去深思的部分啊。

那我们来看一下gb t的话,他怎么和r r结合呢,d p它最后会有对应的页的节点对吧,有叶子节点就是落到每颗叶子上面的样本,你落到这个地点上,它就一没有落到,他就是零,那这些节点这些页页节点对吧。

它其实就是一个0101这样的一个结构,那我们0101这结构,它卖就可以下一步和l r进行一个结合,就将其输到rr里面,这就是g b t和rr的一个结合的过程,得到g p t它的e的节点。

然后将e的节点输入到r r里面就可以了。

再复杂一些也是很多一些变形,其实很多都没有用的,大家了解还是可以的,只要了解一些比较经典的就可以了,这里面我调了很多对吧,但比较经典的像什么呢,wide deep red,deep是谷歌的。

deep fm的话好像是华为的,这两个是比较经典的,而且用的比较多啊,我之前公司里面也都用这些模型的对啊,像fn呀,pn呀,n fm呀这种哎呀,那个时候这种论文特别多的,对各种结构的一些组合。

各种结构的一些变化啊,捣鼓捣鼓就发个论文了对啊,但很多其实都没有什么价值的,你看后面还用吗,没有用的对啊啊,当然很多人可能会写一些文章对吧,ok去对比一下这些效果啊。

我们只要去理解他的一个演变的一个过程,演变一个思路啊,怎么去演变呢,啊比如说像wide deep或者说deep fm,它就分成两个部分,一个是y的部分,一个是deep部分啊,一个是f,一个是fm部分。

一个是deep fi,一个是deep部分,对啊,两个部分,每个部分他们考虑的点是不一样的,y的话考虑什么呢,考虑一个记忆性,第一部分考虑是泛化性,那fm考虑什么呢,交叉不仅交叉,而且还有记性啊。

在原本的y的部分,是不是又添加了一个二阶交叉,二阶这样的项目啊,是不是可以理解deep fm它的发展啊,应该是在外deep之后的,因为考虑到更多点了,在基础上做优化了,那还有x d不fm。

刚才我们讲到的是二级交叉,那xd bim它里面的核心结构是c i n,可以实现高阶的一个交叉,深度卷积网络也是哎深度交叉网络哈,他也就是实现了一个高级交叉,我们可以自动来去设定三阶四阶这样的。

这里的话是fn和p n啊,ok这两个其实感觉也没什么作用对啊,fn的话是使用fm得到影向量,作为引bei的初始值,pn的话是在影ban层和m p层,加入一个啊product。

就是一个也是一个交叉的部分对,ok我们继续往下。

videep啊,我们刚刚提到了,以及deep fm都分成两个部分啊对吧,这也分两个部分啊,fm层啊,这是deep层,这是y的部分,这是deep部分,这两个的话,如果我们要去以后要去从事推荐段。

或者说我们想往这方向转的时候对吧,我觉得这两个模型是比较经典的对啊。

以及我们再往后看,想点网络点,点这个的话有没有效果,其实有时候还不好说对,有时候真的是不好说的嗯,因为我们这块也有去尝试过dn d i n,有时候换个场景确实是没有太高太多效果。

但它确实是确实是开创了一个,比较新的一个方向啊,就是在原本的排序模型里面加入了什么呢,对于序列的一个信息的一个提取啊,我们序列的话最后要帮要将其聚合,成一个序列,它是多个100对吧啊。

比如a b c d每个都有个in beding,那我们最后简单点的话,可能将这个in bedding全部求和求和平均,那这里面的话就考虑复杂了对啊,每个embedding,相关性是不一样的。

有的相关性高,有的相关性低,这里面的话它就是结合了attention,大家记住了的天使啊,这也是源自于rp,对啊,现在很多天使里面都会用rp的,也可以支持像attention transformer。

像bt这些都会去用到的,可能都结合这一点了,所以想去发论文的时候,你不妨就,是说去和其他领域或其他方向结合一下,考虑考虑,那dn的话考虑的时间的因素啊,前后的引前后的关系,那你要考虑时间的这种关系。

那你怎么加结构呢,大家想想这种时间对吧,这种时序啊,那是不是就是可以结合r n n或l s t m,g r u对吧啊,这就是无前后关系啊,所以说d i e n对吧,它就是添加了对应的这样的一个结构。

所以也是很好理解的对啊,刚开始我们现在考虑了不同的商品对吧,哎,商品的一个相关性,我们用tention,但这里面没有加入时间的因素考虑啊,所以说我们又融合了,融入了对应的rnn这样的一些结构,是不是。

所以说这些都是有前后因果关系的,我们都可以去不断的去深入去考虑的,所以说现在目前而言,都是那种序列化序列方向去发展,但是这个发展其实也差不多了,对啊,慢慢的结合图国服,还有看结合图。

这些都是不断的去和一些比较流行的,比较新的一些点去进行融合,因为到达瓶颈了,你接下来要考虑什么呢,那一个是你的模型的表征能力非常关键,对表达能力的话,就需要你能够对应不一样的数据。

提取到对应的一个信息啊,ok我们再往下这块。

我们也讲完了,接下来讲重排部分。

ok比如下面我们再去搜商品对吧,淘宝搜索啊和淘宝推荐对吧,我们再去搜索,比如说搜索连衣裙的时候啊,它其实就是会考虑什么多样性的,一个推荐的对啊。

这里的话是一些策略,大家可以可以记一下对啊,这个你如果现在是做推荐的对吧,我觉得这些都可以直接去使用的啊,或者说要去完善一些重牌策略,其实我们在从0~1手对吧,那时候最重要的并不是金牌啊。

最重要的是做召回和重排的一个策略,要保证我们推荐出来结果是正确的,并不是什么,整个屏幕下去全都是一个平a哈,这样的话肯定是影响非常不好的对啊,所以说我们要考虑到很多细节,比如黑名单过滤啊。

按照回类型重盘啊,多特征打散对吧,重拍最后一波,根据内幕品牌打散进行杀er对啊,去重啊,图片相似和sp u相似,打分前进行特征比例控制,不同的栏目它的内容占比对吧,按用户特征体现,根据用户收藏。

他最近有收藏架构,这些偏好,我们可以将其进行提现的,所以说排序完之后对吧,你只是完成一部分工作,后面还有很多事情需要靠,我们整体的一个框架对来去解决的,还有近期已够的,我们需要沉底对吧。

一一重盘来去改善用户的体验。

ok这次呢我们其实只是讲的,我觉得只是一个是让大家去了解,推荐它大体的一个框架,每个部分的一些内容啊,但还是不够深入,对啊啊,比如说模型之间的去对比,模型的优化如何去进行实践啊,不同的项目下面对吧。

针对企业项目对吧啊,电商场景项目啊,或者说一些嗯视频场景项目啊,我们该如何来去进行优化,以及更多的一些知识点,更细的一些知识点啊,比如说序列化推荐他这个演演演变啊,g n它的一个演变啊。

这些内容的话我们都会在呃,我们其实在线推荐高级小班,第13期里面去介绍到,会比今天讲的内容更加的深入,让大家对推荐有更加深入的理解,但是如果我想从事这个方向对啊,呃大家可以去了解一下我们的课程啊。

看看是不是和你所所想的对啊,是不是一样的,比如说很多很多这些诗真实的一些项目啊,代码的一些实现,对吧啊,我们的分布式一些大数据的一些工具啊,一些操作对吧。

工业级的项目,还有更加核心的队是全程答疑,大家遇到什么问题,项目的问题啊,或者说求职的一些问题啊,以及就业辅导对吧,我们都会a1 b对一的来去进行介绍的,对,ok这就是我们今天的所有内容了。

感兴趣的同时呢,我们可以进一步来去沟通交流啊,好的今天分享就到此结束啊。

人工智能—推荐系统公开课(七月在线出品) - P2:大数据到推荐算法工程师的成长之路 - 七月在线-julyedu - BV1Ry4y127CV

哦,那我现在开始了啊,实实在是不好意思,跟大家去。

标签:这个,一个,二十一,笔记,公开课,然后,一些,我们,就是
From: https://www.cnblogs.com/apachecn/p/18498011

相关文章

  • 七月在线公开课笔记-二十五-
    七月在线公开课笔记(二十五)人工智能—机器学习公开课(七月在线出品)-P11:机器学习项目实施方法论-七月在线-julyedu-BV1W5411n7fgOkay。嗯,时间应该到了哈,那这样的话我们就正式开始好吗?没有问题的话,我们就开始,好吧。啊,是这样,这个非常高兴啊能够有机会呃。......
  • 七月在线公开课笔记-二十四-
    七月在线公开课笔记(二十四)人工智能—机器学习中的数学(七月在线出品)-P18:随机梯度下降法的困难与变种-七月在线-julyedu-BV1Vo4y1o7t1我们稍微再简介一下我后面这个部分的内容,这部分当然可能更深入一些。大家我们去年有一个公开公开课,就专门讲这个大家也可以找一找叫做这个......
  • 七月在线公开课笔记-二十三-
    七月在线公开课笔记(二十三)人工智能—机器学习中的数学(七月在线出品)-P1:Taylor展式与拟牛顿-七月在线-julyedu-BV1Vo4y1o7t1这次我们探讨它的展示与它的相关应用,如米牛顿。我们首先给出塔的展示的本身的,它的定义,它的展示的公式的本身。然后我们利用它来计算某一些函数的近似......
  • 七月在线公开课笔记-二十七-
    七月在线公开课笔记(二十七)人工智能—机器学习公开课(七月在线出品)-P25:【公开课】数据挖掘与机器学习基础-七月在线-julyedu-BV1W5411n7fg可以是吧?好,那么我们稍等一下啊,稍等一下我们。在8点钟我们就准时开始我们的一个直播的内容。对。那么各位同学之前有过这个积极学习和深......
  • 七月在线公开课笔记-二十六-
    七月在线公开课笔记(二十六)人工智能—机器学习公开课(七月在线出品)-P18:世界杯数据分析案例-七月在线-julyedu-BV1W5411n7fg然后我们来做个分析吧,所以大家喜欢做一些比赛的分析,对吧?然后大家最关注的当然是决赛半决赛啊,可能也多多分析一下,分析到4分之1决赛对吧?好,所以然刚才已......
  • 七月在线公开课笔记-一-
    七月在线公开课笔记(一)【七月】NLP高端就业小班10期-P1:1.循环神经网络与Pytorch框架_ev-不看兵法的数据分析师-BV1BC4y1C7E5好OK那咱们就开始今天的一个课程内容啊,好,咱们这次课程主要是要给大家讲,这个关于神经网络这一块啊,神经网络这一块。那我们先看一下今天要给大家讲......
  • 七月在线公开课笔记-五-
    七月在线公开课笔记(五)【七月在线】机器学习就业训练营16期-P1:在线视频:1-线性回归、logistic回归、梯度下降_ev-IT自学网100-BV1Z9T5ewEKL好没问题好,那我嗯好,我重新说一下啊,然后欢迎大家来到我们机器学习的这个课程,然后今天是我们正式给大家讲,机器学习算法的第一课,所以在今......
  • 七月在线公开课笔记-四-
    七月在线公开课笔记(四)【七月在线】NLP高端就业训练营10期-P7:3.基于LuongAttention的机器翻译_ev-IT自学网100-BV1uxT5eEEr6那我们这节课主要的聊天,主要的讲课内容就是关于用sequencetosequence,做做这个机器翻译,以及训练一个聊天机器人,那我们快速的回顾一下sequenceto......
  • 七月在线公开课笔记-十一-
    七月在线公开课笔记(十一)1447-七月在线-机器学习集训营15期-P14:7-决策树、Boosting模型融合的精髓速讲-程序员技术手札-BV1ASste6EuZ那这样的话我们就准备开始啊,这个呃按照我们的计划啊,今天呢我们需要讨论的模型呢是决策树模型,通过我们这张图啊,可以看到决策树模型的位置啊,......
  • 七月在线公开课笔记-十五-
    七月在线公开课笔记(十五)Lookalike相似人群拓展项目实战-P1-七月在线-julyedu-BV1bA411p79ROK我们现在课程开始啊,可以听到我说话吗?你今天讲的话是looklike相似人群扩展啊,这个也是在推荐广告里面是非常经典的一个业务啊。它呢是源于2018年的腾讯广告算法大赛啊,大家可其实可......