双塔模型介绍
由于进入召回/粗排的候选数目比精排多很多,召回/粗排无法做的很精排一样复杂。现在业内比较通用的方案是采用双塔模型,左边塔建模user embedding,右边塔建模item embedding,由于用户的行为经常发生变化,user tower需要经常更新,但是item状态很少发生变化,可以离线算好所有的item embedding。计算user embedding和item embedding的相似度即可得到 user和item的预估分,在线serving的时候可以通过ANN算法快速检索出top k item
算塔模型的局限性:
1. user和item最后才交互,此时的user embedding和item embedding已经丢失了许多原始特性信息,导致效果有损
2. 无法引入user-item交叉特征
SENet双塔模型
在user tower和item tower中都加了SENet做特征选择