首页 > 编程语言 >好书推荐 -- 《精通推荐算法》

好书推荐 -- 《精通推荐算法》

时间:2024-07-28 11:58:45浏览次数:14  
标签:-- 推荐 建模 召回 好书 Embedding 序列 模型 结构

新书发布,京东限时15天内5折优惠,半天即可送到。

图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

1 作者介绍、本书内容、Q&A、业内人士好评和图书实拍

本书不仅适合推荐算法工程师,还适合搜索、广告和营销等领域的从业者。

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

2 全书目录

第1章 推荐系统概述 1

1.1 为什么需要推荐系统 1

1.1.1 推荐系统与用户体验 2

1.1.2 推荐系统与内容生产 3

1.1.3 推荐系统与平台发展 4

1.2 推荐系统分类 5

1.2.1 业务领域分类 5

1.2.2 内容介质分类 5

1.2.3 交互形态分类 6

1.2.4 应用场景分类 6

1.3 推荐系统技术架构 7

1.4 本章小结 9

第2章 数据样本和特征工程 10

2.1 数据样本 10

2.1.1 样本不均衡问题 11

2.1.2 样本不置信问题 14

2.1.3 离/在线样本不一致问题 16

2.2 特征工程 17

2.2.1 特征类目体系 18

2.2.2 特征处理范式 21

2.2.3 特征重要性评估 22

2.3 本章小结 23

第3章 传统推荐算法 25

## 3.1 协同过滤 25

3.1.1 基于用户的协同过滤 26

3.1.2 基于物品的协同过滤 27

3.1.3 协同过滤的优点和局限性 28

3.2 矩阵分解 29

3.2.1 矩阵分解实现方法 30

3.2.2 矩阵分解的优点和局限性 31

3.3 逻辑回归 31

3.3.1 逻辑回归求解过程 33

3.3.2 逻辑回归的优点和局限性 34

3.4 因子分解机 35

3.4.1 因子分解机模型简化 35

3.4.2 因子分解机的优点和局限性 36

3.5 组合模型 37

3.5.1 GBDT + LR组合模型结构 38

3.5.2 GBDT特征转换过程 39

3.5.3 组合模型的思考和总结 40

3.6 本章小结 40

第4章 特征交叉 42

4.1 特征交叉概述 43

4.1.1 特征交叉的意义 43

4.1.2 特征交叉基本范式 44

4.1.3 特征交叉的难点 45

4.2 Deep Crossing:经典DNN框架模型 46

4.2.1 业务背景和特征体系 46

4.2.2 模型结构 48

4.2.3 实现方法 52

4.3 FNN 54

4.3.1 为什么Embedding收敛慢 55

4.3.2 模型结构 55

4.4 PNN 58

4.4.1 模型结构 58

4.4.2 特征交叉实现方法 59

4.5 Wide&Deep:异构模型奠基者 61

4.5.1 “记忆”和“泛化” 61

4.5.2 模型结构 62

4.5.3 系统实现 64

4.5.4 代码解析 66

4.6 DeepFM:异构模型Wide侧引入FM 68

4.6.1 模型结构 68

4.6.2 代码解析 70

4.7 DCN:异构模型Wide侧引入高阶交叉 74

4.8 NFM:异构模型Deep侧引入显式交叉 77

4.9 xDeepFM:异构模型引入子分支 79

4.10 本章小结 83

第5章 用户行为序列建模 85

5.1 用户行为序列建模概述 86

5.1.1 行为序列建模的意义 87

5.1.2 行为序列建模的基本范式 87

5.1.3 行为序列建模的主要难点 88

5.1.4 行为序列特征工程 89

5.2 DIN:基于注意力机制建模用户行为序列 90

5.2.1 背景 90

5.2.2 模型结构 92

5.2.3 模型训练方法 95

5.2.4 代码解析 98

5.3 DIEN:GRU建模用户行为序列 100

5.3.1 模型结构:兴趣抽取层 100

5.3.2 模型结构:兴趣进化层 103

5.4 BST:Transformer建模用户行为序列 105

5.4.1 模型结构 105

5.4.2 代码解析 109

5.5 DSIN:基于Session建模用户行为序列 114

5.6 MIMN:基于神经图灵机建模长周期行为序列 117

5.6.1 工程设计:UIC模块 118

5.6.2 MIMN模型结构 119

5.7 SIM:基于检索建模长周期行为序列 123

5.8 ETA:基于SimHash实现检索索引在线化 126

5.8.1 ETA模型结构 127

5.8.2 SimHash原理 128

5.9 本章小结 129

第6章 Embedding表征学习 131

6.1 Embedding表征学习概述 132

6.1.1 Embedding概述 133

6.1.2 Embedding表征学习的意义 134

6.1.3 Embedding表征学习的基本范式 134

6.1.4 Embedding表征学习的主要难点 135

6.2 基于序列的Embedding建模方法 135

6.2.1 Word2vec任务定义:CBOW和Skip-gram 136

6.2.2 Word2vec模型结构 137

6.2.3 Word2vec训练方法 138

6.2.4 Item2vec:推荐系统引入序列Embedding 139

6.2.5 序列建模总结和思考 139

6.3 基于同构图游走的Graph Embedding 139

6.3.1 DeepWalk:同构图游走算法开山之作 140

6.3.2 LINE:一阶相似度和二阶相似度探索 141

6.3.3 Node2vec:同质性和结构等价性探索 142

6.3.4 同构图游走的优缺点 144

6.4 基于异构图游走的Graph Embedding 145

6.4.1 Metapath2vec 145

6.4.2 EGES 146

6.4.3 异构图游走的优缺点 149

6.5 图神经网络 149

6.5.1 GCN:图神经网络开山之作 149

6.5.2 GraphSAGE:图神经网络工业应用的高潮 152

6.5.3 图神经网络总结 153

6.6 向量检索技术 153

6.6.1 向量距离计算方法 154

6.6.2 向量检索算法 156

6.6.3 向量检索常用工具:Faiss 161

6.7 本章小结 162

第7章 多任务学习 165

7.1 多任务学习发展历程 166

7.1.1 为什么需要多任务学习 166

7.1.2 多任务学习的基本框架 167

7.1.3 多任务学习的难点和挑战 168

7.2 ESMM模型:解决SSB和DS问题的利器 169

7.2.1 样本选择偏差和数据稀疏问题 169

7.2.2 ESMM模型结构 170

7.2.3 ESMM核心代码 172

7.3 MMOE模型:多专家多门控网络 174

7.3.1 MMOE模型结构 174

7.3.2 MMOE核心代码 177

7.4 PLE模型:解决负迁移和跷跷板现象的利器 179

7.4.1 负迁移和跷跷板现象 180

7.4.2 单层CGC模型结构 180

7.4.3 PLE模型结构 183

7.4.4 PLE核心代码 184

7.5 多任务融合 188

7.5.1 网格搜索 189

7.5.2 排序模型 190

7.5.3 强化学习 190

7.6 本章小结 192

第8章 召回算法 194

8.1 召回概述 196

8.1.1 推荐底池 196

8.1.2 多路召回 197

8.1.3 召回的难点 198

8.1.4 召回评价体系 199

8.2 个性化召回 200

8.2.1 基于内容的个性化召回 200

8.2.2 基于协同过滤的个性化召回 201

8.2.3 基于社交关系的个性化召回 203

8.3 向量召回 203

8.3.1 实现方法 204

8.3.2 YouTube DNN 204

8.3.3 Facebook EBR 206

8.3.4 百度MOBIUS 208

8.4 用户行为序列类向量召回 209

8.4.1 多峰兴趣建模的意义 210

8.4.2 MIND的模型结构 210

8.4.3 胶囊网络 212

8.5 样本选择偏差问题 213

8.5.1 召回样本构建方法 213

8.5.2 ESAM和迁移学习 215

8.6 召回检索优化和TDM 218

8.6.1 TDM在线检索过程 218

8.6.2 TDM索引构建和模型训练过程 220

8.6.3 JTM 221

8.6.4 OTM 222

8.7 本章小结 223

第9章 粗排算法 226

9.1 粗排概述 228

9.1.1 粗排样本和特征 228

9.1.2 粗排发展历程 228

9.1.3 粗排的难点 230

9.1.4 粗排评价体系 230

9.2 PFD模型:知识蒸馏学习交叉特征 231

9.2.1 PFD模型结构 231

9.2.2 PFD模型原理 232

9.2.3 PFD与传统蒸馏相结合 233

9.2.4 PFD在精排中的应用 234

9.3 COLD模型:显式特征交叉 235

9.3.1 双塔内积模型 235

9.3.2 COLD模型 237

9.4 FSCD模型:效果和效率联合优化 238

9.4.1 FSCD特征选择原理 239

9.4.2 FSCD训练步骤 241

9.5 本章小结 242

第10章 重排算法 243

10.1 重排概述 245

10.1.1 为什么需要重排 245

10.1.2 重排的难点和挑战 245

10.1.3 流量调控 246

10.2 打散和多样性 246

10.2.1 打散 247

10.2.2 多样性 248

10.2.3 多样性发展历程 248

10.3 上下文感知和PRM模型 249

10.3.1 什么是上下文感知 250

10.3.2 PRM模型结构 250

10.3.3 其他上下文感知实现方案 253

10.4 实时性和延迟反馈问题 254

10.4.1 推荐系统实时性的意义 254

10.4.2 推荐系统实时性分类 255

10.4.3 延迟反馈问题 256

10.4.4 延迟反馈优化方案 257

10.5 端上重排和EdgeRec 257

10.5.1 为什么需要端上模型 258

10.5.2 端上推理引擎 259

10.5.3 EdgeRec系统架构 259

10.5.4 EdgeRec模型结构 260

3 购书方式

新书发布,京东限时15天内5折优惠,一杯咖啡的价钱。

京东自营,半天即可送到。

图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询,售后无忧。

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

源代码:扫描图书封底二维码,进入读者群,群公告中有代码下载方式
微信群:图书封底有读者微信群,作者也在群里,任何技术、offer选择和职业规划的问题,都可以咨询。
售后:支持京东七天无理由退货,售后无忧。

4 买家评论

《精通推荐算法》,限时半价,半日达icon-default.png?t=N7T8https://u.jd.com/VbCJsCz

标签:--,推荐,建模,召回,好书,Embedding,序列,模型,结构
From: https://blog.csdn.net/u013510838/article/details/140707119

相关文章

  • SpringMVC入门案例
    使用Servlet技术开发web程序流程1.创建web工程(Maven结构)2.设置tomcat服务器,加载web工程(tomcat插件)3.导入坐标(Servlet)4.定义处理请求的功能类(UserServlet)5.设置请求映射(配置映射关系)使用SpringMVc技术开发web程序流程1.创建web工程(Maven结构)2.设置tomcat......
  • 「PA2022」Medrcy
    设\(f_i\)表示第\(i\)个人知道的咒语集合,\(c_i\)为其补集,那么第\(i\)个人第\(k\)天会离开当且仅当存在一个序列\(a_{1\simk-1}\),使得\(\bigcup\limits_{j=1}^{k-1}(f_i\cupf_{a_j})=\varnothing\),即\(\bigcap_{j=1}^{k-1}(c_i\capc_{a_j})=\text{U}\)。考虑连接......
  • 数据结构(Java):反射&枚举&Lambda表达式
    目录1、反射1.1反射的定义1.2 反射机制的原理1.3反射相关类1.4 Class类1.4.1相关方法1.4.1.1 常用获得类相关的方法​编辑1.4.1.2 常用获得类中属性相关的方法 1.4.1.3 获得类中构造器相关的方法  1.4.1.4 获得类中方法相关的方法1.4.2获取Class对象......
  • CF1119H Triple
    异或卷积,把一个三元组\(\{a_i,b_i,c_i\}\)转化为\(F_i[a_i]=x\),\(F_i[b_i]=y\),\(F_i[c_i]=z\)的幂级数,将\(\prod\limits_{i=1}^n\text{FWT}(F_i)\)执行\(\text{IFWT}\)即可考虑从每个幂级数只有\(3\)个非零值入手优化,设\(c(i,j)\)表示异或卷积的变换系数,即\(\text{......
  • 「CCPC 2023 北京市赛」史莱姆工厂
    由于每次合并可以刻画为向外延伸,那么考虑区间\(\text{dp}\),设\(dp_{l,r,m,c}\)表示考虑了\([l,r]\)且剩下了一个质量为\(m\in[0,K)\)颜色为\(c\)的史莱姆的答案。状态过大且转移方程不便于优化而考虑优化状态,由于对于一个极短的需要合并成一个史莱姆的区间\([p,q]\),......
  • 30 列表常用方法——append()、insert()、extend()
    append()、insert()、extend()这3个方法都可以用于向列表对象中添加元素。①append()用于向列表尾部追加一个元素。②insert()用于向列表任意指定位置插入一个元素。③extend()用于将另一个列表中的所有元素追加至当前列表的尾部。这3个方法都属于原地操作,不......
  • GYM105139C Lili Likes Polygons
    记矩形的并为\(P\),定义多边形的大小为它的顶点个数\(|P|\),其\(90\)°的顶角为凸角,\(270\)°的顶角为凹角并记凹点构成的集合为\(C\),称竖直或水平在多边形内部分割开矩形的线为割线,连接了两个凹点的割线为好割线贪心可以发现对于\(P\)的任意极小矩阵划分,所有的割线至少有一......
  • 最优化(11):信赖域算法、非线性最小问题二乘算法
    4.6信赖域算法——第一小节给出了信赖域算法的框架,第二小节讨论了信赖域子问题的求解方法(迭代法、截断共轭梯度法),第三小节主要介绍算法收敛性;4.7非线性最小二乘问题算法——第一小节给出了非线性最小二乘问题的一般形式,第二小节主要介绍高斯-牛顿算法,第三小节主要介绍Leve......
  • QOJ5090 妙妙题
    将白色看作\(0\),黑色看作\(1\),并将所有人等距离排在圆上,若知道所有人颜色的异或和,就可以根据自己看见的颜色集合判断自己的颜色,且将圆等切为两半一定有少的一边的人数\(\ge\lfloor\frac{n-1}{2}\rfloor\),但若圆两边的黑点关于切线翻转对称(如下图),则会出现看到颜色相同的两人......
  • 掌握 IPython %%time 魔法命令:高效测量代码块执行时间
    引言在编程和数据分析中,了解代码的执行时间是优化性能的关键步骤。IPython,作为一个强大的交互式计算环境,提供了多种工具来帮助用户测量和优化代码。其中,%%time魔法命令是IPython中用来测量代码块执行时间的便捷工具。本文将详细介绍%%time魔法命令的使用方法,并通过一......