在Twitter信息流中大规模应用深度学习——推文的相关度计算使用了深度学习

时间：2023-07-04 19:33:18浏览次数：48

我们如何对信息流进行排序？

在引入排序算法之前，信息流的组成非常简单：收集所有由你的关注对象在你最后一次登录Twitter之后发送的推文，再将它们按照时间倒序显示出来。这个看起来很简单，但要为数以亿计的Twitter用户提供这种稳定的体验对我们来说是一个巨大的挑战，它对我们的基础设施和运维能力提出了很高的要求。

在引入排序算法之后，信息流的组成变得更加丰富。在收集推文之后，我们使用相关度模型对它们打分。这个分数是针对每个用户对推文感兴趣程度的预测。具有较高分数的推文被展示在信息流的最上面，其他推文紧随其后显示。根据你的信息流中已有的推文数量以及从你最后一次登录Twitter至今的时间长短，我们还可能专门为你提供一个“你可能错过的推文”模块。这个模块只包含少量具有最高相关度的推文。这样做的目的是希望你能够先看到重要的推文，然后再进一步查看按照时间排序的部分。

为了预测推文的相关度，我们的模型考虑到了以下几个特征。

推文本身：鲜活度（recency）、是否包含媒体卡（图像或视频）、互动情况（如转发或点赞次数）。
推文的作者：你过去与作者的互动情况、你与作者之间关系的紧密程度、你与作者之间的关系是如何建立的。
你自己：你参与过互动的推文、你使用Twitter的频率和使用程度。

我们使用的特征和各种特征之间的关系在不断增长，我们的模型因此能够识别出更为精确的行为模式。

每次在你打开手机或刷新信息流的时候，我们都会对推文进行打分，以便确定哪些推文可以被展示在信息流的最上面。打分这一举动对我们的信息流服务基础设施提出了很高的计算要求，因为我们现在每秒钟要对数千条推文进行打分。虽然更丰富的模型可以提高推文排序的质量，但对于像Twitter这样的实时社交公司来说，速度与质量同样重要。Twitter独特的挑战在于如何为查看信息流的用户进行快速实时的打分，并且拥有足够强大的模型来保证排序质量以及后续的改进。

标签：信息流,Twitter,推文,相关度,深度,排序,打分
From： https://blog.51cto.com/u_11908275/6624561

基于策略的深度强化学习
策略函数，输入为状态，输出动作a对应的概率。利用神经网络去近似一个概率函数 softmax函数使概率加和等于1且都为正数。 Qπ用来评价在状态s下作出动作a的好坏程度，与策略函数π有关。状态价值函数V，只与当前状态s有关将策略函数π替换为神经网络用梯......
【深度】韦东山：一文看看尽linux对中断处理的前世今生
交流群一：QQ群：869222007（鸿蒙开发/Linux/嵌入式/驱动/资料下载）交流群二：QQ群：536785813（单片机-嵌入式）公众号：百问科技版本日期作者说明V12020韦东山技术文档前言：本文，4200字，研究代码花了一天，写出来花了一天；录视频估计又得花半天；真怀念以前简单粗暴的生活啊：拿起话筒就录视频，先画好......
神经网络通过优化方法进行训练。然而，优化技术似乎不是深度学习中最重要的主题。为什么
在深度学习中，神经网络通过优化方法进行训练，目的是最小化损失函数并获得最佳的模型参数。然而，优化技术在深度学习中并不是最重要的主题，主要原因如下：数据和模型的重要性：在深度学习中，数据的质量和数量以及模型的设计和复杂性对于模型的性能和泛化能力起着至关重要的作用。优化技术......
众所周知，梯度下降法是一种基本的优化算法，不能保证全局最优，也不能保证效率。为什么它仍
梯度下降法在深度学习中被广泛应用的原因主要有以下几点：适用性广泛：梯度下降法可以应用于各种深度学习模型，包括神经网络、卷积神经网络、循环神经网络等。而传统的凸优化算法和粒子群算法往往只适用于特定类型的优化问题。原理简单：梯度下降法的原理相对简单，易于理解和实现。......
JZ55 二叉树的深度
暴搜：两种个思路：DFS和BFSDFS：里面有个容易误会的地方：每次迭代+1，不是针对子叶来说的，而是针对当前点来说的，由于遍历是自底向上的，因此当前遍历到的点对于已经遍历到的点来说就是根，因此深度+1.classSolution{public:intTreeDepth(TreeNode*pRoot){if(pRoot==n......
4.Rasterization光栅化（反走样，深度缓存）
走样Aliasing(锯齿)采样的广泛应用采样不仅可以在图片的某个位置，也可以在时间轴上动画就是一组图在时间的采样Artifacts(瑕疵、错误)采样会产生一些Artifacts(瑕疵、错误)例如：锯齿（图像上的采样）摩尔纹（删除图像奇数行，再放大成原大小后可得）”车轮效应“（车轮旋转速度过快，......
深度理解Iterator底层源码
publicabstractclassAbstractList<E>extendsAbstractCollection<E>implementsList<E>{//外部操作数：记录添加数据、删除数据的次数（记录元素个数变化的次数） protectedtransientintmodCount=0;//4}这段代码是一个抽象类AbstractList，实现了List接口。下面是对代码......
根据Twitter上的专家，我们都是懒惰的人，没有投入足够的工作。
只是喜欢看电视的懒鬼，或者对社交媒体上瘾。我们都认为自己有权享有成功。太忙于白日梦，以至于变成了大婴儿。太容易分心，没有付出努力和时间来取得成功。这就是那些催促你奋斗的人想让你相信的。论点社交媒体上充斥着那些向你推销奋斗文化的影响者。让我总结一下我经常看到的热......
深度学习训练模型指标不变
在深度学习实验中遇到一个问题就是虽然loss有变化，但是在验证集中准确率一直没变，且值接近你的验证集的正负样本比例。这是因为，在模型中某一个位置使用看ReLU激活函数，导致值全都变换到了非负数，再最后用sigmoid的时候全是>0.5的结果。还有一种情况就是loss一直不变，这类情况说明反......
Halcon - 深度学习 - 目标分类
这是一个例子，通过读取桃子和梨的图片集来进行模型训练，得到一个可以识别桃子或是梨的深度学习识别器。**********************************************Halcon-深度学习-分类测试*这是一个例子，通过读取桃子和梨的图片集来进行模型训练，*得到一个可以识别桃子或是梨的深度学......

在Twitter信息流中大规模应用深度学习——推文的相关度计算使用了深度学习

相关文章

赞助商

阅读排行