首页 > 其他分享 >快手HoME多任务论文

快手HoME多任务论文

时间:2025-01-22 12:32:56浏览次数:1  
标签:快手 BN 专家 任务 gate HoME 共享 多任务

论文链接:HoME: Hierarchy of Multi-Gate Experts for Multi-Task Learning at Kuaishou

背景

论文指出现在的MMOE/PLE模型存在以下几个问题:

1. 专家崩溃:专家的输出分布存在显着差异,并且一些专家使用 ReLU 的零激活率超过 90%,使得门网络很难分配公平的权重来平衡专家

2. 专家退化:一些共享专家只被一项任务占据,这表明共享专家失去了他们的能力,而是退化为一些特定专家

3. 专家欠拟合(针对特定专家):在我们的服务中,我们有数十个行为任务需要预测,但我们发现一些数据稀疏的预测任务往往会忽略其特定专家,并为共享专家分配较大的权重。原因可能是共享专家可以从密集任务中感知更多的梯度更新和知识,而特定专家由于其稀疏行为很容易陷入欠拟合。

 

技术方案

Expert归一化和Swish机制

作者研究发现,造成专家崩溃的本质原因是因为不同专家输出尺度差异过大,为了解决问题,论文采用了在专家层之后加BN层,并把激活函数替换成Swish激活函数:

对比一下BN + Swish 和直接用Dice的区别:

BN+Swish:f(s) = BN(s) * sigmoid(BN(s))

Dice:f(s) = s * p(s) = s * sigmoid(BN(s)) + αs * (1 - sigmoid(BN(s)))

 

层次掩码机制

针对一些共享Expert退化成只起到私有Expert作用的情况, 作者提出基于任务相关性的先验知识来缓解这一问题,以快手短视频推荐为例, 预测任务可以大体分成两类:

  • 被动观看的时长类任务: 如完播、长播、快划等
  • 主动交互的互动类任务: 如点赞、评论、收藏等

更加这个划分,作者把模型分为两层:

第一层学习更粗粒度的表示,别提取:(1)时长子类别内共享知识;(2)全局共享知识; (3)互动子类目内共享知识

第二层在第一层粗粒度表示基础上,进行正常的多任务预测,以点击率和有效播放两个目标为例, 第2阶段的过程描述如下: 

Feature-gate与Self-gate机制

对于数据稀疏任务存在的Expert欠拟合的问题, 作者提出了两种门控机制来确保这些任务能够获得适当的梯度以最大化其有效性。

Feature-gate机制

对于feature-gate,其目的是为不同的任务专家生成不同的输入特征表示,以缓解所有专家共享相同的输入特征时的潜在梯度冲突 

Self-gate机制

除了专家输入层面引入feature-gate,作者还在级联层次的各专家输出层面(包含第一层和第二层)添加了一个基于残差思想的self-gate, 比如下图所示的第二层级中, 红圈的I就表示self-gate。self-gaet是用于确保顶层梯度可以有效地传递到底层, 并只关注其特定专家的输出。

 

参考资料

快手HoME: 推荐系统多任务学习MoE机制的里程碑式改进

快手HOME——PLE的进一步升级

标签:快手,BN,专家,任务,gate,HoME,共享,多任务
From: https://www.cnblogs.com/xumaomao/p/18685545

相关文章

  • 【人工智能】Python实战:构建高效的多任务学习模型
    《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门!解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界多任务学习(Multi-taskLearning,MTL)作为机器学习领域中的一种重要方法,通过在单一模型中同时学习多个相关任务,不仅能够提高模型的泛化能力,还能......
  • 30天开发操作系统 第 16 天 -- 多任务 v2.0
    前言大家好!昨天我们已经实践了很多关于多任务的内容,不过今天我们还得继续讲多任务。可“老是讲多任务都听腻了啊!”,但多任务真的非常重要(当然,如果你不想做一个多任务的操作系统那就不重要啦)。从咱们制作的操作系统角度来说,希望大家能够在充分做好多任务机制的基础上,再......
  • 快手极速版如何查找ip归属地?怎么关掉
    在数字化时代,个人隐私的保护成为了广大用户关注的焦点。快手极速版作为一款备受欢迎的短视频应用,其IP归属地的显示与关闭功能自然也成了用户热议的话题。本文将详细介绍如何在快手极速版中查找IP归属地以及如何关闭IP属地显示,帮助用户更好地管理自己的隐私信息。一、快手极速......
  • 30天开发操作系统 第 15 天 --多任务 v1.0
    前言话说,多任务到底是啥呢?”我们今天的内容,就从这个问题开始吧。多任务,在英语中叫做“multitask”,顾名思义就是“多个任务”的意思。简单地说,在Windows等操作系统中,多个应用程序同时运行的状态(也就是同时打开好几个窗口的状态)就叫做多任务。对于生活在现代社会的各......
  • HOME硬盘空间不够,如何追加扩容?
    关于您提到的HOME硬盘空间不够,需要追加扩容的问题,我们理解这对您的业务运营带来了不便。为了帮助您顺利完成硬盘扩容操作,以下是详细的解决方案:确认扩容需求:首先,请确认您需要增加的具体硬盘空间大小。根据您的描述,您希望将新购买的110GB硬盘空间合并到现有的HOME分区中。确保新......
  • 【树莓派5】香瓜树莓派5之Home Assistant(ZHA+ Zigbee2MQTT)控制zigbee开关(有线+无线)
    本文最后修改时间:2024年07月04日一、本节简介本节以树莓派5为例,安装HomeAssistant系统并且进行配置,通过两种协议方式(ZHA+Zigbee2MQTT)控制zigbee网关,连接zigbee开关(有线+无线)来控制灯的亮灭。二、实验平台1、硬件平台1)树莓派5开发板套件①树莓派5开发板②SD卡(32G)③mir......
  • 2025 Homebrew 配置 brew install 国内镜像源指南,快速安装加速(01月13日更新)
    2025Homebrew配置brewinstall国内镜像源指南,快速安装加速(01月13日更新)大家好!......
  • 地平线 LiDAR-Camera 融合多任务 BEVFusion 参考算法-V1.0
    该示例为参考算法,仅作为在征程6上模型部署的设计参考,非量产算法。1.简介激光雷达天然地具有深度信息,摄像头可以提供丰富的语义信息,它们是车载视觉感知系统中两个最关键的传感器。但是,如果激光雷达或者摄像头发生故障,则整个感知框架不能做出任何预测,这在根本上限制了实际自......
  • Home Assistant通过ha CLI修改ip等数据
    在x86机器上安装HomeAssistant操作系统后,在ui更改了ip网关等数据后无法登录ha网页,通过haCLI修改ip等数据设备连接到显示器,显示如下ha>login进入bash模式显示如下#输入以下命令进行操作nmcliconnectionshow列出您的连接nmcliconshow"YourConnectionName"列出......
  • 【专题】2024年直播、短视频:抖音、小红书、快手行业报告汇总PDF合集分享(附原数据表)
    原文链接: https://tecdat.cn/?p=38697在当今数字化飞速发展的时代,直播、短视频行业已然成为了大众生活与商业运作中不容忽视的重要力量,正不断重塑着信息传播与消费的格局。2024年,这一领域更是呈现出多元且复杂的发展态势。从内容创作者生态来看,抖音、小红书、快手等平台各有热......