DCN V2 Improved Deep & Cross Network and Practical Lessons for Web-scale Learning to Rank Systems

时间：2024-08-29 11:14:38浏览次数：16

标签：DCN Lessons scale cdot cross v2 mathbb

概
DCN-v2

Wang R., Shivanna R., Cheng D. Z., Jain S., Lin D., Hong L. and Chi E. D. DCN V2: Improved deep & cross network and practical lessons for web-scale learning to rank systems, 2020.

概

DCN 的升级版.

DCN-v2

DCN-v2 的 cross/deep 的结合方式上有上述两种, 具体的好坏和数据有关系.
相较于 DCN, DCN-v2 的主要改进在于 cross network 部分:

\[x_{l+1} = x_0 \odot (W_l x_l + b_l) + x_l. \]
这里 \(W_l \in \mathbb{R}^{d \times d}\), 之前的 DCN 是 \(W_l \in \mathbb{R}^{1 \times d}\).
特别的, 作者发现, 这种方式学出来的 \(W\) 通常是低秩的, 所以对于 \(W_l\) 做了进一步的改进:

\[W_l = U_l V_l^T, \quad U_l, V_l \in \mathbb{R}^{d \times r}, \quad r \ll d, \quad r \ll d. \]

同时, 引入 MoE 机制:
\[x_{l+1} = \sum_{i=1}^K G_i(x_l) E_i(x_l) + x_l, \]
其中 \(G_i(\cdot)\) 得到对第 i 个专家的权重 (通过 sigmoid, softmax 等实现), \(E_i\) 则定义如下:
\[E_i(x_l) = x_0 \odot \big( U_l^i \cdot g(C_l^i \cdot g({V_l^i}^T x_l)) + b_l \big). \]
这是对在压缩到低维空间后通过非线性激活函数 \(g(\cdot)\) 和 \(C_l^i\) 仅进一步的转换.

标签：DCN,Lessons,scale,cdot,cross,v2,mathbb
From： https://www.cnblogs.com/MTandHJ/p/18386298

【ACMMM2024】Multi-Scale and Detail-Enhanced Segment Anything Model for Salient
论文：https://arxiv.org/pdf/2408.04326代码：https://github.com/BellyBeauty/MDSAM论文的研究动机就是使用SAM来解决显著性检测（SOD）问题，主要有两个改进：提出了LightweightMulti-ScaleAdapter,LMSA来微调SAM提出了Multi-LevelFusionModule,MLFM和DetailEnhancementM......
一次搞懂数据大屏适配方案 (vw vh、rem、scale)
当接到可视化大屏需求时，你是否会有以下疑问......
【xilinx】解决 I/O 时钟布局器错误：UltraScale 示例
示例详细信息：设备： xcvu9p-flga2104-2-e问题：尽管使用GCIO引脚作为时钟，但该工具仍返回I/OClockPlacer错误错误：<spanstyle="background-color:#f3f3f3"><spanstyle="color:#333333"><code>ERROR:[Place30-675]Sub-optimalplacementforaglobalcloc......
YOLOv5改进 | 融合改进 | C3 融合Efficient Multi-Scale Conv提升检测效果
秋招面试专栏推荐：深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转......
基于UltraScaleKU115的高性能PCIe3.0 x8-FMC+接口卡
基于UltraScaleKU115的高性能PCIe3.0x8-FMC+接口卡，是一款高性能的PCIe3.0X8板卡。主控芯片采用Xilinx公司KintexUltraScale系列FPGA家族中的XCKU115-FLVA1517（兼容XCKU085-FLVA1517）。板卡含有2组共8GB（单组4GB）的DDR4内存颗粒，支持JTAG口和QSFP+光纤接口以及FMC+扩展接口。......
ViT 原理解析 (Transformers for Image Recognition at Scale)
ViT原理解析(TransformersforImageRecognitionatScale)原创小白小白研究室 2024年06月10日21:09 北京如何将transformer应用到图像领域Transformer模型最开始是用于自然语言处理(NLP)领域的，NLP主要处理的是文本、句子、段落等，即序列数据。视觉领域处理的......
基于spm实现计算脑簇（Cluster）和大尺度脑网络（Large-Scale Network）的重叠
前言在神经科学的处理中，经常会出现想通过大尺度脑网络的视角来分析某一脑区的情形，首先我们要判断簇（Cluster）属于哪个网络，其次我们想要得知量化的信息与某网络的重叠百分比。那拿到Cluster的掩模与脑功能网络的模版后，有哪些方法可以计算重叠比例呢？目录前言一、基于可视......
光纤PCIe 卡设计资料第383篇: 基于kintex UltraScale XCKU060的双路QSFP+光纤PCIe 卡
基于kintexUltraScaleXCKU060的双路QSFP+光纤PCIe卡一、板卡概述本板卡系我司自主研发，基于Xilinx UltraScale Kintex系列FPGA XCKU060-FFVA1156-2-I架构，支持PCIE Gen3 x8模式的高速信号处理板卡，搭配两路40G QSFP+接口，两组64-bit DDR4，每组容量2Gbyte，可稳定......
《ImageNet: A Large-Scale Hierarchical Image Database》李飞飞论文阅读笔记
OpenSNN开思通智网，官网地址：https://w3.opensnn.com/2024年8月份"O站创作者招募计划"快来O站写文章，千元大奖等你来拿！“一起来O站，玩转AGI！”论文地址:《ImageNet:ALarge-ScaleHierarchicalImageDatabase》这篇论文是关于一个叫做“ImageNet”的大型图像数据库的介绍。......
Plugin Boutique Scaler EQ V1.1.3_WIN-TCD&MAC-HCiSO（2024.08更新），持续更新长期有效
一。PluginBoutiqueScalerEQ1.1.3WIN-TCD&MAC-HCiSO 紧随屡获殊荣的音乐理论插件Scaler之后，ScalerEQ以一种引人注目的全新方式提供了音乐性和色彩的均衡。ScalerEQ是PluginBoutique推出的一款创新均衡器插件，结合传统和和声均衡功能，专注于音乐理论，为音乐制作和混......

DCN V2 Improved Deep & Cross Network and Practical Lessons for Web-scale Learning to Rank Systems

概

DCN-v2

相关文章

赞助商

阅读排行