Deep Transfer Learning综述阅读笔记

时间：2023-03-24 18:55:46浏览次数：46

标签：target instance Transfer 样本 Deep source TL Learning transfer

这是一篇linkedin发表的深度迁移学习综述, 里面讲了一些对于search/recommend system中的迁移学习应用. 有不少指导性的方法, 看完后摘录出来

对于ranking方向的TL, 主要有两种transfer方式:

Model transfer

对于参数量非常大的预训练模型, Fine-tuning 训练代价比较大, 这里基本没介绍, 不太可行.
更适合应用的方式是 multi-task training.(尤其是在多个产品线通过user来联系的场景)

Cross domain: 适用场景为冷启问题(新用户/新场景), 提升accuracy(减少数据稀疏性, 学到更多的健壮特征), 增强用户模型, 主要有下面这几种实现方式
- Multi-view
- Partial Model Sharing
- Partial Representation Sharing

instance transfer

这个tutorial里主要介绍了一个selective instance transfer的方法, 主要思路是通过TL+GAN的思想来选择样本, 再通过RL的方法不断优化模型效果. 使用场景是taobao->qingtao的item推荐迁移. 需要有label的source intance和target instance, 通过这个算法来选出source instance的子集用于target domain的模型训练, 从而提升target模型效果.

这个网络主要分成三个部分:

selector, 这个网络类似于GAN里的generator, 负责从source样本中选出与target相似的样本. 输入就是所有的source样本. 另外还有一个作用是选出可以提升TL module在验证集上
Discriminator, 判别器, 输入的是source和target样本, 这是个二分类模型. 主要作用是尽可能区分source和target, 同时根据这个网络得到一个immediate reward, 用来指导selector选择.
TL module, 这个部分的输入是selector选中的样本, 这部分是用来通过验证集来给一个delayed reward来指导selector, 这个module的输入是选中的source数据和target数据, 这里embedding_layer和discriminator是共享的, 上层根据不同的业务场景是不一致的, 比如推荐就可以是2层FC. 文本匹配就是DAM.

标签：target,instance,Transfer,样本,Deep,source,TL,Learning,transfer
From： https://www.cnblogs.com/sunstrikes/p/17253054.html

指针常量和常量指针_C++_Learning1
怎么读？遇到"*"读指针，遇到"const"读常量一、指针常量//指针常量——指针(也就是它存储的地址)是一个常量，所以其值不能修改，但指向的内容可以修改 inta=10,b=......
Going Deeper With Directly-Trained Larger Spiking Neural Networks
郑重声明：原文参见标题，如有侵权，请联系作者，将会撤销发布！TheThirty-FifthAAAIConferenceonArtificialIntelligence(AAAI-21) Abstract脉冲神经网络（SNN）在时空......
CVPR论文解读《Learning To Count Everything》
密集场景下的目标检测与计数———CVPR论文解读《LearningToCountEverything》计数是我们经常会碰到的问题，使用最贴近我们生活实际的情景举例。例如统计上课已到教室......
02.Deep Reinforcement Learning for Quantitative Trading Challenges and Opportuni
DeepReinforcementLearningforQuantitativeTradingChallengesandOpportunities量化交易的深度强化学习：挑战与机遇---IEEE背景量化交易：量化交易是指借助现代统......
tv pine learning type system
类型系统分类formtypeTheformexpresseswhenavalueisknown.Thetypedenotesthenatureofavalue.form要表达的是当值是知道的（比如常量，或者用户输入决......
阿里云PAI-DeepRec CTR 模型性能优化天池大赛——获奖队伍技术分享
阿里云联合英特尔举办的“创新大师杯”全球AI极客挑战赛——PAI-DeepRecCTR模型性能优化挑战赛已结束，此次大赛旨在DeepRec中沉淀CTR模型新的优化思路和优化方向。为了和大......
Deepin 安装MongoDB Compass 1.35.0
deepin软件商店版本太低，从官网下载一个最新版本，手动安装分享一下安装过程MongoDBCompass下载地址使用deepin自带的软件包安装器，选择文件安装即可。由于无法指定目......
论文解读《KNN-Contrastive Learning for Out-of-Domain Intent Classification》
论文信息论文标题：KNN-ContrastiveLearningforOut-of-DomainIntentClassification论文作者：YunhuaZhou,PeijuLiu,XipengQiu论文来源：ArXiv2021论文地址：download......
LARGER LANGUAGE MODELS DO IN-CONTEXT LEARNING DIFFERENTLY
我们研究了语言模型中的上下文学习(ICL)如何受到语义先验和输入标签映射的影响。我们在不同的模型族(GPT-3、InstructGPT、Codex、PaLM和Flan-PaLM)中研究了两种设置—带有......
论文解读（DeepCluster）《Deep Clustering for Unsupervised Learning of Visual Feature
论文信息论文标题：DeepClusteringforUnsupervisedLearningofVisualFeatures论文作者：MathildeCaron,PiotrBojanowski,ArmandJoulin,MatthijsDouze论文来源：论......

Deep Transfer Learning综述阅读笔记

相关文章

赞助商

阅读排行