论文解读（MetaAdapt）《MetaAdapt: Domain Adaptive Few-Shot Misinformation Detection via Meta Learning》

时间：2023-08-23 22:23:20浏览次数：37

标签：Domain right mathcal boldsymbol MetaAdapt phi Detection quad theta

Note：[ wechat：Y466551 | 可加勿骚扰，付费咨询 ]

论文信息

论文标题：MetaAdapt: Domain Adaptive Few-Shot Misinformation Detection via Meta Learning
论文作者：Zhenrui Yue、Huimin Zeng、Yang Zhang、Lanyu Shang、Dong Wang
论文来源：2023 ACL
论文地址：download
论文代码：download
视屏讲解：click

1 介绍

　　出发点：域偏移导致的性能下降；

　　简介：为了解决数据稀缺性的问题，提出了一种基于元学习的领域自适应小样本错误信息检测方法。MetaAdapt 利用有限的目标例子来提供反馈，并指导从源领域到目标领域的知识转移。特别地，本文用多个源任务来训练初始模型，并计算它们与元任务的相似性得分。基于相似性得分，重新调整了元梯度，以自适应地从源任务中学习；

2 方法

模型框架：

场景：

　　小样本元域适应：源域带标记数据+目标域 k-shot 带标记数据；

2.1 MetaAdapt

　　双层优化目标（训练目标）：

　　　　$\underset{\boldsymbol{\theta}}{\text{min}}\frac{1}{n} \sum^{n} \mathcal{L}\left(\mathcal{A} l g\left(\boldsymbol{\theta}, \operatorname{Sampler}\left(\boldsymbol{X}_{s}\right)\right), \boldsymbol{X}_{t}^{\prime}\right) \quad\quad(1)$

　　内部优化目标（源域）：

　　　　$\mathcal{A} l g(\boldsymbol{\theta}, \boldsymbol{X})=\boldsymbol{\phi}=\boldsymbol{\theta}-\alpha \nabla_{\boldsymbol{\theta}} \mathcal{L}(\boldsymbol{\theta}, \boldsymbol{X}) \quad\quad(2)$

　　任务梯度（task gradient）：

　　　　$\text{task gradient}\doteq \phi_{i}-\theta \quad\quad(3)$

　　其中：

　　　　$\begin{array}{l}\phi &= \frac{d \mathcal{L}\left(\mathcal{A l g}(\boldsymbol{\theta}, \boldsymbol{X}), \boldsymbol{X}_{t}^{\prime}\right)}{d \boldsymbol{\theta}}\\&=\quad \frac{d \mathcal{A l g}(\boldsymbol{\theta}, \boldsymbol{X})}{d \boldsymbol{\theta}} \nabla_{\boldsymbol{\phi}} \mathcal{L}\left(\mathcal{A l g}(\boldsymbol{\theta}, \boldsymbol{X}), \boldsymbol{X}_{t}^{\prime}\right)\end{array}\quad\quad(4)$

　　元梯度（meta gradient）：

　　　　$\frac{d \phi_{i}}{d \boldsymbol{\theta}} \nabla_{\boldsymbol{\phi}_{i}} \mathcal{L}\left(\boldsymbol{\phi}_{i}, \boldsymbol{X}_{t}^{\prime}\right)$ 　　Note：二阶导数

　　假设：如果任务梯度和元梯度产生较高的相似性得分，则参数在内环和外环优化中都收敛到相同的方向；

　　假设源域上存在 $n$ 个任务，则得到 $n$ 个相似性得分：

　　　　$s_{i}=\operatorname{CosSim}\left(\phi_{i}-\boldsymbol{\theta}, \frac{d \boldsymbol{\phi}_{i}}{d \boldsymbol{\theta}} \nabla_{\boldsymbol{\phi}_{i}} \mathcal{L}\left(\boldsymbol{\phi}_{i}, \boldsymbol{X}_{t}^{\prime}\right)\right)\quad\quad(5)$

　　因此，计算相似性得分概率分布：

　　　　$s=\operatorname{softmax}\left(\left[\frac{s_{1}}{\tau}, \frac{s_{2}}{\tau}, \ldots, \frac{s_{n}}{\tau}\right]\right) \quad\quad(6)$

　　目标域参数的更新如下（任务相似性得分加权）：

　　　　$\boldsymbol{\theta}-\beta \sum_{i}^{n} s_{i} \cdot \frac{d \boldsymbol{\phi}_{i}}{d \boldsymbol{\theta}} \nabla_{\boldsymbol{\phi}_{i}} \mathcal{L}\left(\boldsymbol{\phi}_{i}, \boldsymbol{X}_{t}^{\prime}\right) \quad\quad(7)$

2.2 算法

3 实验

监督训练

小样本元域适应

大模型

鲁棒性研究

消融研究

标签：Domain,right,mathcal,boldsymbol,MetaAdapt,phi,Detection,quad,theta
From： https://www.cnblogs.com/BlairGrowing/p/17652322.html

Mixture-of-Domain-Adapters: Decoupling and Injecting Domain Knowledge to Pre-tra
1.Abstract经过预训练的语言模型（PLM）表现出在通用领域理解文本的出色能力，同时在特定领域中表现不佳。尽管在大型领域特定语料库上继续预训练是有效的，但调整领域上的所有参数是昂贵的。在本文中，我们研究了是否可以通过只调整几个参数来有效地调整PLM。具体来说，我们将Transformer架......
论文解读（KDSSDA）《Knowledge distillation for semi-supervised domain adaptation》
Note：[wechat：Y466551|可加勿骚扰，付费咨询]论文信息论文标题：Knowledgedistillationforsemi-supervised domainadaptation论文作者：MauricioOrbes-Arteaga, JorgeCardoso论文来源：2019aRxiv论文地址：download论文代码：download视屏讲解：click1介绍动机：在注释数......
论文解读（CTDA）《Contrastive transformer based domain adaptation for multi-source c
Note：[wechat：Y466551|可加勿骚扰，付费咨询]论文信息论文标题：Contrastivetransformerbaseddomainadaptationformulti-source cross-domainsentimentclassification论文作者：YanpingFu,YunLiu论文来源：2021aRxiv论文地址：download论文代码：download视屏讲解：click1......
论文解读（UDALM）《UDALM: Unsupervised Domain Adaptation through Language Modeling
Note：[wechat：Y466551|可加勿骚扰，付费咨询]论文信息论文标题：UDALM:UnsupervisedDomainAdaptationthroughLanguageModeling 论文作者：ConstantinosKarouzos,GeorgiosParaskevopoulos,AlexandrosPotamianos论文来源：2021aRxiv论文地址：download论文代码：download视屏......
论文解读（CBL）《CNN-Based Broad Learning for Cross-Domain Emotion Classification》
Note：[wechat：Y466551|付费咨询，非诚勿扰]论文信息论文标题：CNN-BasedBroadLearningforCross-DomainEmotionClassification论文作者：RongZeng,HongzhanLiu,SanchengPeng,LihongCao,AiminYang,ChengqingZong,GuodongZhou论文来源：2023aRxiv论文地址：download ......
论文解读（ECACL）《ECACL: A Holistic Framework for Semi-Supervised Domain Adaptation
Note：[wechat：Y466551|付费咨询，非诚勿扰]论文信息论文标题：ECACL:AHolisticFrameworkforSemi-SupervisedDomainAdaptation论文作者：KaiLi,ChangLiu,HandongZhao,YulunZhang,Y.Fu论文来源：2021ICCV论文地址：download 论文代码：download视屏讲解：click1介绍 ......
Focal Loss for Dense Object Detection
kaiming！！！神一样的存在！！！论文地址：https://arxiv.org/abs/1708.02002MXnet代码地址：https://github.com/miraclewkf/FocalLoss-MXNet知乎讨论：如何评价Kaiming的FocalLossforDenseObjectDetection？记得查看；http://www.sohu.com/a/225849848_473283论文内容摘要目前准确度最高的目标......
[3d object detection] BEVFormer
paper:BEVFormer:LearningBird's-Eye-ViewRepresentationfromMulti-CameraImagesviaSpatiotemporalTransformers,20221.Grid-shapedBEVqueriesWepredefineagroupofgrid-shapedlearnableparametersQ∈RH×W×CasthequeriesofBEVFormer,where......
论文解读（Moka‑ADA）《Moka‑ADA: adversarial domain adaptation with model‑orient
Note：[wechat：Y466551|可加勿骚扰，付费咨询]论文信息论文标题：Moka‑ADA:adversarialdomainadaptation withmodel‑orientedknowledgeadaptation forcross‑domainsentimentanalysis论文作者：MaoyuanZhangXiangLiFeiWu论文来源：2023aRxiv论文地址：download 论......
论文解读（MCD）《Maximum Classifier Discrepancy for Unsupervised Domain Adaptation》
Note：[wechat：Y466551|付费咨询，非诚勿扰]论文信息论文标题：MaximumClassifierDiscrepancyforUnsupervisedDomainAdaptation论文作者：KuniakiSaito,KoheiWatanabe,Y.Ushiku,T.Harada论文来源：2018CVPR论文地址：download论文代码：download视屏讲解：click1介绍 ......