首页 > 其他分享 >论文解读(APCA)《Adaptive prototype and consistency alignment for semi-supervised domain adaptation》

论文解读(APCA)《Adaptive prototype and consistency alignment for semi-supervised domain adaptation》

时间:2023-08-02 17:35:56浏览次数:39  
标签:mathbb domain right mathbf semi APCA quad mathcal left

[ Wechat:Y466551 | 付费咨询,非诚勿扰 ]

论文信息

论文标题:Adaptive prototype and consistency alignment for semi-supervised domain adaptation
论文作者:Jihong Ouyang、Zhengjie Zhang、Qingyi Meng
论文来源:2023 aRxiv
论文地址:download 
论文代码:download
视屏讲解:click

1 介绍 

  

2 问题定义

  Formally, the semi-supervised domain adaptation scenario constitutes a labeled source domain  $\mathcal{D}_{s}=\left\{\left(x_{i}^{s}, y_{i}^{s}\right)\right\}_{i=1}^{n_{s}}$  drawn from the distribution  $P$ . For the target domain, a labeled set  $\mathcal{D}_{t}=\left\{\left(x_{i}^{t}, y_{i}^{t}\right)\right\}_{i=1}^{n_{t}}$  and an unlabeled set  $\mathcal{D}_{u}=\left\{x_{i}^{u}\right\}_{i=1}^{n_{u}}$  drawn from distribution  $Q$  are given. The source and target domain are drawn from the same label space  $y=\{1,2, \ldots, K\}$ . Usually, the number of labeled samples in  $\mathcal{D}_{t}$  is minimal, e.g., one or three samples per class. SSDA aims to train the model on  $\mathcal{D}_{s}$, $\mathcal{D}_{t}$  and  $\mathcal{D}_{u}$  to correctly predict labels for samples in  $\mathcal{D}_{u} $.

3 方法

3.1 模型框架

  

3.2 Supervised training

  原型分类器(浅层):     $\mathbf{p}(\mathbf{x})=\sigma\left(\frac{\mathbf{W}^{\mathrm{T}} \ell_{2}(F(\mathbf{x}))}{T}\right)  \quad\quad(1)$    源域和目标域带标签监督训练:     $\mathcal{L}_{C E}=-\mathbb{E}_{(\mathbf{x}, y) \in \mathcal{D}_{s}, \mathcal{D}_{t}} y \log (\mathbf{p}(\mathbf{x}))  \quad\quad(2)$

3.3 Adaptive prototype alignment

  利用目标域代标记数据计算原型:

    $\mathbf{c}_{k}^{\mathcal{T}}=\frac{1}{\left|\mathcal{D}_{k}\right|} \sum_{\left(x_{i}^{t}, y_{i}^{t}\right) \in \mathcal{D}_{k}} F\left(x_{i}^{t}\right)\quad\quad(3)$

  利用目标域未带标记的数据计算原型(mini-batch级别):

    $c_{k}^{u}=\frac{\sum_{i \in B_{t}} \mathbb{1}_{\left[k=\hat{y}_{i}\right]} F\left(x_{i}^{u}\right)}{\sum_{i \in B_{t}} \mathbb{1}_{\left[k=\hat{y}_{i}\right]}}\quad\quad(4)$

  Note:目标域未带标记样本使用分类器给出伪标签;

    $c_{k(m)}^{\mathcal{U}}=\eta c_{k}^{u}+(1-\eta) c_{k(m-1)}^{\mathcal{U}}\quad\quad(5)$

  利用 EMA 修改用目标域未带标记样本计算的原型:

    $c_{k(m)}^{\mathcal{U}}=\eta c_{k}^{u}+(1-\eta) c_{k(m-1)}^{\mathcal{U}}\quad\quad(6)$

  目标域总的原型:

    $c_{k}=\frac{\mathbf{c}_{k}^{\mathcal{T}}+c_{k(m)}^{\mathcal{U}}}{2}\quad\quad(7)$

  对于源域带标记数据,可以通过目标类原型距离函数得到概率分布如下:

    $p(y \mid x)=\frac{e^{-d\left(F(x), c_{y}\right)}}{\sum_{k} e^{-d\left(F(x), c_{k}\right)}}\quad\quad(8)$

  然后,计算总体源样本的原型损失如下:

    $\mathcal{L}_{A P A}=-\mathbb{E}_{\left(x_{i}^{s}, y_{i}^{s}\right) \in \mathcal{D}_{s}} \log p\left(y_{i}^{s} \mid x_{i}^{s}\right)\quad\quad(9)$

  小结阐述:使用目标域数据(带、不带标记)计算目标域原型,然后预测源域样本的类别,并使用源域标签做监督;

3.4 Consistency alignment

  如模型框架图所示,目标域未带标记数据被分为弱、强数据增强样本,对于弱数据增强样本,使用分类器得到硬标签,并计算交叉熵(基于阈值$\gamma$):

    $\left.\ell_{c r}=-\mathbb{1}\left(\max \left(\mathbf{p}_{w}\right)>\tau\right) \log \mathbf{p}\left(y=\hat{p} \mid \mathcal{S}\left(x_{i}^{u}\right)\right)\right)\quad\quad(10)$

  为了避免过拟合,使用多样性损失:

    $\ell_{k l d}=-\mathbb{1}\left(\max \left(\mathbf{p}_{w}\right)>\tau\right) \sum_{k=1}^{C} \frac{1}{C} \log \mathbf{p}\left(y=k \mid \mathcal{S}\left(x_{i}^{u}\right)\right)\quad\quad(11)$

  Note:KLD正则化鼓励预测结果接近均匀分布,从而使预测结果不会过拟合伪标签。

  因此,一致性对齐模块的整体损失函数可以表示如下:

    $\mathcal{L}_{C O N}=\mathbb{E}_{x_{i}^{u} \in \mathcal{D}_{u}}\left(\ell_{c r}+\lambda_{k l d} \ell_{k l d}\right)\quad\quad(12)$

3.5 Overall framework and training objective

  本文方法是基于MME [45]的,它采用对抗性学习来改进域间自适应的样本特征对齐。将MME[45]中提到的熵损失纳入到本文的损失函数中。总体损失函数是上述损失函数的和,如下:

    $\theta_{\mathcal{F}}=\underset{\theta_{\mathcal{F}}}{\arg \min } \mathcal{L}_{C E}+\mathcal{L}_{H}+\lambda_{1} \mathcal{L}_{A P A}+\lambda_{2} \mathcal{L}_{C O N}\quad\quad(13)$

    $\theta_{\mathcal{C}}=\underset{\theta_{\mathcal{A}}}{\arg \min } \mathcal{L}_{C E}-\mathcal{L}_{H}+\lambda_{1} \mathcal{L}_{A P A}+\lambda_{2} \mathcal{L}_{C O N}$

  其中:

    $\mathcal{L}_{H}=-\mathbb{E}_{x_{i}^{u} \in \mathcal{D}_{u}} \sum_{i=1}^{K} p\left(y=i \mid x_{i}^{u}\right) \log p\left(y=i \mid x_{i}^{u}\right)$

3.6 算法框架

  

4 实验

分类准确度

  

参数敏感性

  

  

消融实验

  

标签:mathbb,domain,right,mathbf,semi,APCA,quad,mathcal,left
From: https://www.cnblogs.com/BlairGrowing/p/17600289.html

相关文章

  • 论文解读()《Cluster Alignment with a Teacher for Unsupervised Domain Adaptation》
    Note:[wechat:Y466551|付费咨询,非诚勿扰]论文信息论文标题:ClusterAlignmentwithaTeacherforUnsupervisedDomainAdaptation论文作者:ZhijieDeng,YucenLuo,JunZhu论文来源:2020ICCV论文地址:download 论文代码:download视屏讲解:click1介绍     2方法2.......
  • dnsdomainname
    dnsdomainname定义DNS系统中FQDN名称的域名补充说明dnsdomainname命令用于定义DNS系统中FQDN名称中的域名。语法dnsdomainname(选项)选项-v:详细信息模式,输出指令执行的详细信息。实例[root@AY1307311912260196fcZ~]#dnsdomainname-vgethostname()=`AY130731191226......
  • domainname
    domainname显示和设置系统的NIS域名补充说明domainname命令用于显示和设置系统的NIS域名。语法domainname(选项)(参数)选项-v:详细信息模式;-F:指定读取域名信息的文件。参数NIS域名:指定要设置的NIS域名。实例[root@AY1307311912260196fcZ~]#domainname-vgetdomai......
  • 什么是编程领域的 DSL - Domain Specific Language
    在编程领域中,DomainSpecificLanguage(DSL)是一种特定于特定问题领域的计算机语言,设计用于解决该领域的特定类型的问题。DSL的设计目标通常包括提高生产力,使非程序员可以使用,以及提供特定类型的语言构造。DSL与通用编程语言(GPL)相对,GPL如Python、Java等,可以用于解决各种类型的问题。......
  • SFP6012-ASEMI代理海矽美(MHCHXM)快恢复二极管
    编辑:llSFP6012-ASEMI代理海矽美(MHCHXM)快恢复二极管型号:SFP6012品牌:ASEMI芯片个数:2芯片尺寸:102MIL*2封装:TO-247AB恢复时间:75ns工作温度:-40°C~175°C浪涌电流:300A正向电流:60A反向耐压:1200V正向压降:2.4V引脚数量:3漏电流:>10uaSFP6012二极管特性:SFP6012-ASEMI代理海矽美快恢复二极管广泛......
  • SFP6012-ASEMI代理海矽美(MHCHXM)快恢复二极管
    编辑:llSFP6012-ASEMI代理海矽美(MHCHXM)快恢复二极管型号:SFP6012品牌:ASEMI芯片个数:2芯片尺寸:102MIL*2封装:TO-247AB恢复时间:75ns工作温度:-40°C~175°C浪涌电流:300A正向电流:60A反向耐压:1200V正向压降:2.4V引脚数量:3漏电流:>10uaSFP6012二极管特性:SFP6012-ASEMI代理海矽......
  • SFP6012A-ASEMI代理海矽美快恢复二极管参数、尺寸、规格
    编辑:llSFP6012A-ASEMI代理海矽美快恢复二极管参数、尺寸、规格型号:SFP6012A品牌:ASEMI封装:TO-247AC恢复时间:100ns正向电流:60A反向耐压:1200V芯片大小:102MIL*2芯片个数:1引脚数量:2类型:快恢复二极管特性:快恢复浪涌电流:500A正向压降:2.4V封装尺寸:如图工作温度:-40°C~175°C产品尺寸大小:总......
  • SFP6012A-ASEMI代理海矽美快恢复二极管参数、尺寸、规格
    编辑:llSFP6012A-ASEMI代理海矽美快恢复二极管参数、尺寸、规格型号:SFP6012A品牌:ASEMI封装:TO-247AC恢复时间:100ns正向电流:60A反向耐压:1200V芯片大小:102MIL*2芯片个数:1引脚数量:2类型:快恢复二极管特性:快恢复浪涌电流:500A正向压降:2.4V封装尺寸:如图工作温度:-40°C~175......
  • MUR2080CT- ASEMI二极管的特性和应用
    编辑-Z本文将详细介绍MUR2080CT二极管的特性和应用。首先,将介绍MUR2080CT二极管的基本结构和工作原理。然后,将探讨MUR2080CT二极管的特性,包括正向电压降、反向漏电流和反向恢复时间等。接下来,将介绍MUR2080CT二极管在电源、开关电路和逆变器等领域的应用。最后,将总结MUR2080CT二......
  • ASEMI快恢复二极管MUR2080CTR封装, MUR2080CTR图片
    编辑-ZMUR2080CTR参数描述:型号:MUR2080CTR最大峰值反向电压(VRRM):800V最大RMS电压(VRMS):430V最大直流阻断电压VR(DC):800V平均整流正向电流(IF):20A非重复峰值浪涌电流(IFSM):150A工作接点温度和储存温度(TJ,Tstg):-55to+150℃最大热阻(RθJC):3℃/W正向电压(VF):2V最大瞬......