首页 > 其他分享 >[CVPR2022]DASO Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced Semi-Supervised Lea

[CVPR2022]DASO Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced Semi-Supervised Lea

时间:2024-08-09 20:39:45浏览次数:18  
标签:Semi 标签 Pseudo Aware 语义 mathcal prototype hat mathrm

问题的背景设置:半监督学习下,labeled data和unlabeled data的分布不同,且存在类别不平衡。文章提出了一种新的伪标签生成方法:DistributionAware Semantics-Oriented (DASO) Pseudo-label。首先生成语义伪标签和线性为标签,然后将它们混合实现互补。

另外作者的方法不需要估计无标签数据的先验、也不需要假设labeled/unlabeled data 分布一致的假设。

  • 线性分类器(linear classifier):通过fc layer实现。
  • 语义分类器(semantic classifier):通过衡量表征间的相似性(如prototype)实现。

作者方法的提出基于观察:基于语义的分类器分配的语义伪标签倾向于少数类,这与线性分类器得到的线性伪标签表现相反。

对于两种伪标签的混合权重也需要调整。具体来说,需要根据当前伪标签分布,调整语义伪标签权重,使得减少对线性伪标签的偏置。

DASO伪标签框架

线性伪标签:\(\hat{p}\);语义伪标签:\(\hat{q}\);两者最终的结合标签:\(\hat{p}'\)。

线性伪标签直接通过linear + softmax 获取;而语义伪标签需要先计算每个类的prototype。

对于每个类的prototype,定义为\(\mathbf{C}=\{c_k\}_{k=1}^K\),并为每个类准备一个先进先出的记忆队列\(\mathbf{Q}=\{Q_k\}_{k=1}^K\),每个类的队列长度为\(|Q_{k}|\)。每个类的prototype为对列内的特征均值,并在每个训练的step,push新的特征,当队列满时,pop最早的特征。

为了避免数据不平衡对prototype的影响,提出两种策略:1、对于每个类的队列上限保持一致;2、使用exponential moving average (EMA)更新提取用于prototype特征的model:$\theta'\leftarrow\rho\theta'+(1-\rho)\theta $降低模型的更新速度(此处的模型是额外引入的模型,仅用于提取特征,不同于框架其他地方使用的模型)。

语义伪标签计算公式为

\[q={\rm softmax}({\rm sim}(z,\mathbf{C}) / T_{\mathrm{proto}}) \]

其中sim表示余弦相似度。最后的伪标签为:

\[\hat{p}'=(1-v_{k'}) \hat{p}+v_{k'}\hat{q} \]

最后的综合伪标签为:

\[\hat{p}'=(1-v_{k'}) \hat{p}+v_{k'}\hat{q} \]

其中\(v = \{v_{k}\}_{k=1}^{K}\)为分布感知权重,防止\(\hat{p}\)过于偏向头部类,\(v_{k} = \frac{1}{\max_{k} \hat{m}_{k}^{1/T_{\mathrm{dist}}}} \left(\hat{m}_{k}^{1/T_{\mathrm{dist}}}\right)\),\(\hat{m}\)表示归一化后的伪标签分布。当线性伪标签\(\hat{p}\)预测为头部类,如果偏置较大,就会有更多的语义伪标签\(\hat{q}\)被混合进来。

无标签数据的预测:\(p=f(\mathcal{A}_s(u))\),这里\(\mathcal{A}_s\)表示强图像增强,并将预测结果与最后的伪标签计算损失\(\mathcal{L}_{u}=\Phi_u(\hat{p}, p)=\mathbb{I}\left(\max_kp_k\geq\tau\right)\mathcal{H}\left(\hat{p},p\right)\),\(\mathcal{H}\)表示交叉熵。

为了保证表征更平衡,作者模仿了FixMatch的一致性正则:

\[\mathcal{L}_{\mathrm{align}}=\mathcal{H}\left(\hat{q}, q^{(s)}\right) \]

这里\(q^{(s)}\)是通过强图像增强后提取表征使用语义相似度分类器+softmax 后的得到的结果。最后总的损失为:

\[\mathcal{L}_{\mathrm{DASO}}=\mathcal{L}_{\mathrm{cls}}+\lambda_u\mathcal{L}_u+\lambda_{\mathrm{align}}\mathcal{L}_{\mathrm{align}} \]

这里\(\mathcal{L}_u\)使用的标签为混合伪标签,而\(\mathcal{L}_u, \mathcal{L}_{cls}\)损失函数的定义由相应的半监督学习框架决定。作者的伪标签生成框架以及\(\mathcal{L}_{align}\)适合于其他半监督学习框架。

参考文献

  1. Oh, Youngtaek, Dong-Jin Kim, and In So Kweon. "Daso: Distribution-aware semantics-oriented pseudo-label for imbalanced semi-supervised learning." Proceedings of the IEEE/CVF conference on computer vision and pattern recognition. 2022.

标签:Semi,标签,Pseudo,Aware,语义,mathcal,prototype,hat,mathrm
From: https://www.cnblogs.com/zh-jp/p/18351456

相关文章

  • SB3045LFCT-ASEMI无人机专用SB3045LFCT
    编辑:llSB3045LFCT-ASEMI无人机专用SB3045LFCT型号:SB3045LFCT品牌:ASEMI封装:TO-220F批号:最新最大平均正向电流(IF):30A最大循环峰值反向电压(VRRM):45V最大正向电压(VF):0.60V~0..95V工作温度:-65°C~150°C反向恢复时间:35ns芯片个数:2芯片尺寸:74mil引脚数量:3正向浪涌电流(IFMS):250......
  • 10V45-ASEMI超低Low VF值肖特基二极管10V45
    编辑:ll10V45-ASEMI超低LowVF值肖特基二极管10V45型号:10V45品牌:ASEMI封装:TO-277批号:最新恢复时间:35ns最大平均正向电流(IF):10A最大循环峰值反向电压(VRRM):45V最大正向电压(VF):0.28V~0.42V工作温度:-55°C~150°C芯片个数:1芯片尺寸:mil正向浪涌电流(IFMS):200A10V45特性:低正向......
  • MMBT3906-ASEMI低压PNP开关三极管MMBT3906
    编辑:llMMBT3906-ASEMI低压PNP开关三极管MMBT3906型号:MMBT3906品牌:ASEMI批号:2024+封装:SOT-23三极管类型:PNP集电极电流(Ic):200mA集射极击穿电压(Vceo):40V安装方式:表贴式封装特性:NPN晶体管、三极管、40V硅晶体管产品引线数量:3产品内部芯片个数:1产品内部芯片尺寸:MIL工作......
  • MMBT3904-ASEMI低压NPN三极管MMBT3904
    编辑:llMMBT3904-ASEMI低压NPN三极管MMBT3904型号:MMBT3904品牌:ASEMI封装:SOT-23批号:2024+三极管类型:NPN集电极电流(Ic):200mA集射极击穿电压(Vceo):40V安装方式:表贴式封装特性:NPN晶体管、三极管、40V硅晶体管产品引线数量:3产品内部芯片个数:1产品内部芯片尺寸:MIL工作结温......
  • spring bean生命周期中BeanNameAware、BeanFactoryAware或ApplicationContextAwar
    BeanNameAware、BeanFactoryAware和ApplicationContextAware是Spring框架中提供的三个Aware接口,它们允许Bean在生命周期的特定阶段获取关于自身或容器的信息。以下是关于这三个Aware接口的详细解释:1.BeanNameAware定义与功能:BeanNameAware接口允许Bean获取自己在Spring......
  • 简单了解下Spring中的各种Aware接口实现依赖注入
    你好,这里是codetrend专栏“Spring6全攻略”。在Spring框架中,Aware接口是一组用于提供特定资源或环境信息的回调接口。这些接口被设计用来允许Bean获取对Spring容器或其他相关资源的引用,并在需要时进行适当的处理。Aware接口的设计是为了让Bean能够感知到其所处的环境并与之交互......
  • Context-Aware Safe Medication Recommendations with Molecular Graph and DDI Graph
    这篇文章是2023年AAAI会议上的一篇论文,主要是利用分子图和DDI图嵌入来提供上下文感知信息,从而进行安全药物推荐。链接Context-AwareSafeMedicationRecommendationswithMolecularGraphandDDIGraphEmbedding|ProceedingsoftheAAAIConferenceonArtificialInt......
  • Spring源码(四) Aware 接口
    Aware接口:Aware接口是Spring提供的一组标记接口,表示bean可以通过回调方法从Spring容器接收特定框架对象的通知。publicinterfaceAware{}Spring提供了大量以Aware命名的接口,如BeanNameAware、BeanFactoryAware、ApplicationContextAware等。这些接口定义了回调方......
  • 深入探索SemiDrive E3系列的MCU SSDK
    SemiDriveE3 系列MCUSSDK :XIP模式一、 前言本文介绍基于SSDK3.0调试XIP运行模式。硬件平台:芯驰E3_LQFP176_E3200_A03_048开发板软件平台:SemiDriveSSDK3.0二、 模式简介SFCore的程序XIP运行在FLASH上,XIP程序启动前,需先在IRAM中运行SFCore......
  • MBR60200PT-ASEMI无人机专用MBR60200PT
    编辑:llMBR60200PT-ASEMI无人机专用MBR60200PT型号:MBR60200PT品牌:ASEMI封装:TO-247批号:最新恢复时间:35ns最大平均正向电流(IF):60A最大循环峰值反向电压(VRRM):200V最大正向电压(VF):0.85V~0.90V工作温度:-40°C~175°C芯片个数:2芯片尺寸:mil正向浪涌电流(IFMS):500AMBR60200PT特性:......