首页 > 其他分享 >[CVPR2024]CDMAD Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Lea

[CVPR2024]CDMAD Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Lea

时间:2024-09-30 17:00:45浏览次数:7  
标签:偏置 right Semi 标签 Mismatch test theta Class left

Introduction

在不平衡数据集上训练的分类器往往对头部类(majority classes)有偏好。在半监督学习(semi-supervised learning,SSL) 设置下,生成伪标签的算法由于生成带偏置的伪标签,往往会进一步加剧偏置。带偏置的伪标签会降低表征学习质量。特别的,如果有标签集合和无标签集合的分布差异大,偏置将会变得更严重。

一部分不平衡SSL算法假设labeled set和unlabeled set分布一致,然而这种做法并不现实,例如数据集STL-10搜集了不同时期样本,导致类别分布不一致。一些算法,在主要的训练阶段不假设这种一致性,但在主要训练结束后使用额外的用于全监督不平衡学习的技术,如classifier retrain(cRT)和 logit-adjustment(LA)。

cRT仅使用了labeled set数据而无标签数据不参与其中。LA由于没有考虑无标签数据的分布,当labeled set与unlabeled set分布不一致时,不能很好的实现重平衡。

Motivation

不平衡半监督学习相关的论文都是提出一些组件,如新的分类器、调整logit,与一些经典的半监督学习框架结合。文中,作者为了让半监督框架更契合不平衡数据集,做出了改进。

  • FixMatch中,对于弱增强的预测标签,筛选阈值大于\(\tau\)的部分,选取预测值最大的类作为伪标签。
  • ReMixMatch对于伪标签生成增加了标签对齐操作:\(\tilde{q_b}=Normalize\left(q_b\times P_l\left(y\right)/q\left(y\right)\right)\)。其中\(q_b\)表示软标签,\(P_l\left(y\right)\)表示labeled set类别分布。\(q(y)\)表示前128个预测标签移动平均(moving average),Normalize表示标准化,然后再对对齐的伪标签锐化:\(\bar{q_b}=Normalize\left(\tilde{q_b}^{1/T}\right)\)。在文中,对于无标签数据分布未知的情况下不再使用分布对其。因为考虑到有标签/无标签数据分布不同的情况,这样可以防止低质量的伪标签的生成。
作者的方法基于观察,对于不含任何模式的图片(no pattern),文中用矩阵全1的白色图片表示。分类器对于它的预测应该是均匀的,然而时间情况是受不平衡影响,模型倾向于预测为头部类。

可以合理假设纯色图片不含任何被模型学习的特征。因此对它的预测偏置也反映了分类器的偏置。

Method

方法部分非常简单,使用\(g_\theta\left(\mathcal{I}\right)\)表示纯色图片的logits,一共在两个用到了它:

  1. 训练时的伪标签生成阶段:对于弱增强的预测logits:\(g_\theta\left(\alpha\left(u_b^m\right)\right)\)减去偏置:\(g_\theta^*\left(\alpha\left(u_b^m\right)\right)=g_\theta\left(\alpha\left(u_b^m\right)\right)-g_\theta\left(\mathcal{I}\right)\),再softmax得到伪标签:\(q_b^*=\phi\left(g_\theta^*\left(\alpha\left(u_b^m\right)\right)\right)\)

  2. 测试时的logit调整阶段:\(g_\theta^*\left(x_k^{test}\right)=g_\theta\left(x_k^{test}\right)-g_\theta\left(\mathcal{I}\right)\),得到最后的标签\(f_\theta^*\left(x_k^{test}\right)=\arg\max_cg_\theta^*\left(x_k^{test}\right)_c\)。这里作者和logits adjustment方法\(g_\theta^*\left(x_k^{test}\right)=g_\theta\left(x_k^{test}\right)-\log\pi\)进行了比较,可以看作是LA的扩展:\(g_\theta\left(\mathcal{I}\right)+constant = \log P_\theta\left(y|\mathcal{I}\right)\)。因此符合Fisher一致性,可以最小化平衡误差。

在实验部分,作者把用到的纯白图片替换为其他分布(Uniform、Bernoulli、Normal)随机生成、和其他颜色的图片,以及非图片(值在[0,255]之外的矩阵),比较。结果性能比较:非图片>白色>其他颜色>其他分布。

参考文献

  1. Sohn, Kihyuk, et al. "Fixmatch: Simplifying semi-supervised learning with consistency and confidence." Advances in neural information processing systems 33 (2020): 596-608.
  2. David Berthelot, Nicholas Carlini, Ekin D Cubuk, Alex Kurakin, Kihyuk Sohn, Han Zhang, and Colin Raffel. Remixmatch: Semi-supervised learning with distribution matching and augmentation anchoring. In International Conference on Learning Representations, 2020.
  3. Lee, Hyuck, and Heeyoung Kim. "CDMAD: Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Learning." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2024.

标签:偏置,right,Semi,标签,Mismatch,test,theta,Class,left
From: https://www.cnblogs.com/zh-jp/p/18442170

相关文章

  • C++ struct和class的异同、C中和C++中struct的异同
    一、前言C++中的struct结构体和C语言中的struct结构体差异较大。C++中的struct结构体和C++中的class类极为相似。二、C++的struct和class1.相同点      (1)成员     struct和class都可以在主体中定义成员变量和成员函数!两者在定义成员变量和成员函数上......
  • Java如何将Object转换成指定Class对象
    在Java中,将Object转换为指定类型的Class对象实际上是两个不同概念的操作:将Object实例转换为特定类型的实例:这通常涉及到类型转换(如(MyType)myObject)或者通过反射机制(Class.cast(Object))来进行。获取特定类型的Class对象:这可以通过.class语法或Class.forName(StringclassName)......
  • Pruning Large Language Models with Semi-Structural Adaptive Sparse Training
    本文是LLM系列文章,针对《PruningLargeLanguageModelswithSemi-StructuralAdaptiveSparseTraining》的翻译。通过半结构化自适应稀疏训练修剪大型语言模型摘要1引言2相关工作3方法4实验5结论摘要大型语言模型(LLM)在各种复杂任务中的巨大成功在很......
  • 学习011-03-01 Business Classes vs Database Tables(业务类与数据库表)
    BusinessClassesvsDatabaseTables(业务类与数据库表)TheXAFisbasedonanobject-baseddatahandlingapproach.Inthistopic,wediscussthereasonswhythisapproach,asopposedtotherelationalmodelofdatahandling,waschosen.Themethodsthatal......
  • 学习011-03-02 Base Persistent Classes(基本持久化类)
    BasePersistentClasses(基本持久化类)ThistopicdescribesthebasepersistentclassesthatcanbeusedinXAFapplicationswhencreatingadatamodelwithXPO.本主题介绍在使用XPO创建数据模型时可在XAF应用程序中使用的基本持久类。Thefollowingtablelists......
  • semi-sync原主库加入集群阻塞问题分析
    问题现象客户在一个一主两从的半同步复制环境下做了手工切换,然后尝试把原主库加入集群中,结果发现新集群中的数据一直无法同步到slave(原主库)中来,查看slave(原主库)同步状态,IO线程和SQL线程都是YES状态,但是Seconds_Behind_Master大于0.查看showprocesslist状态,发现SQL线程一......
  • 易优CMS致命错误,请联系技术支持:Class -eyoucms
    当你在云插件商城中直接安装插件时,如果遇到“致命错误,请联系技术支持:Class'ZipArchive'notfound”的提示,这通常意味着PHP环境中缺少Zip扩展,或者是该扩展没有被正确启用。Zip扩展是用于处理ZIP文件的PHP扩展,在安装插件或其他需要解压缩ZIP文件的功能时,它是必需的。......
  • laravel: 报错: Target class [view] does not exist.
    一,报错信息:NextIlluminate\\Contracts\\Container\\BindingResolutionException:Targetclass[view]doesnotexist.in/web/api/vendor/laravel/framework/src/Illuminate/Container/Container.php:940Stacktrace:#0/web/api/vendor/laravel/framework/src/Il......
  • MT5016A-ASEMI三相整流桥MT5016A
    编辑:llMT5016A-ASEMI三相整流桥MT5016A型号:MT5016A品牌:ASEMI封装:D-63批号:2024+类型:三相整流桥电流(ID):50A电压(VF):1600V安装方式:直插式封装特性:大功率、整流方桥产品引线数量:4产品内部芯片个数:4产品内部芯片尺寸:MIL工作结温:-55℃~150℃功率:大功率包装方式:500/盒:3000/箱MT5016A应用领......
  • MT5016A-ASEMI三相整流桥MT5016A
    编辑:llMT5016A-ASEMI三相整流桥MT5016A型号:MT5016A品牌:ASEMI封装:D-63批号:2024+类型:三相整流桥电流(ID):50A电压(VF):1600V安装方式:直插式封装特性:大功率、整流方桥产品引线数量:4产品内部芯片个数:4产品内部芯片尺寸:MIL工作结温:-55℃~150℃功率:大功率包装方式:500/盒:3000......