[CVPR2024]CDMAD Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Lea

时间：2024-09-30 17:00:45浏览次数：7

标签：偏置 right Semi 标签 Mismatch test theta Class left

Introduction

在不平衡数据集上训练的分类器往往对头部类（majority classes）有偏好。在半监督学习（semi-supervised learning，SSL）设置下，生成伪标签的算法由于生成带偏置的伪标签，往往会进一步加剧偏置。带偏置的伪标签会降低表征学习质量。特别的，如果有标签集合和无标签集合的分布差异大，偏置将会变得更严重。

一部分不平衡SSL算法假设labeled set和unlabeled set分布一致，然而这种做法并不现实，例如数据集STL-10搜集了不同时期样本，导致类别分布不一致。一些算法，在主要的训练阶段不假设这种一致性，但在主要训练结束后使用额外的用于全监督不平衡学习的技术，如classifier retrain(cRT)和 logit-adjustment(LA)。

cRT仅使用了labeled set数据而无标签数据不参与其中。LA由于没有考虑无标签数据的分布，当labeled set与unlabeled set分布不一致时，不能很好的实现重平衡。

Motivation

不平衡半监督学习相关的论文都是提出一些组件，如新的分类器、调整logit，与一些经典的半监督学习框架结合。文中，作者为了让半监督框架更契合不平衡数据集，做出了改进。

FixMatch中，对于弱增强的预测标签，筛选阈值大于\(\tau\)的部分，选取预测值最大的类作为伪标签。

ReMixMatch对于伪标签生成增加了标签对齐操作：\(\tilde{q_b}=Normalize\left(q_b\times P_l\left(y\right)/q\left(y\right)\right)\)。其中\(q_b\)表示软标签，\(P_l\left(y\right)\)表示labeled set类别分布。\(q(y)\)表示前128个预测标签移动平均（moving average），Normalize表示标准化，然后再对对齐的伪标签锐化：\(\bar{q_b}=Normalize\left(\tilde{q_b}^{1/T}\right)\)。在文中，对于无标签数据分布未知的情况下不再使用分布对其。因为考虑到有标签/无标签数据分布不同的情况，这样可以防止低质量的伪标签的生成。

作者的方法基于观察，对于不含任何模式的图片（no pattern），文中用矩阵全1的白色图片表示。分类器对于它的预测应该是均匀的，然而时间情况是受不平衡影响，模型倾向于预测为头部类。

可以合理假设纯色图片不含任何被模型学习的特征。因此对它的预测偏置也反映了分类器的偏置。

Method

方法部分非常简单，使用\(g_\theta\left(\mathcal{I}\right)\)表示纯色图片的logits，一共在两个用到了它：

训练时的伪标签生成阶段：对于弱增强的预测logits：\(g_\theta\left(\alpha\left(u_b^m\right)\right)\)减去偏置：\(g_\theta^*\left(\alpha\left(u_b^m\right)\right)=g_\theta\left(\alpha\left(u_b^m\right)\right)-g_\theta\left(\mathcal{I}\right)\)，再softmax得到伪标签：\(q_b^*=\phi\left(g_\theta^*\left(\alpha\left(u_b^m\right)\right)\right)\)
测试时的logit调整阶段：\(g_\theta^*\left(x_k^{test}\right)=g_\theta\left(x_k^{test}\right)-g_\theta\left(\mathcal{I}\right)\)，得到最后的标签\(f_\theta^*\left(x_k^{test}\right)=\arg\max_cg_\theta^*\left(x_k^{test}\right)_c\)。这里作者和logits adjustment方法\(g_\theta^*\left(x_k^{test}\right)=g_\theta\left(x_k^{test}\right)-\log\pi\)进行了比较，可以看作是LA的扩展：\(g_\theta\left(\mathcal{I}\right)+constant = \log P_\theta\left(y|\mathcal{I}\right)\)。因此符合Fisher一致性，可以最小化平衡误差。

在实验部分，作者把用到的纯白图片替换为其他分布（Uniform、Bernoulli、Normal）随机生成、和其他颜色的图片，以及非图片（值在[0,255]之外的矩阵），比较。结果性能比较：非图片>白色>其他颜色>其他分布。

参考文献

Sohn, Kihyuk, et al. "Fixmatch: Simplifying semi-supervised learning with consistency and confidence." Advances in neural information processing systems 33 (2020): 596-608.
David Berthelot, Nicholas Carlini, Ekin D Cubuk, Alex Kurakin, Kihyuk Sohn, Han Zhang, and Colin Raffel. Remixmatch: Semi-supervised learning with distribution matching and augmentation anchoring. In International Conference on Learning Representations, 2020.
Lee, Hyuck, and Heeyoung Kim. "CDMAD: Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Learning." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2024.

标签：偏置,right,Semi,标签,Mismatch,test,theta,Class,left
From： https://www.cnblogs.com/zh-jp/p/18442170

C++ struct和class的异同、C中和C++中struct的异同
一、前言C++中的struct结构体和C语言中的struct结构体差异较大。C++中的struct结构体和C++中的class类极为相似。二、C++的struct和class1.相同点（1）成员 struct和class都可以在主体中定义成员变量和成员函数！两者在定义成员变量和成员函数上......
Java如何将Object转换成指定Class对象
在Java中，将Object转换为指定类型的Class对象实际上是两个不同概念的操作：将Object实例转换为特定类型的实例：这通常涉及到类型转换（如(MyType)myObject）或者通过反射机制（Class.cast(Object)）来进行。获取特定类型的Class对象：这可以通过.class语法或Class.forName(StringclassName)......
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training
本文是LLM系列文章，针对《PruningLargeLanguageModelswithSemi-StructuralAdaptiveSparseTraining》的翻译。通过半结构化自适应稀疏训练修剪大型语言模型摘要1引言2相关工作3方法4实验5结论摘要大型语言模型（LLM）在各种复杂任务中的巨大成功在很......
学习011-03-01 Business Classes vs Database Tables（业务类与数据库表）
BusinessClassesvsDatabaseTables（业务类与数据库表）TheXAFisbasedonanobject-baseddatahandlingapproach.Inthistopic,wediscussthereasonswhythisapproach,asopposedtotherelationalmodelofdatahandling,waschosen.Themethodsthatal......
学习011-03-02 Base Persistent Classes（基本持久化类）
BasePersistentClasses（基本持久化类）ThistopicdescribesthebasepersistentclassesthatcanbeusedinXAFapplicationswhencreatingadatamodelwithXPO.本主题介绍在使用XPO创建数据模型时可在XAF应用程序中使用的基本持久类。Thefollowingtablelists......
semi-sync原主库加入集群阻塞问题分析
问题现象客户在一个一主两从的半同步复制环境下做了手工切换，然后尝试把原主库加入集群中，结果发现新集群中的数据一直无法同步到slave（原主库）中来，查看slave（原主库）同步状态，IO线程和SQL线程都是YES状态，但是Seconds_Behind_Master大于0.查看showprocesslist状态,发现SQL线程一......
易优CMS致命错误，请联系技术支持：Class -eyoucms
当你在云插件商城中直接安装插件时，如果遇到“致命错误，请联系技术支持：Class'ZipArchive'notfound”的提示，这通常意味着PHP环境中缺少Zip扩展，或者是该扩展没有被正确启用。Zip扩展是用于处理ZIP文件的PHP扩展，在安装插件或其他需要解压缩ZIP文件的功能时，它是必需的。......
laravel: 报错: Target class [view] does not exist.
一，报错信息：NextIlluminate\\Contracts\\Container\\BindingResolutionException:Targetclass[view]doesnotexist.in/web/api/vendor/laravel/framework/src/Illuminate/Container/Container.php:940Stacktrace:#0/web/api/vendor/laravel/framework/src/Il......
MT5016A-ASEMI三相整流桥MT5016A
编辑：llMT5016A-ASEMI三相整流桥MT5016A型号：MT5016A品牌：ASEMI封装：D-63批号：2024+类型：三相整流桥电流（ID）：50A电压(VF)：1600V安装方式：直插式封装特性：大功率、整流方桥产品引线数量：4产品内部芯片个数：4产品内部芯片尺寸：MIL工作结温：-55℃~150℃功率：大功率包装方式：500/盒：3000/箱MT5016A应用领......
MT5016A-ASEMI三相整流桥MT5016A
编辑：llMT5016A-ASEMI三相整流桥MT5016A型号：MT5016A品牌：ASEMI封装：D-63批号：2024+类型：三相整流桥电流（ID）：50A电压(VF)：1600V安装方式：直插式封装特性：大功率、整流方桥产品引线数量：4产品内部芯片个数：4产品内部芯片尺寸：MIL工作结温：-55℃~150℃功率：大功率包装方式：500/盒：3000......

[CVPR2024]CDMAD Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Lea

Introduction

Motivation

Method

参考文献

相关文章

赞助商

阅读排行