首页 > 其他分享 >【论文阅读笔记】Distiling Causal Effect of Data in Class-Incremental Learning

【论文阅读笔记】Distiling Causal Effect of Data in Class-Incremental Learning

时间:2023-04-11 20:23:11浏览次数:47  
标签:数据 模型 样本 Effect Learning 方法 Class 因果

Author: Hanwang Zhang, Xinting Hu
Create_time: April 24, 2022 11:01 AM
Edited_by: Huang Yujun
Publisher: CVPR 2021
Org: Nanyang Technological University

Distiling Causal Effect of Data in Class-Incremental Learning

Untitled

1. Contribution

这是一篇从因果角度思考持续学习的文章,这个思路比较新颖有意思

  • 从因果角度解释了产生灾难性遗忘的原因,同时分析了 Data Replay 和 Distillation 两种持续学习方法能够在一定程度缓解灾难性遗忘的原因
  • 从因果角度的视角,提出了一种等效于 Data Replay ,但不需要存储旧类样本的 Distillation 方法
  • 针对新旧类的样本不均衡问题,沿着《Longtailed classification by keeping the good and removing the bad momentum causal effect》的工作,做了改进。

2. Motivation

本文中重点关注的持续方法主要是 Replay-based Method 和 Distillation-based Method。两种方法的有效缓解灾难性遗忘,但同时缺点也很明显:

  • Replay-based Method 这种 end-to-end 的方法相比其他 output-end 的方法效果更好,但需要额外的存储空间;
  • Distillation-based Method 不需要额外存储空间,但极度依赖于新旧类的分布情况,如果新旧类特征差异较大,Distillation loss 可能会为了尽可能保存旧类特征的同时,误导新类学习到的特征。

因此,作者提出了一个问题:“是否有一种与样本回放等效的端到端蒸馏方法?”

使用因果模型对灾难性遗忘和上述两种缓解灾难性遗忘的方法建模后,问题可以转化为“除了样本回放的方法外,是否还有其他方式,施加旧数据的影响?”

besides replay, is there another way to introduce the causal effect of the old data?

作者找到了这样的方法,也就是本文中提出的方法 Distilling Colliding Effect(DCE),实验证明这个方法可以有效提升 LUCIR 和 PODNet 的性能。

此外,作者还发现了新酒类的不均衡问题,并提出了 Incremental Momentum Effect Removal method,以去除 biased data causal effect 。

3. (Anti-) Forgetting in Causal Views

为了能够系统的解释灾难性遗忘以及缓解灾难性遗忘的因果关系,本文对持续学习中的数据、特征、预测标签使用因果图(Causal Graphs)来表示各自之间的关系。

Untitled

在上面的这张图中,D 表示旧数据;I 表示用于训练的新数据;X 表示使用新模型提取的特征;\(X_{0}\) 表示使用旧模型提取得到的特征;Y 表示新模型的预测标签;\(Y_{0}\) 表示旧模型的预测标签。

通路 \(I \rightarrow X \rightarrow Y\):表示新数据使用新模型提取特征 X 后,经过新模型的分类器得到预测标签 Y。

通路 \((D,I) \rightarrow X_{0} \& (D,X_{0}) \rightarrow Y_{0}\):表示新旧数据 D I 使用旧模型提取得到特征后,经过旧模型的得到预测标签 \(Y_{0}\) 。(这里中间的 \(X_{0}\) 表示新数据 I 使用旧模型提取特征后得到的特征向量,\((D,X_{0})\) 表示旧数据 D 使用旧模型提取特征后得到的特征向量)。

通路 \(D \rightarrow I\) :为样本回放方法所添加的通路,通过回放存储的样本,使得旧类数据能够与新类数据建立联系。

通路 \(X_{0} \rightarrow X \& Y_{0}\rightarrow Y\):为在 logits 上做蒸馏的方法所添加的通路。

不连通通路 \(X_{0}\nrightarrow X\) : 为作者强调应该忽视的,作者认为虽然新旧模型间存在参数的继承,但随着模型训练,新模型从旧模型中继承得到的参数数量会呈指数下降,因此可以忽略。(参考《Overcoming catastrophic forgetting in neural networks》)

相关文章

  • 【论文阅读笔记】iCaRL: Incremental Classifier and Representation Learning
    Author:AlexanderKolesnikovKey_words:nearest-mean-of-exemplarrule,prioritizedexamplerselection,representationlearningCreate_time:September11,20213:06PMEdited_by:HuangYujunPublisher:CVPR2017Score/5:⭐️⭐️Status:FinishediCaRL:Incre......
  • 迁移学习()《Attract, Perturb, and Explore: Learning a Feature Alignment Network fo
    论文信息论文标题:Attract,Perturb,andExplore:LearningaFeatureAlignmentNetworkforSemi-supervisedDomainAdaptation论文作者:TaekyungKim论文来源:2020ECCV论文地址:download 论文代码:download视屏讲解:click1摘要提出了目标域内的域内差异问题。提......
  • MULTIINSTRUCT: Improving Multi-Modal Zero-Shot Learning via Instruction Tuning
    指令调优是一种新的学习范式,它可以根据指令指定的任务对预先训练好的语言模型进行微调,在各种自然语言处理任务中显示出良好的零目标性能。然而,对于视觉和多模态任务,它仍然没有被探索。在这项工作中,我们介绍了multiinstruction,这是第一个多模态指令调优基准数据集,由47个不同的多模......
  • react useEffect的用法
    useEffect是ReactHook的一种,用于在函数组件中定义副作用操作,比如改变DOM、发送网络请求、订阅事件等等。useEffect用于替代类组件中的生命周期方法。它接受一个函数作为第一个参数,在组件更新时调用这个函数,如果你需要在组件挂载时调用这个函数,需要传入一个空数组作为第二个参数;如......
  • 利用强化学习Q-Learning实现最短路径算法
    如果你是一名计算机专业的学生,有对图论有基本的了解,那么你一定知道一些著名的最优路径解,如Dijkstra算法、Bellman-Ford算法和a*算法(A-Star)等。这些算法都是大佬们经过无数小时的努力才发现的,但是现在已经是人工智能的时代,强化学习算法能够为我们提出和前辈一样好的解决方案吗?......
  • Andorid NoSuchFieldError: No static field D of type I in class Lx/x/x/R$layout解
    一、介绍我们在开发过程中,会出现各种问题,包括布局资源的问题,但是这种布局几乎是和资源有关,出现这种情况有以下三种1.资源冲突资源冲突,最右可能造成的原因是两个不同的module拥有相同的layout名字,这就会导致在打包的时候,如果别的module优先被处理,占据了有利先机,而你的资源可能被别人......
  • dataclass
    [数据类(dataclass)](Python3.7+中的数据类(指南)–真正的Python(realpython.com))目录引入数据类的替代项数据类基础默认值类型提示添加方法更灵活的数据类高级默认值数据类的字符串表示卡片比较不可变数据类继承优化数据类引入数据类是通常主要包含数据的类,尽管实际上......
  • 迁移学习《Cluster-Guided Semi-Supervised Domain Adaptation for Imbalanced Medica
    论文信息论文标题:Cluster-GuidedSemi-SupervisedDomainAdaptationforImbalancedMedicalImageClassification论文作者:S.Harada,RyomaBise,KengoAraki论文来源:ArXiv2March2023论文地址:download 论文代码:download视屏讲解:click1摘要一种半监督域自适应方法,......
  • 异常检测 | 迁移学习《Anomaly Detection in IR Images of PV Modules using Supervis
    论文信息论文标题:AnomalyDetectioninIRImagesofPVModulesusingSupervisedContrastiveLearning论文作者:AbhayRawat, IshaDua, SauravGupta, RahulTallamraju 论文来源:LukasBommes,MathisHoffmann,ClaudiaBuerhop-Lutz,TobiasPickel,JensHauch,Christ......
  • (第八篇)__format__、__hash__、__init_subclass__、__reduce_ex__、__reduce__、__si
    一、__format__(self,format_spec)当我们使用format()方法对一个对象进行格式化时,如果这个对象有__format__方法,那么这个方法就会被调用。它接受一个变量作为参数,并返回一个格式化后的字符串。classPerson:def__init__(self,name,age):self.name=name......