域适应(Domain Adaptation)是机器学习领域中的一个重要问题,它涉及将一个域中训练的模型或算法应用到另一个相关但不同的域中,以提高模型在目标域中的性能。在实际应用中,数据分布通常在不同域之间存在差异这可能会导致在目标域中性能下降的问题。域适应的目标是通过适应数据分布差异,使模型在目标域中表现良好而无需在目标域中进行大量的标注数据收集和模型训练。
源域和目标域: 在域适应中,通常会有一个源域 (Source Domain)和一个目标域 (Target Domain)。源域是模型训练的领域,而目标域是模型在实际应用中要应用于的领域。它们之间的数据分布可能存在差异。
无监督域适应(Unsupervised domain adaptation,UDA): 在无监督域适应中,目标域中的标签是不可用的模型必须通过源域带标签数据和目标域无标签数据来学习适应目标域的数据分布,而不依赖目标域的标签信息
有监督域适应:在有监督域适应中,一部分目标域的标签信息是可用的。这种情况下,可以结合源域和目标域的标签信息来进行域适应,以改善模型性能
自训练(self-training)算法
初始训练:首先,在源域上进行监督训练,使用源域的标签数据来训练初始模型
目标域数据: 然后,将目标域的无标签数据与已标签的源域数据一起用于训练
自标记:使用已训练的模型对目标域的无标签数据进行预测,生成伪标签。这些伪标签是模型对目标域数据的预测结果
迭代训练: 重复上述自标记过程,多次迭代,每次迭代都使用伪标签和源域数据来更新模型。
性能评估: 最后,通过使用目标域上的真实标签 (如果可用)或其他评估指标来评估模型在目标域上的性能。
参考文献:
1. Unsupervised Domain Adaptation for Semantic Segmentation via Class-Balanced Self-Training. ECCV2018
2. Confidence regularized self-training.CVPR2019.
在自动驾驶中, 域适应学习可以使有限场景下学习到的模型充分的泛化到不同的城市、天气等, 提升基于视觉的感知模型在自动驾驶中的可靠性和稳定性;
工业场景下的缺陷检测:虚拟引擎可以方便地生成标注信息, 由此可以产生大量逼真的带有标注的数据, 为了使这些数据在真实场景中泛化性能更好, 就需要考虑虚拟到真实的域适应学习
形成了基于差异度量的跨域特征对齐方法、基于判别式对抗的跨域特征对齐方法、基于生成式对抗的图像级对齐方法和基于自监督的跨域特征学习方法等主流方法(单源无监督域适应方法)
迁移学习定义:
领域是进行学习的主体。领域主要由两部分构成: 数据和生成这些数据的概率分布。一般用D 来表示一个领域, 用P 来表示概率分布
图像识别任务中的域适应学习是克服领域间数据分布差异, 提升模型在不同场景的适用性、鲁棒性的有效方法
对于语义分割任务中的无监督域适应问题, 当前方法主要是通过领域对抗训练获得域不变的特征表示, 其中判别器是区分输入来自哪个域, 语义分割模型的目标是欺骗域判别器。本文提出了一种新的联合对抗学习方法, 通过引入低层特征对应的领域判别器的信息来提升输出空间中的领域对抗训练, 从而使高层解码器得到加强。然后本文提出了一个权重转移模块来减轻训练后的解码器对源域的过拟合。具体来说, 权重转移模块将原始解码器转化为新的解码器, 该解码器仅在对抗性损失的监督下学习, 因此可以减少源域的有监督损失的影响
标签:训练,标签,模型,源域,目标,适应 From: https://www.cnblogs.com/dwletsgo/p/17755610.html