首页 > 其他分享 >Data-Free,多目标域适应合并方案,简单又有效 | ECCV'24

Data-Free,多目标域适应合并方案,简单又有效 | ECCV'24

时间:2024-10-30 09:09:01浏览次数:5  
标签:24 训练 ECCV 模型 boldsymbol 合并 Free mu 缓冲区

来源:晓飞的算法工程笔记 公众号,转载请注明出处

论文: Training-Free Model Merging for Multi-target Domain Adaptation

创新点


  • 对域适应的场景解析模型中的模式连通性进行了系统的探索,揭示了模型合并有效的潜在条件。
  • 引入了一种模型合并技术,包括参数合并和缓冲区合并,适用于多目标域适应任务,可应用于任何单目标域适应模型。
  • 在数据可用性受限的情况下,也能达到与使用多个合并数据集进行训练相当的性能。

内容概述


论文研究的是场景理解模型的多目标域适应(MTDA)。虽然之前的方法通过领域间一致性损失取得了可观的结果,但它们通常假设可以不切实际地同时访问所有目标领域的图像,忽略了数据传输带宽限制和数据隐私等问题。鉴于这些挑战,论文提出了一个问题:如何在不直接访问训练数据的情况下合并在不同领域独立适应的模型?

对此问题的解决方案包含两个部分,即合并模型参数和合并模型缓冲区(即归一化层统计数据)。在合并模型参数方面,模式连通性的实证分析意外地表明,对于使用相同的预训练主干权重训练的单独模型,线性合并就足够了。在合并模型缓冲区方面,使用高斯先验来建模现实世界分布,并从单独训练模型的缓冲区中估计新的统计数据。

论文的方法简单而有效,取得了与数据组合训练基线相当的性能,同时消除了访问训练数据的必要性。

方法


以往的方法假设,在适应阶段能够同时访问所有目标领域图像的非实际假设。相反,论文方法的流程包括两个不同的阶段:

  1. 单目标域适应阶段,分别训练适应于各个目标领域的模型。简单地采用最先进的无监督域适应方法HRDA,利用各种主干架构,如ResNet和视觉Transformer
  2. 模型合并阶段(主要关注点),专注于将这些适应后的模型合并在一起以创建一个稳健的模型,而不需要访问任何训练数据。该方法包含模型的两个关键组成部分:参数(即可学习层的权重和偏置)和缓冲区(即归一化层的运行统计信息)。

参数合并

论文通过对比实验发现,当从相同的预训练权重开始时,域适应模型能够有效地过渡到多样的目标领域,同时在参数空间中保持线性模式连接。因此,这些训练模型之间的简单中点合并可以生成在两个领域中都具有鲁棒性的模型。

缓冲区合并

缓冲区,即用于批归一化(BN)层的运行均值和方差,与领域有密切关系,因为它们封装了特定领域的特征。现有方法主要处理在同一领域内对两个训练于不同子集的模型的合并,而论文研究在完全不同目标领域中训练的两个模型的合并,因此缓冲区合并的问题变得不再简单。

BN层的引入是为了缓解内部协变量偏移的问题,即输入的均值和方差在经过内部可学习层时发生变化。在这种背景下,基本考虑是后续的可学习层预期合并的BN层的输出遵循正态分布。由于输出的BN层保留了输入符合高斯先验的归纳偏见,因此可以从 \(\mathbf{\Gamma}_A\) 和 \(\mathbf{\Gamma}_B\) 中获取的值来估计 \(\boldsymbol{\mu}^{(i)}\) 和 \([\boldsymbol{\sigma}^{(i)}]^2\) 。首先获得来自该高斯先验的数据点的均值和方差的两个集合,以及这些集合的大小,共同利用这些值来估计该分布的参数。

当将合并方法扩展到 \(m (m \geq 2)\) 个高斯分布时,可以按如下方式计算已跟踪批次的数量 \(n^{(i)}\) 、均值的加权平均 \(\boldsymbol{\mu}^{(i)}\) 和方差的加权平均。

\[\begin{equation} \label{m-buffer-merging-n-and-mean} \begin{split} n^{(i)} =& n^{(i)}_1 + n^{(i)}_2 + \cdots +n^{(i)}_M, \\ \boldsymbol{\mu}^{(i)} =& \frac{1}{n^{(i)}} (n^{(i)}_1 \boldsymbol{\mu}^{(i)}_1 + n^{(i)}_2 \boldsymbol{\mu}^{(i)}_2 + \cdots + n^{(i)}_M \boldsymbol{\mu}^{(i)}_M),\\ \boldsymbol{\sigma}^2 =& \frac{\sum_{j=1}^{M} n^{(i)} (\boldsymbol{\sigma}^i_j)^2 + \sum_{j=1}^{M} n_j^i (\boldsymbol{\mu}_j^i - \boldsymbol{\mu}^i)^2}{\sum_{j=1}^{M} n_j^i}. \end{split} \end{equation} \]

主要实验




如果本文对你有帮助,麻烦点个赞或在看呗~
更多内容请关注 微信公众号【晓飞的算法工程笔记】

work-life balance.

标签:24,训练,ECCV,模型,boldsymbol,合并,Free,mu,缓冲区
From: https://www.cnblogs.com/VincentLee/p/18515002

相关文章

  • 20241029
    T116248岛屿首先,手模发现任意操作一次即可构造出一组解。于是这题其实是构造题。发现限制等价于每个三角形中两种颜色的边都存在。我们先考虑最外层的一个三角形,也就是一个度数为\(2\)的的点所在的三角形。要保证它里面两种颜色的边都存在,最简单的办法就是把它的两个度数染......
  • 2024.10.29模拟赛
    今天照常7:45开始打模拟赛,11:45时结束。打了T1的40分暴力、T3的20分暴力,没有注意到T4的特殊样例可以骗分(悲),最后以60分收尾。总结一下,没有挂分,但也没和正解挨上边,算是不好也不坏吧。订题时我看着T126行的AC代码陷入了沉思。三个人,想了至少三个小时,结果全没想出来,于是来整理一下今......
  • CCSP2024 游记
    目录Day-1Day0Day1Day2Day3Day-1爆肝Web实验中。日常厌学,但是想到马上就出去旅游了,心情不算太坏。一看名单发现去的全是ACM校队的,去年也是这个样子,他妈的难道CCSP是校队的什么旅游团建吗!Day0早上七点起来赶高铁,妈的一打开手机发现立青六点多给我发消息妈的居然......
  • Webstorm 2024 安装使用 (附加永久激活码、补丁)
    下载安装第二步,安装完成之后,下载补丁下载地址(里面包含激活码)完成,之后输入激活码免责声明:本文中的资源均来自互联网,仅供个人学习和交流使用,严禁用于商业行为,下载后请在24小时内从电脑中彻底删除。对于因非法使用而引起的版权争议,与作者无关。所有资源仅供学习、参考......
  • 2024/10/29
    今天学习了数据库的链接,配置了Maven环境<head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>MES系统</title><style>body{......
  • 深入浅出:SpringBoot启动流程源码分析(持续更新中......)最新日期:2024年10月29日
    Hello,大家好,我是此林。今天来深入底层讲一讲SpringBoot是如何启动的,也就是我们单击运行SpringBoot启动类,它底层发生了什么?SpringBoot启动类很简单,只有一行代码。我们点进run()方法。我们发现,它底层其实进行了两步操作。第一步是new出一个SpringApplication对象,第二个是......
  • 20222428 2024-2025-1 《网络与系统攻防技术》实验三实验报告
    1.实验内容1.1本周学习内容1.1.1后门实践中的基本概念netcat(瑞士军刀):用于监听、探测端口、正向连接、反向连接、文件传输。socat:netcat的加强版(多了SSL连接等功能)。Meterpreter工具:Metadploit框架中的扩展模块,是生成后门的工具。VeilEvasion:生成免杀的工具。1.1.2......
  • 第六届国际科技创新学术交流大会(IAECST 2024) 暨第四届物流系统与交通运输国际学术会
    @目录一、会议详情二、重要信息三、大会介绍四、出席嘉宾五、征稿主题一、会议详情二、重要信息大会官网:https://ais.cn/u/vEbMBz提交检索:EICompendex、IEEEXplore、Scopus三、大会介绍第六届国际科技创新学术交流大会暨第四届物流系统与交通运输国际学术会议(LSTT202......
  • 2024强网杯pwn short wp
    这时2024强网杯的pwn部分的short的WP分析以下程序的基本安全措施*]'/home/ysly/solve/tmp/short'Arch:i386-32-littleRELRO:PartialRELROStack:NocanaryfoundNX:NXenabledPIE:NoPIE(0x8048000)Stripp......
  • SS241029C. 卡路里(calorie)
    SS241029C.卡路里(calorie)题意有\(m\)家奶茶店,一共有\(n\)种奶茶,每家店都有这\(n\)种奶茶。奶茶店排成一排,两两之间距离\(d_i\)。每家奶茶店每种奶茶有一个卡路里值\(a_{i,j}\)。选择若干家连续的奶茶店,在这些奶茶店中每种奶茶各喝一次,求最大化\((\sum_ja_j)-(s_r......