CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks论文阅读笔记

摘要

这是一篇关于利用CLIP模型来提升视觉语言任务性能的论文。CLIP模型是一个可以从大量图片和文字数据中学习通用视觉语言表示的模型，它有很强的零样本和少样本学习能力。这篇论文提出了一种新的方法，叫做CLIP Targeted Distillation (CLIP-TD)，它可以将CLIP模型的知识有效地转移给特定的视觉语言任务，比如图像分类、自然语言推理、视觉问答等。这种方法通过在训练过程中使用CLIP模型作为一个辅助教师，来指导目标任务模型学习更好的视觉语言表示。这篇论文在多个视觉语言任务上进行了实验，结果显示了CLIP-TD方法在少样本和全监督条件下都能显著提升目标任务模型的性能，并且超过了其他使用CLIP模型进行微调或者蒸馏的方法。（此段内容来自chatgpt）

方法

Knowledge Distillation

最基础的蒸馏是直接蒸馏CLIP image encoder的cls token以及学生的img token、CLIP text encoder的eos token以及学生的text cls token。方法是直接计算这几个token的L1 measure，然后加到原始任务的loss。

CLIP Targeted Distillation (CLIP-TD)

主要分为三部分：

Token Selective (TS) Distillation with Prior. 最具语义相关性的标记可能会随着实例而变化。因此作者设计了TS从而选择性的对token进行蒸馏。对于给定的一个text sequence \(t_j=\{w0,...,w_z\}\)（z是序列长度），Token Selection Module生成一组概率分布\(S_j=\{s_0,...,s_z\}\)。\(S_j\)由两部分构成：\(S_j=\frac{S_{vr}}{|S_{vr}|_1}+\frac{S_{si}}{|S_{si}|_1}\)，\(S_{vr}\)就是计算每个text token与image的余弦相似度；\(S_{si}\)是计算每个token对于整个文本在语义和句法上的重要性，作者在这里直接使用了一个pre-trained keyword extractor。

Confidence Weighted (CW) Distillation. 为了解决CLIP的先验知识在实例层面对模型的干扰，作者提出了置信权重蒸馏，根据计算得到的比率r来调整前面提到的损失函数中的权重w：

截屏2023-02-17 15.27.39

截屏2023-02-17 15.27.57

**Adaptive Finetuning (AF) with Contrastive Knowledge. **在最后一个阶段前，作者通过\(L_{AF}\)对base model进行微调，\(L_{AF}=L_{pretraining}+w·L_d\)（\(L_{pretraining}\)是指的预训练任务）。

剩下的懒得看了，感觉论文整体讲的不清不楚>V<

标签：Tasks,CLIP,Language,Targeted,论文,Distillation,token,TD
From： https://www.cnblogs.com/lipoicyclic/p/17130388.html

Eclipse中如何修改SVN的地址
在SVN服务端的IP更改后，客户端SVN的连接地址可以在Eclipse中进行修改，方法如下：首先：在Eclipse中选择Windows->ShowView->others就会出现【SVN资源库/SVNRepositories】，选......
eclipse微服务续
四、Hystrix延迟和容错库 SpringCloud默认已为Feign整合了hystrix，所以添加Feign依赖后就不用在添加hystrix依赖了。1.在Fegin中开启hystrix修改consumer_server_12000......
eclipse配置tomcat环境
Eclipse配置tomcat环境第一步：进行下面操作： window–>Preference–>Server–>RuntimeEnvironments->Add搜索server在里面找到RuntimeEnviror并点击Add点击电脑......
eclipse中robot项目界面配置
1、调整为robot视图 2、运行时报编码错误，调整编码配置 3、查看打印结果，点击后添加输出栏 ......
eclipse创建1个robotframework
1、eclipse打开，新建1个robot项目2、输入项目名称自定义，完成 3、项目名称右键->新建->测试套件 4、输入测试套件名称，自定义->完成 5、完成测试用例编写 6......
eclipse 快速lib目录下jar包批量导入项目
1.情景展示在实际开发过程中，尤其是：非maven管理jar包的老项目，我们往往会遇到这样的情况：从svn或者git上下载下来的JavaWeb项目，lib目录下的jar包总是没有全部构建到项目当中：如......
Eclipse/STS在线安装SVN图文教程
1、在线安装地址网络通畅的情况下可以选在在线安装，选择SVN对应的插件版本:http://subclipse.tigris.org/update_1.6.x(subversion1.6.x)http://subclipse.tigris.org/upd......
RobotFramework+Eclipse环境安装之：Eclipse下载RED下载
1、 2、 3、 4、 5、 6、 7、 8、 9、 10、 11、 ......
RobotFramework+Eclipse环境安装之：Eclipse中安装RED插件
步骤如下：1、eclipse包解压后打开，双击eclipse.exe2、Help->installNewSoftware3、选择本地RED包4、勾选5、安装6、同意7、安装进度8、勾选9、重启 ......
eclipse 为javaWeb项目更改jdk版本的正确姿势
1.情景展示在使用eclipse进行web项目开发时，针对公司以前的老项目，从SVN下载下来后，我们往往会需要更换jdk版本，使其与本地jdk版本保持一致。如何切换jdk版本？2.具体实现第一步：切......

CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks论文阅读笔记

CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks论文阅读笔记

摘要

方法

Knowledge Distillation

CLIP Targeted Distillation (CLIP-TD)

相关文章

赞助商

阅读排行