网站首页
编程语言
数据库
系统相关
其他分享
编程问答
LAMM
2024-07-06
LAMM(论文解读): Label Alignment for Multi-Modal Prompt Learning
摘要随着CLIP等预训练视觉-语言模型在视觉表征任务上的成功,将预训练模型迁移到下游任务是一种重要的范式。最近,受到NLP启发的提示微调范式在VL领域取得了巨大的进展。之前的方法主要集中在为视觉和文本输入构建提示模板上,但是忽略了VL模型和下游任务之间在类标签表示上的差距