网站首页
编程语言
数据库
系统相关
其他分享
编程问答
ProGrad
2024-09-02
论文解读:Prompt-aligned Gradient for Prompt Tuning
摘要得益于CLIP等大型预训练的视觉语言模型VLM,我们可以通过离散的提示设计构建Zero-shot分类器,例如,利用图像与提示语句"aphotoofa[CLASS]"之间的相似度,可以获得图像属于某个类别的置信度分数。此外,如果我们使用少量样本对软提示进行微调,提示调优表现出VLMs快速适应下