论文推荐：谷歌Masked Generative Transformers 以更高的效率实现文本到图像的 SOTA

时间：2023-01-13 12:11:40浏览次数：68

标签：Transformers SOTA 模型 Generative Masked 图像掩码文本

基于文本提示的生成图像模型近年来取得了惊人的进展，这得益于新型的深度学习架构、先进的训练范式(如掩码建模)、大量图像-文本配对训练数据的日益可用，以及新的扩散和基于掩码的模型的发展。

在23年1月新发布的论文 Muse中：Masked Generative Transformers 生成文本到图像利用掩码图像建模方法来达到了最先进的性能，零样本 COCO 评估的 FID 分数为 7.88，CLIP 分数为 0.32——同时明显快于扩散或传统自回归模型。

google团队总结了它们的主要贡献如下：

提出了一个最先进的文本到图像生成模型，该模型获得了出色的 FID 和 CLIP 分数（图像生成质量、多样性和与文本提示对齐的定量测量）。
由于使用了量化图像标记和并行解码，模型明显快于同类模型。
架构支持开箱即用的零样本编辑功能，包括inpainting, outpainting和free mask编辑。

完整文章：

https://avoid.overfit.cn/post/55897da82dd241f394372fc76260320d

标签：Transformers,SOTA,模型,Generative,Masked,图像,掩码,文本
From： https://www.cnblogs.com/deephub/p/17049234.html

AN IMAGE IS WORTH 16X16 WORDS TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE---阅读
ANIMAGEISWORTH16X16WORDS:TRANSFORMERSFORIMAGERECOGNITIONATSCALE---阅读笔记摘要虽然Transformer架构已成为NLP任务的事实标准，但它在CV中......
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transforme
作者自己的解读比较精辟（NeurIPS'21)SegFormer:简单有效的语义分割新思路-Anonymous的文章-知乎https://zhuanlan.zhihu.com/p/379054782摘要作者提出了基于Transf......
在pycharm里debug以学习huggingface/transformers
把https://github.com/huggingface/transformers整个zip下载下来把src/transformers文件夹复制出来，放pycharm里，成这样：根据https://github.com/huggingface/transform......
论文 | SE(3)-Transformers：3D旋转平移等变注意力网络
导读自注意力机制是最近非常火热的内容。今天这篇文章，作者基于自注意力机制提出SE(3)-Transformer，实现了三维数据中旋转平移的等变性。等变性有什么意义？作者取得了什么样的......
利用Transformers库解决句子对分类问题
目录数据处理数据集介绍数据处理数据集介绍我们选择蚂蚁金融语义相似度数据集AFQMC作为语料，它提供了官方的数据划分，训练集/验证集/测试集分别包含34334/4316/3......
Continual Learning with Transformers for Image Classification---阅读笔记
ContinualLearningwithTransformersforImageClassification---阅读笔记摘要：阻止灾难性遗忘是一件很困难的事，一个最近的研究趋势是动态扩展参数可以有效的减少灾难......
利用Transformers库解决抽取式问答任务
目录前言前言自动问答(QuestionAnswering,QA)是经典的NLP任务，需要模型基于给定的上下文回答问题。根据回答方式的不同可以分为：抽取式(extractive)问答：从上下文中......
利用Transformers库解决序列标注问题
目录前言数据集说明前言序列标注(SequenceLabeling/Tagging)，其目标是为文本中的每一个token分配一个标签，因此Transformers库也将其称为token分类任务。常见的序......
Transformers库之快速分词器组件
目录快速分词器使用快速分词器模仿pipeline组件的行为序列标注任务抽取式问答任务快速分词器实际上，HuggingFace共提供了两种分分词器：慢速分词器：Transformers库自带，......
Transformers库之模型(Model)组件和分词器(Tokenizer)组件
目录模型加载模型保存模型分词器分词策略加载与保存分词器编码与解码文本处理多段文本Padding操作Attentionmasks直接使用分词器编码句子对模型在之前介绍pipeline组......

论文推荐：谷歌Masked Generative Transformers 以更高的效率实现文本到图像的 SOTA

相关文章

赞助商

阅读排行