【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

时间：2023-01-17 11:33:35浏览次数：49

标签：Convolutional Transformer Classification 卷积模型池化 ACT CNN

·阅读摘要：
本文在Transformer模型的基础上，提出改进方案，把Transformer里面的自注意力机制，改成CNN。
·参考文献：
[1] ACT: an Attentive Convolutional Transformer for Efficient Text Classification
【注】：众所周知，Transformer是超越RNN、CNN的模型，Transformer中最有新意的就是不使用RNN、CNN，而使用自注意力机制，从而使得Transformer模型表现卓越。
而本文提出的ACT模型就是把Transformer中的自注意力机制替换成CNN，我觉得这篇论文是否有意义，其实应该和Transformer的作者battle一下，哈哈。

[1] ACT模型

先看一下Transformer模型：

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification_文本分类

再看ACT模型：

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification_文本分类_02

所以说，ACT模型只是把Transformer的Scaled Dot-Product Attention模块换成了attentive convolution mechanism。

对于attentive convolution mechanism模块，主要就是CNN加了一个Global feature representation。

【注】：说白了就是普通的CNN是卷积–>池化；而论文提出的CNN是卷积+池化，其中卷积部分称为提取局部信息，池化部分称为提取全局信息。

标签：Convolutional,Transformer,Classification,卷积,模型,池化,ACT,CNN
From： https://blog.51cto.com/u_15942590/6012020

【文本分类】Bag of Tricks for Efficient Text Classification
·阅读摘要：本文主要提出fastText模型。·参考文献： [1]BagofTricksforEfficientTextClassification[0]摘要文章提出fastText模型，效果接近深度学习基......
【多标签文本分类】Balancing Methods for Multi-label Text Classification with Lon
·阅读摘要：本文更像是对多标签文本分类的损失函数的综述，文中提到的几个损失函数（包括为了解决长尾问题的损失函数）都是前人已经提出的。·参考文献： [1]BalancingM......
基于边缘辅助极线Transformer的多视角场景重建
童伟,张苗苗,李东方,吴奇,宋爱国.基于边缘辅助极线Transformer的多视角场景重建[J].电子与信息学报编辑：一点人工一点智能原文：基于边缘辅助极线Transformer的多视......
论文推荐：谷歌Masked Generative Transformers 以更高的效率实现文本到图像的 SOTA
基于文本提示的生成图像模型近年来取得了惊人的进展，这得益于新型的深度学习架构、先进的训练范式(如掩码建模)、大量图像-文本配对训练数据的日益可用，以及新的扩散和基于掩......
【每日一读】Large-Scale Nodes Classification With Deep Aggregation Network
目录简介论文简介Abstract1INTRODUCTION2RELATEDWORKSANDMOTIVATIONS2.1PrimaryDefinition2.2Neighborhoo......
CONTINUAL LEARNING IN VISION TRANSFORMER--阅读笔记
CONTINUALLEARNINGINVISIONTRANSFORMER---阅读笔记摘要：持续学习的目标是从新数据中持续学习新任务，同时保留过去学习的任务的知识。最近，利用最初在计算机视觉自然......
A Closer Look at the Convolutional Layer
1.WhatCNNsCanDo2.ImageClassificationDifferentlighting,contrast,viewpoints,etc.Thisishardfortraditionalmethodslikemulti-layerperceptrons,b......
2020,Transformation-invariant Gabor convolutional networks
Introduction深度卷积神经网络(DCNNs)在字符识别、目标检测、人脸识别和语义分割等各个领域都取得了一系列突破。然而，由于缺乏为空间几何变换设计的特定模块，学习到的特征......
2018,Gabor Convolutional Networks
Abstract传统滤波器(如Gabor滤波器)的设计主要采用可调控的特性，并赋予特征处理空间变换的能力。然而，这些优秀的特性在目前流行的深度卷积神经网络(DCNNs)中还没有得到很好......
Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context（论文和代
Transformer模型能够学习长范围依赖，但是在语言模型中受到固定长度上下文限制，本文提出了一个新的结构：Transformer-XL。能够学习超过固定长度的依赖，同时保持了......

【文本分类】ACT: an Attentive Convolutional Transformer for Efficient Text Classification

[1] ACT模型

相关文章

赞助商

阅读排行