为什么基于transformer的序列分类不用decoder模块？

时间：2023-09-15 10:01:50浏览次数：38

标签：transformer 分类 Decoder Transformer Encoder 模块 decoder 序列

Transformer原本是为机器翻译设计的编码-解码(Encoder-Decoder)结构。在序列分类任务中,主要利用的是Transformer的Encoder模块来获取输入序列的特征表示,而不需要Decoder模块,主要有以下原因:

解码模块主要用来生成目标序列,而分类任务只需要判别整个源序列的类别,不需要生成目标序列,所以不需要Decoder。
Encoder模块可以充分学习输入序列的上下文语义特征,利用[CLS]标记可以获取整个序列的向量表示,已足以判断类别。
Decoder对于分类任务而言是冗余的,会增加计算量和模型复杂度。
一些研究表明仅使用Transformer Encoder模块也能达到很好的序列分类效果,甚至超过RNN等其他模型。
一些预训练语言模型如BERT就是仅使用Transformer Encoder堆叠的结构,去掉了Decoder,但效果很好。
直接使用Encoder输出给线性分类层,构建一个单向Transformer模型对序列分类任务够用,简单高效。

综上,使用单向的Transformer Encoder而不用Decoder,可以减少计算资源,降低模型复杂度,并能获得状态优异的序列分类效果,所以更适合序列分类任务。这也使得Transformer模型被更广泛地应用到NLP的各种下游任务中。

标签：transformer,分类,Decoder,Transformer,Encoder,模块,decoder,序列
From： https://www.cnblogs.com/gao-ning2000/p/17704176.html

7.前端设计模式之模块模式
将代码拆分成更小更易复用的代码块 JavaScript从ES2015开始支持模块化，一个文件就是一个模块，以前也可以把一个大的JS文件拆分到多个文件里，但容易出现定义的变量、函数名称冲突，文件多了依赖关系也不好管理，上线时觉得a.js文件没什么用就没发布，直到某个功能出现xxxisnotafunction......
Flutter插件flutter_boost 在android模块中的报红问题解决.
1，在开发Flutter插件时，打开插件的android项目，准备编写native端的代码时，发现各种报红，代码无法跳转，体验十分不好。就像我下面的截图一样：导入了FlutterBoostflutterBoost源码爆红。但是运行正常。。这说明本身是没有问题的。。分明是没有错误的类都存在。但是就是爆红。。。。可......
【学习笔记】Transformer
在看Transformer之前，建议先学习一下Self-attention。同样，这边笔记是参考李宏毅老师的课程和ppt，感兴趣的可以去看原视频~Sequence-to-Sequence没错！Transformer是一个sequence-to-sequence(Seq2Seq)的模型，也就是输入一个sequence，模型会输出一个sequence。前面讲self-attention......
DC电源模块在保护设备损坏的重要功能
BOSHIDADC电源模块在保护设备损坏的重要功能DC电源模块是一种电源管理设备，用于将交流电转换为直流电并提供给设备供电。它通常由多个电子元件组成，包括整流器、滤波器、稳压器等，以确保电源输出稳定，满足设备的电源需求。在实际应用中，DC电源模块有着非常重要的保护设备损坏的功能。以......
BOSHIDA DC电源模块在保护设备损坏的重要功能
BOSHIDADC电源模块在保护设备损坏的重要功能DC电源模块是一种电源管理设备，用于将交流电转换为直流电并提供给设备供电。它通常由多个电子元件组成，包括整流器、滤波器、稳压器等，以确保电源输出稳定，满足设备的电源需求。在实际应用中，DC电源模块有着非常重要的保护设备损坏的......
【HarmonyOS】如何实现应用内引用HSP模块中ArkUI组件
【关键字】HSP开发、引入HSP模块中ArkUI组件【写在前面】在使用ArkTS开发HarmonyOS应用时，通常会定义一些公共组件或公共接口功能，此时可以将这些功能封装到HSP模块中，然后通过在HSP模块中导出组件或接口方式在其他模块中引用，可以实现应用内部代码与资源的共享。这里主要讲......
18-时间表示-unix时间点-毫秒和微秒-time模块
......
对标金九银十，分享32个模块的Android面试题，分分钟拿捏面试官
前言2023年初伴随着疫情结束，迎来了“金三银四”。以为终于迎来胜利的“曙光”，不成想，现实却是当头一棒！！！从“金三银四”的“战绩”来看，程序员跳槽或者找工作并不理想，大批人迟迟找不到工作，大厂仍旧在进行几轮裁员，整个就业市场都不是太好！出现这种情况是因为中美贸易战，导致大环境不好、大......
Transformer-empowered Multi-scale Contextual Matching and Aggregation for
Transformer-empoweredMulti-scaleContextualMatchingandAggregationforMulti-contrastMRISuper-resolution（阅读文献）10.12基于变压器的磁共振多对比度超分辨率多尺度背景匹配与聚合摘要：MRI可以显示相同解剖结构的多对比图像，使多对比超分辨率（SR）技术成为可能。和使用单一......
Swin Transformer
SwinTransformer:HierarchicalVisionTransformerusingShiftedWindows使用移动窗口的分层视觉转换器阅读笔记摘要：提出SwinTransformer,作为计算机视觉的通用主干网络。将Transformer应用到是视觉领域的挑战就是语言和视觉两个领域的差异。本文提出的分层transformer，它的表......

为什么基于transformer的序列分类不用decoder模块？

相关文章

赞助商

阅读排行