首页 > 其他分享 >为什么基于transformer的序列分类不用decoder模块?

为什么基于transformer的序列分类不用decoder模块?

时间:2023-09-15 10:01:50浏览次数:33  
标签:transformer 分类 Decoder Transformer Encoder 模块 decoder 序列

Transformer原本是为机器翻译设计的编码-解码(Encoder-Decoder)结构。在序列分类任务中,主要利用的是Transformer的Encoder模块来获取输入序列的特征表示,而不需要Decoder模块,主要有以下原因:

  1. 解码模块主要用来生成目标序列,而分类任务只需要判别整个源序列的类别,不需要生成目标序列,所以不需要Decoder。
  2. Encoder模块可以充分学习输入序列的上下文语义特征,利用[CLS]标记可以获取整个序列的向量表示,已足以判断类别。
  3. Decoder对于分类任务而言是冗余的,会增加计算量和模型复杂度。
  4. 一些研究表明仅使用Transformer Encoder模块也能达到很好的序列分类效果,甚至超过RNN等其他模型。
  5. 一些预训练语言模型如BERT就是仅使用Transformer Encoder堆叠的结构,去掉了Decoder,但效果很好。
  6. 直接使用Encoder输出给线性分类层,构建一个单向Transformer模型对序列分类任务够用,简单高效。

综上,使用单向的Transformer Encoder而不用Decoder,可以减少计算资源,降低模型复杂度,并能获得状态优异的序列分类效果,所以更适合序列分类任务。这也使得Transformer模型被更广泛地应用到NLP的各种下游任务中。

标签:transformer,分类,Decoder,Transformer,Encoder,模块,decoder,序列
From: https://www.cnblogs.com/gao-ning2000/p/17704176.html

相关文章

  • 7.前端设计模式之模块模式
    将代码拆分成更小更易复用的代码块 JavaScript从ES2015开始支持模块化,一个文件就是一个模块,以前也可以把一个大的JS文件拆分到多个文件里,但容易出现定义的变量、函数名称冲突,文件多了依赖关系也不好管理,上线时觉得a.js文件没什么用就没发布,直到某个功能出现xxxisnotafunction......
  • Flutter插件flutter_boost 在android模块中的报红问题解决.
    1,在开发Flutter插件时,打开插件的android项目,准备编写native端的代码时,发现各种报红,代码无法跳转,体验十分不好。就像我下面的截图一样:导入了FlutterBoostflutterBoost源码爆红。但是运行正常。。这说明本身是没有问题的。。分明是没有错误的类都存在。但是就是爆红。。。。可......
  • 【学习笔记】Transformer
    在看Transformer之前,建议先学习一下Self-attention。同样,这边笔记是参考李宏毅老师的课程和ppt,感兴趣的可以去看原视频~Sequence-to-Sequence没错!Transformer是一个sequence-to-sequence(Seq2Seq)的模型,也就是输入一个sequence,模型会输出一个sequence。前面讲self-attention......
  • DC电源模块在保护设备损坏的重要功能
    BOSHIDADC电源模块在保护设备损坏的重要功能DC电源模块是一种电源管理设备,用于将交流电转换为直流电并提供给设备供电。它通常由多个电子元件组成,包括整流器、滤波器、稳压器等,以确保电源输出稳定,满足设备的电源需求。在实际应用中,DC电源模块有着非常重要的保护设备损坏的功能。以......
  • BOSHIDA DC电源模块在保护设备损坏的重要功能
    BOSHIDADC电源模块在保护设备损坏的重要功能DC电源模块是一种电源管理设备,用于将交流电转换为直流电并提供给设备供电。它通常由多个电子元件组成,包括整流器、滤波器、稳压器等,以确保电源输出稳定,满足设备的电源需求。 在实际应用中,DC电源模块有着非常重要的保护设备损坏的......
  • 【HarmonyOS】如何实现应用内引用HSP模块中ArkUI组件
    ​【关键字】HSP开发、引入HSP模块中ArkUI组件 【写在前面】在使用ArkTS开发HarmonyOS应用时,通常会定义一些公共组件或公共接口功能,此时可以将这些功能封装到HSP模块中,然后通过在HSP模块中导出组件或接口方式在其他模块中引用,可以实现应用内部代码与资源的共享。这里主要讲......
  • 18-时间表示-unix时间点-毫秒和微秒-time模块
        ......
  • 对标金九银十,分享32个模块的Android面试题,分分钟拿捏面试官
    前言2023年初伴随着疫情结束,迎来了“金三银四”。以为终于迎来胜利的“曙光”,不成想,现实却是当头一棒!!!从“金三银四”的“战绩”来看,程序员跳槽或者找工作并不理想,大批人迟迟找不到工作,大厂仍旧在进行几轮裁员,整个就业市场都不是太好!出现这种情况是因为中美贸易战,导致大环境不好、大......
  • Transformer-empowered Multi-scale Contextual Matching and Aggregation for
    Transformer-empoweredMulti-scaleContextualMatchingandAggregationforMulti-contrastMRISuper-resolution(阅读文献)10.12基于变压器的磁共振多对比度超分辨率多尺度背景匹配与聚合摘要:MRI可以显示相同解剖结构的多对比图像,使多对比超分辨率(SR)技术成为可能。和使用单一......
  • Swin Transformer
    SwinTransformer:HierarchicalVisionTransformerusingShiftedWindows使用移动窗口的分层视觉转换器阅读笔记摘要:提出SwinTransformer,作为计算机视觉的通用主干网络。将Transformer应用到是视觉领域的挑战就是语言和视觉两个领域的差异。本文提出的分层transformer,它的表......