首页 > 其他分享 >SummerResearch_Log_20230627

SummerResearch_Log_20230627

时间:2023-06-27 20:33:58浏览次数:43  
标签:20230627 Log 2522% Attention Encoder blog Decoder SummerResearch net

Working Content:

1. 今天开始看Vision Transformer(ViT):

看之前需要一些基础:

(1)RNN(Recurrent NN,循环神经网络):

一段连续的信息,前后信息之间是有关系地,必须将不同时刻的信息放在一起理解。如果是普通的神经网络,每个输入之间是相互独立的,如果是RNN,则可以接收上一个输入传递的信息。如下图所示:

缺点:RNN无法处理长距离依赖问题,通俗点就是不能处理一些较长的序列数据

(https://blog.csdn.net/Tink1995/article/details/104868903?spm=1001.2014.3001.5502)

(2)与之相对比,LSTM和GRU可以更好地处理长序列,具体的有时间再写。

(3)Encoder-Decoder与Attention

如果是普通的Encoder-Decoder,则如上所说,将最后一个隐藏层状态值h4作为语义编码c。

如果是Attention机制的Encoder-Decoder,则会将所有隐藏层状态值存为语义编码c,并且每个隐藏层状态值是带有一个权重值的,代表着其重要程度。

Transformer:

以下是Transformer的具体情况:

关于Encoder:

更细节的是下图:

 

这三张图非常清楚地写出了Self-Attention层的具体情况:

 

 

(https://blog.csdn.net/qq_37541097/article/details/117691873)

关于Decoder:

从上图可以看出:

结构实际上就比Encoder多了中间一小部分:

其他不同的是"Masked Multi-Head Attention",这里的Masked可以理解成同时输入与顺序输入,前者是a1a2a3a4都会影响b1b2b3b4,后者是b1只受a1影响,b2只受a1a2影响,以此类推。

 

 

(https://blog.csdn.net/Tink1995/article/details/105080033?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168773679216800213089771%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168773679216800213089771&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-105080033-null-null.142^v88^control_2,239^v2^insert_chatgpt&utm_term=transformer&spm=1018.2226.3001.4187)

 

 

 

 

 

 

 

 

 

 

 

 

标签:20230627,Log,2522%,Attention,Encoder,blog,Decoder,SummerResearch,net
From: https://www.cnblogs.com/Hexh/p/17508121.html

相关文章

  • 题目集7~11的总结性blog
    一.前言这是这学期最后一次blog了,其中有7~11五次题目集题目集07:只有一道题,该题为菜单计价程序-5,是菜单计价程序-3的迭代,与菜单计价程序-4属于不同的迭代分支。 ......
  • Python logging模块(转载)
    Pythonlogging模块日志级别CRITICAL=50#FATAL=CRITICALERROR=40WARNING=30#WARN=WARNINGINFO=20DEBUG=10NOTSET=0#不设置默认级别为warning,默认打印到终端importlogginglogging.debug('调试debug')logging.info('消息info')logging.warnin......
  • m基于FPGA的数据串并并串转换系统verilog实现,包含testbench,可以配置并行数量
    1.算法仿真效果 本系统进行了两个平台的开发,分别是: Vivado2019.2 Quartusii18.0+ModelSim-Altera6.6d StarterEdition 其中Vivado2019.2仿真结果如下: 分别进行2路,4路,8路,16路并行串行转换      Quartusii18.0+ModelSim-Altera6.6d Starter......
  • 使用 nuxt3 开发简约优雅的个人 blog
    起因很早前我就有过搭建个人博客的想法,但是我希望使用纯前端实现,这样就不需要付出额外的后端维护成本,维护成本又低,而且更加安全。网上也有很多博客框架但是也不符合我的需求,所以我使用了nuxt3+ts搭建了自己的个人博客,更加贴合个人需求,在功能和样式也能做到随心所欲前端的同学......
  • 系统断电后,MySQL重启失败:[ERROR] Binlog has bad magic number; It‘s not a binary lo
    系统断电后,MySQL重启失败:[ERROR]Binloghasbadmagicnumber;It‘snotabinarylogfilethatcanbeusedbythisversionofMySQL [ERROR]Can'tinittclog[ERROR]Aborting在Windows系统上,Mysql服务没启动,在启动Mysql服务时,报以下错误: 系统出错。 发生系......
  • Git log日志操作-6
    Gitlog日志操作区别:Gitlog:作用域是本地版本库。查看的是commit-m提交的内容。只add未commit不会生成log信息。支持简单查看,顺序查看,按时间和作者筛选Gitblame:作用域是工作区。查看的是工作区的最新内容,即使修改,未add,commit也可以打印。功能类似于linux中的cat命令一.Gitlog1......
  • Login.cshtml
    @{ViewData["Title"]="Login";Layout="~/Views/Shared/_Layout_default.cshtml";}@sectionCss{<style>body{/*加载背景图*/background-image:url(../../icon/aa.png);......
  • adb logcat使用方法
    adblogcat命令使用一.android日志介绍1.打印日志的原理android日志系统包括一个内核驱动程序和用于存储日志消息的内核缓冲区。一个用于查看日志消息的独立程序logcat。2.日志的类型4个不同日志缓冲区,为系统的不同部分提供日志记录,所有的缓冲区都在设备的/dev/log下:/dev/log......
  • LoginController
    usingMicrosoft.AspNetCore.Http;usingMicrosoft.AspNetCore.Mvc;usingPT.BLL;usingPT.Common;usingPT.Model;usingPT.Web.Mvc.App_Start;usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Threading.Tasks;namespacePT.Web.......
  • console.log 弊端-数组有值但是打印出来空值
    情况:数组有对象但是length为0原因:该数组原本有值,但是被数组操作api改变了数组,打印出来的值是已经被操作的数组 ......