SummerResearch_Log_20230627

时间：2023-06-27 20:33:58浏览次数：43

标签：20230627 Log 2522% Attention Encoder blog Decoder SummerResearch net

Working Content:

1. 今天开始看Vision Transformer(ViT)：

看之前需要一些基础：

（1）RNN（Recurrent NN，循环神经网络）：

一段连续的信息，前后信息之间是有关系地，必须将不同时刻的信息放在一起理解。如果是普通的神经网络，每个输入之间是相互独立的，如果是RNN，则可以接收上一个输入传递的信息。如下图所示：

缺点：RNN无法处理长距离依赖问题，通俗点就是不能处理一些较长的序列数据

（https://blog.csdn.net/Tink1995/article/details/104868903?spm=1001.2014.3001.5502）

（2）与之相对比，LSTM和GRU可以更好地处理长序列，具体的有时间再写。

（3）Encoder-Decoder与Attention

如果是普通的Encoder-Decoder，则如上所说，将最后一个隐藏层状态值h4作为语义编码c。

如果是Attention机制的Encoder-Decoder，则会将所有隐藏层状态值存为语义编码c，并且每个隐藏层状态值是带有一个权重值的，代表着其重要程度。

Transformer：

以下是Transformer的具体情况：

关于Encoder：

更细节的是下图：

这三张图非常清楚地写出了Self-Attention层的具体情况：

（https://blog.csdn.net/qq_37541097/article/details/117691873）

关于Decoder：

从上图可以看出：

结构实际上就比Encoder多了中间一小部分：

其他不同的是"Masked Multi-Head Attention"，这里的Masked可以理解成同时输入与顺序输入，前者是a1a2a3a4都会影响b1b2b3b4，后者是b1只受a1影响，b2只受a1a2影响，以此类推。

（https://blog.csdn.net/Tink1995/article/details/105080033?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522168773679216800213089771%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=168773679216800213089771&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-105080033-null-null.142^v88^control_2,239^v2^insert_chatgpt&utm_term=transformer&spm=1018.2226.3001.4187）

标签：20230627,Log,2522%,Attention,Encoder,blog,Decoder,SummerResearch,net
From： https://www.cnblogs.com/Hexh/p/17508121.html

题目集7~11的总结性blog
一.前言这是这学期最后一次blog了，其中有7~11五次题目集题目集07：只有一道题，该题为菜单计价程序-5，是菜单计价程序-3的迭代，与菜单计价程序-4属于不同的迭代分支。 ......
Python logging模块(转载)
Pythonlogging模块日志级别CRITICAL=50#FATAL=CRITICALERROR=40WARNING=30#WARN=WARNINGINFO=20DEBUG=10NOTSET=0#不设置默认级别为warning，默认打印到终端importlogginglogging.debug('调试debug')logging.info('消息info')logging.warnin......
m基于FPGA的数据串并并串转换系统verilog实现,包含testbench,可以配置并行数量
1.算法仿真效果本系统进行了两个平台的开发，分别是： Vivado2019.2 Quartusii18.0+ModelSim-Altera6.6d StarterEdition 其中Vivado2019.2仿真结果如下：分别进行2路，4路，8路，16路并行串行转换 Quartusii18.0+ModelSim-Altera6.6d Starter......
使用 nuxt3 开发简约优雅的个人 blog
起因很早前我就有过搭建个人博客的想法，但是我希望使用纯前端实现，这样就不需要付出额外的后端维护成本，维护成本又低，而且更加安全。网上也有很多博客框架但是也不符合我的需求，所以我使用了nuxt3+ts搭建了自己的个人博客，更加贴合个人需求，在功能和样式也能做到随心所欲前端的同学......
系统断电后，MySQL重启失败：[ERROR] Binlog has bad magic number； It‘s not a binary lo
系统断电后，MySQL重启失败：[ERROR]Binloghasbadmagicnumber；It‘snotabinarylogfilethatcanbeusedbythisversionofMySQL [ERROR]Can'tinittclog[ERROR]Aborting在Windows系统上，Mysql服务没启动，在启动Mysql服务时，报以下错误：系统出错。发生系......
Git log日志操作-6
Gitlog日志操作区别：Gitlog：作用域是本地版本库。查看的是commit-m提交的内容。只add未commit不会生成log信息。支持简单查看，顺序查看，按时间和作者筛选Gitblame：作用域是工作区。查看的是工作区的最新内容，即使修改，未add，commit也可以打印。功能类似于linux中的cat命令一．Gitlog1......
Login.cshtml
@{ViewData["Title"]="Login";Layout="~/Views/Shared/_Layout_default.cshtml";}@sectionCss{<style>body{/*加载背景图*/background-image:url(../../icon/aa.png);......
adb logcat使用方法
adblogcat命令使用一．android日志介绍1.打印日志的原理android日志系统包括一个内核驱动程序和用于存储日志消息的内核缓冲区。一个用于查看日志消息的独立程序logcat。2.日志的类型4个不同日志缓冲区，为系统的不同部分提供日志记录，所有的缓冲区都在设备的/dev/log下：/dev/log......
LoginController
usingMicrosoft.AspNetCore.Http;usingMicrosoft.AspNetCore.Mvc;usingPT.BLL;usingPT.Common;usingPT.Model;usingPT.Web.Mvc.App_Start;usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Threading.Tasks;namespacePT.Web.......
console.log 弊端-数组有值但是打印出来空值
情况：数组有对象但是length为0原因：该数组原本有值，但是被数组操作api改变了数组，打印出来的值是已经被操作的数组 ......

SummerResearch_Log_20230627

Working Content:

相关文章

赞助商

阅读排行