GPT前世今生-transformer-注意力机制

背景：

心理学知识，随意线索和非随意线索。

启发：

注意力机制中概念：

　　query：你的要求查询的东西。如问“你要干嘛？”

　　key：如杯子，本子

　　value：可以也是杯子本子，也可以是对应的分值(即注意力重要程度)

数学：

　　f(x) = xi，yi，即就是yi 函数表示给定一个query x，f函数会找到它所最关注的xi，yi

深度学习原理(猜想)：

　　cnn可以抽取feature，那么每个feature就是query，在下一个卷积/或别的运算时，求f(query) = 最关注的权值。

原始做法非参数注意力池化层：

其中K 为kernel。

　　可以是高斯kernel，本质度量x与xi的相近程度，这里过程就类似knn找到这个最近xi。

若想训练，则可以添加参数：

小结：注意力机制可以写为

其中α就是对于每个yi值的权重。

那么问题是：

　　1 如何确定 x呢，又如何确定 xi呢？确定了xi 如何设定对应的yi value呢

　　加入x为 feature， x为后面的计算图，位置就是xi，里面的值就是yi吗？

注意力层：

　　未完待续---------------------------------------

标签：yi,transformer,今生,feature,xi,GPT,query,注意力
From： https://www.cnblogs.com/lx63blog/p/17263874.html

ChatGPT3.5App隐私政策网址(URL)
欢迎您使用ChatGPT3.5软件服务（以下简称“本软件”），为保证您的权益，便于更好地使用本软件服务，请您务必在使用前认真阅读本协议，若您阅读并接受本协议，使用本软件提供的产品和服......
ChatGPT3.5 App技术支持网站
欢迎来到ChatGPT3.5App技术支持网站！我们的网站旨在为您提供ChatGPT3.5App的技术支持和帮助。以下是我们提供的服务：常见问题解答：我们列出了一些常见问题和解决方案......
ChatGPT接入微信 C#完整源码
1.无需搭建服务器2.winform运行程序扫码登录，就可以充当机器人调用chatGPT可实现自动回复(可以识别会话消息和群聊消息，拉入群聊@机器人可以进行群聊的消息回复)，可以申请小......
我用ChatGPT做WebRTC音视频性能优化，主打一个高效
摘要随着GPT-4的发布，AI的风越吹越旺。GPT-4可以回答问题，可以写作，甚至可以基于一张草图生成html代码搭建一个网站。即构社区的一位开发者@倪同学就基于目前在研究的WebRTC......
chatGPT教你学sql的事务
事务的隔离级别事务的隔离级别是指多个并发事务之间相互隔离的程度，主要是为了解决并发事务带来的一致性问题，它的主要作用是控制数据库中事务的可见性和可重......
免费的GPT-4 IDE工具Cursor保姆级使用教程
大家好，过去的一周，真是疯狂的一周。GPT-4震撼发布，拥有了多模态能力，不仅能和GPT3一样进行文字对话，还能读懂图片；然后斯坦福大学发布Alpaca7B，性能匹敌GPT-3.5，关键是训练......
如何快速体验ChatGPT-4模型
OpenAI免费版基于Gpt3.5，无法使用最新发布的GPT-4模型，必须开通ChatGPTPlus。但是OpenAI不但屏蔽了中国的IP地址，连国内的Visa信用卡也一同屏蔽，即使你想要付费，......
ChatGPT中文版怎么用,免费版本分享,GPT官网入口
ChatGPT的官网入口是（openai.com），虽然在国内可以访问网站，但是无法使用它提供的服务，因为需要国外IP才能注册账号，而且需要国外手机短信验证才能正常注册。 ......
与ChatGPT玩文字冒险游戏[寻五宝石]
注：文中的图片来自另一个AI生成图片的程序。我：请重新开始一个文字冒险游戏。由你来描述游戏场景（盗墓情节），由我来决定采取的动作。请详细描述场景中所有的物品、生物。如果......
别急着给中国版ChatGPT唱赞歌：“追风者”无缘“星辰大海”
文心一言发布十余天后，争论仍未有止歇的迹象。有人给出了“拉垮”的评价，相比于多轮迭代的ChatGPT，文心一言在逻辑推理、多轮对话等方面的表现不尽如人意；也有人认为给文心一言......

GPT前世今生-transformer-注意力机制

GPT前世今生-transformer-注意力机制

背景：

启发：

数学：

深度学习原理(猜想)：

注意力层：

相关文章

赞助商

阅读排行