SciTech-BigDataAIML-LLM-Transformer Series-Positional Encoding: 位置编码: 统计模型(够多参数够高精度)+"够大数据"

时间：2024-08-15 15:26:36浏览次数：14

标签：Transformer NN 训练 Encoding 模型 large PE 数据

词汇

WE(Word Embedding): 词嵌入
PE(Positional Encoding): 位置编码

统计模型和大数据的本源是由"MI(移动互联网)"和"IoT(万物互联)"决定的

1 真正改驱“改革生产生活习惯”的是“国家政策”与“政府”。

新经济的产生是以“改革生产生活习惯”为前提.
生产生活的习惯改变:
行政办公、经商、工作和生活都必须用到智能设备、智能信息系统。

国家教育和培训为整个行业提供充分的人力资源:
开设新课程, 并且教育和培训出大量的AI人工智能、ML机器学习、DA数据分析、SW软件与HW硬件人才;
国家政策的产业引导朝"智能化、信息化、自动化"升级换代
即新经济的一个大方向.
产业和民间资本的投融资促进自然经济的蓬勃发展。

2 人人都使用移动智能终端(智能手机、平板、电脑和其他设备)和智能信息系统

大量的真实有效数据，是统计模型的必要条件。
而大多数人的生活, 都在使用这些智能设备.
使得每个人都产生“大量的数据”, 为整个行业提供“实际数据";
日夜产生源源不断的真实数据。

统计概率模型的本质决定PE:

有“预训练”和“预测应用”两个阶段;
预测应用阶段的“规律与可信可靠度”, 由“预训练阶段的大量数据”与“模型本身”决定。
“预训练的'大量数据'”是“上确界”:
统计概率模型(包括transformer), 预测时“用到的规律”, 都是由“模型”总结“训练时大量数据”得到的统计规律。
“模型本身”的选择设计(统计分析)与“实现”也非常重要
- 首先"模型本身"要有"够多参数与够高精度"(NN"深度神经网络"要有足够的"深度")
  学习“大量数据的规律”才能保障“任何模型”的有效性。
- 模型本身选取的“统计方法”和“实现”是研究人员决定
  例如, 常用的Linear Regression模型, CNN卷积模型于图像处理，LSTM/Transformer于NLP, ...

Transformer的\(\large PE\)是统计概率模型的一部分

1 预训练阶段: Transformer实际用的是复合\(\large WE\ +\ PE\)的新特征.

2 预训练阶段: 复合\(\large WE\ +\ PE\)的新特征的有效性

3 举例: 预训练数据上的 3个\(\large WE\) 与 3个\(\large PE\) 可组合出9个不同的复合新特征实例.

标签：Transformer,NN,训练,Encoding,模型,large,PE,数据
From： https://www.cnblogs.com/abaelhe/p/18360683

Target Encoding（目标编码）
TargetEncoding（目标编码），这是一种强大的特征编码技术，特别适用于处理高基数分类变量。基本原理：TargetEncoding的核心思想是用目标变量的平均值来替换分类变量的每个类别。这种方法试图捕捉每个类别与目标变量之间的关系。工作方式：对于分类变量的每个类别，计算该类别对应的目......
序列建模之循环和递归网络 - 双向RNN篇
序言在序列建模的广阔领域中，循环神经网络（RNN\text{RNN}RNN）以其独特的循环结构，在处理序列数据方面展现出了强大的能力。然而，传统的单向......
嵌入式linux mkdir: cannot create directory 'test': Read-only file system
这个错误表明你尝试在嵌入式Linux系统上创建一个名为'test'的目录时失败了，因为文件系统被挂载为只读模式。在只读模式下，你无法修改文件系统的内容，包括创建、删除文件或目录。解决方法：1.重新挂载文件系统为读写模式。你可以使用mount命令重新挂载文件系统，并指定读写权限。例如：......
OpennCV
一、介绍OpenCV（opensourcecomputervisionlibrary）是一个基于BSD许可（开源）发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和......
问题--Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the
上班后发现服务不在线，docker也无法启动，检查daemon.json配置文件出问题了。检查：#查看docker内全部进程dockerps提示错误：CannotconnecttotheDockerdaemonatunix:///var/run/docker.sock.TSthedockerdaemonrunning? #查看docker状态systemctls......
基于Transformer的锂电池剩余寿命预测 [电池容量提取+锂电池寿命预测] Matlab代码
基于Transformer的锂电池剩余寿命预测[电池容量提取+锂电池寿命预测]Matlab代码无需更改代码，双击main直接运行！！！1、内含“电池容量提取”和“锂电池寿命预测”两个部分完整代码和NASA的电池数据2、提取NASA数据集的电池容量，此处以以历史容量作为输入，采用迭代预测的方法对......
Transformer模型在自然语言处理中有哪些具体的应用场景？
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可......
LoadRunner常用函数介绍
内置函数和Jmeter差不多，Jmeter更火，更好百度，毕竟开源，用的人多，所以有些函数如果不太懂用法，可以百度Jmeter作为参考来使用LR。大家使用中应用函数不会的话留言就行，我开始用的时候反正不懂，不明白怎么使用，怎么应用，有和我一样的童鞋可交流脚本中常用函数事务组lr_start_transac......
【机器学习】CNN卷积神经网络算法的基本概念、训练过程（含python代码）和应用领域
引言卷积神经网络（ConvolutionalNeuralNetwork，CNN）是一种深度学习模型，主要用于图像识别、图像分类、物体检测和计算机视觉等领域文章目录引言一、卷积神经网络（ConvolutionalNeuralNetwork，CNN）1.1基本原理1.2主要结构1.2.1卷积层（ConvolutionalLayer）1.2.2激活函......
LoadRunner内置参数介绍
参数菜单我用的是2023版本，每个版本的位置不一样，通常差不多，2种方式进入参数菜单菜单栏进入参数点击设计-参数-参数列表脚本右键进入参数选中你要参数化的内容，右键：使用参数替换-参数列表参数列表左侧为参数的列表（NewParam为参数名，可自定义），右侧为参数的设置参数......