首页 > 其他分享 >SciTech-BigDataAIML-LLM-Transformer Series-Positional Encoding: 位置编码: 统计模型(够多参数够高精度)+"够大数据"

SciTech-BigDataAIML-LLM-Transformer Series-Positional Encoding: 位置编码: 统计模型(够多参数够高精度)+"够大数据"

时间:2024-08-15 15:26:36浏览次数:14  
标签:Transformer NN 训练 Encoding 模型 large PE 数据

词汇

WE(Word Embedding): 词嵌入
PE(Positional Encoding): 位置编码

统计模型和大数据的本源是由"MI(移动互联网)"和"IoT(万物互联)"决定的

1 真正改驱“改革生产生活习惯”的是“国家政策”与“政府”。

新经济的产生是以“改革生产生活习惯”为前提.
生产生活的习惯改变:
行政办公、经商、工作和生活 都必须用到智能设备、智能信息系统。

  • 国家教育和培训为整个行业提供充分的人力资源:
    开设新课程, 并且教育和培训出大量的AI人工智能、ML机器学习、DA数据分析、SW软件与HW硬件人才;
  • 国家政策的产业引导朝"智能化、信息化、自动化"升级换代
    即新经济的一个大方向.
  • 产业和民间资本的投融资促进自然经济的蓬勃发展。

2 人人都使用移动智能终端(智能手机、平板、电脑和其他设备)和智能信息系统

  • 大量的真实有效数据,是统计模型的必要条件。
    而大多数人的生活, 都在使用这些智能设备.
  • 使得每个人都产生“大量的数据”, 为整个行业提供“实际数据";
    日夜产生源源不断的真实数据。

统计概率模型的本质决定PE:

  • 有“预训练”和“预测应用”两个阶段;
    预测应用阶段的“规律与可信可靠度”, 由“预训练阶段的大量数据”与“模型本身”决定。
  • “预训练的'大量数据'”是“上确界”:
    统计概率模型(包括transformer), 预测时“用到的规律”, 都是由“模型”总结“训练时大量数据”得到的统计规律。
  • “模型本身”的选择设计(统计分析)与“实现”也非常重要
    • 首先"模型本身"要有"够多参数与够高精度"(NN"深度神经网络"要有足够的"深度")
      学习“大量数据的规律”才能保障“任何模型”的有效性。
    • 模型本身选取的“统计方法”和“实现”是研究人员决定
      例如, 常用的Linear Regression模型, CNN卷积模型于图像处理,LSTM/Transformer于NLP, ...

Transformer的\(\large PE\)是统计概率模型的一部分

1 预训练阶段: Transformer实际用的是复合\(\large WE\ +\ PE\)的新特征.

2 预训练阶段: 复合\(\large WE\ +\ PE\)的新特征的有效性

*

3 举例: 预训练数据上的 3个\(\large WE\) 与 3个\(\large PE\) 可组合出9个不同的复合新特征实例.



标签:Transformer,NN,训练,Encoding,模型,large,PE,数据
From: https://www.cnblogs.com/abaelhe/p/18360683

相关文章

  • Target Encoding(目标编码)
    TargetEncoding(目标编码),这是一种强大的特征编码技术,特别适用于处理高基数分类变量。基本原理:TargetEncoding的核心思想是用目标变量的平均值来替换分类变量的每个类别。这种方法试图捕捉每个类别与目标变量之间的关系。工作方式:对于分类变量的每个类别,计算该类别对应的目......
  • 序列建模之循环和递归网络 - 双向RNN篇
    序言在序列建模的广阔领域中,循环神经网络(RNN\text{RNN}RNN)以其独特的循环结构,在处理序列数据方面展现出了强大的能力。然而,传统的单向......
  • 嵌入式linux mkdir: cannot create directory 'test': Read-only file system
    这个错误表明你尝试在嵌入式Linux系统上创建一个名为'test'的目录时失败了,因为文件系统被挂载为只读模式。在只读模式下,你无法修改文件系统的内容,包括创建、删除文件或目录。解决方法:1.重新挂载文件系统为读写模式。你可以使用mount命令重新挂载文件系统,并指定读写权限。例如:......
  • OpennCV
    一、介绍OpenCV(opensourcecomputervisionlibrary)是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和......
  • 问题--Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the
     上班后发现服务不在线,docker也无法启动,检查daemon.json配置文件出问题了 。 检查:#查看docker内全部进程dockerps提示错误:CannotconnecttotheDockerdaemonatunix:///var/run/docker.sock.TSthedockerdaemonrunning? #查看docker状态systemctls......
  • 基于Transformer的锂电池剩余寿命预测 [电池容量提取+锂电池寿命预测] Matlab代码
    基于Transformer的锂电池剩余寿命预测[电池容量提取+锂电池寿命预测]Matlab代码 无需更改代码,双击main直接运行!!!1、内含“电池容量提取”和“锂电池寿命预测”两个部分完整代码和NASA的电池数据2、提取NASA数据集的电池容量,此处以以历史容量作为输入,采用迭代预测的方法对......
  • Transformer模型在自然语言处理中有哪些具体的应用场景?
    关注我,持续分享逻辑思维&管理思维&面试题;可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导;推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容。一顿烧烤不到的费用,让人能紧跟时代的浪潮。从普通网站,到公众号、小程序,再到AI大模型网站。干货满满。学成后可......
  • LoadRunner常用函数介绍
    内置函数和Jmeter差不多,Jmeter更火,更好百度,毕竟开源,用的人多,所以有些函数如果不太懂用法,可以百度Jmeter作为参考来使用LR。 大家使用中应用函数不会的话留言就行,我开始用的时候反正不懂,不明白怎么使用,怎么应用,有和我一样的童鞋可交流脚本中常用函数事务组lr_start_transac......
  • 【机器学习】CNN卷积神经网络算法的基本概念、训练过程(含python代码)和应用领域
    引言卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种深度学习模型,主要用于图像识别、图像分类、物体检测和计算机视觉等领域文章目录引言一、卷积神经网络(ConvolutionalNeuralNetwork,CNN)1.1基本原理1.2主要结构1.2.1卷积层(ConvolutionalLayer)1.2.2激活函......
  • LoadRunner内置参数介绍
    参数菜单我用的是2023版本,每个版本的位置不一样,通常差不多,2种方式进入参数菜单菜单栏进入参数点击设计-参数-参数列表脚本右键进入参数选中你要参数化的内容,右键:使用参数替换-参数列表参数列表左侧为参数的列表(NewParam为参数名,可自定义),右侧为参数的设置参数......