2024.3.9 神经语言网络模型$\longmapsto$主要是预测出下一个词

神经网络+语言模型——》用是神经网络的方法去完成以下两个和人说的话相关的任务

第二个任务：v

”判断“，”一个“，”词“，“的”，” “

假设词库里有”词性“和”火星“

P(' '|"判断"，”一个“，”词“，”的“)　　

‘词性’

w1,w2,w3,w4(对应上述四个单词的独热编码)

W1*Q=C1
W2*Q=C2
W3*Q=C3
W4*Q=C4  #每个c都代表单词对应的词向量

C=[C1,C2,C3,C4]
Q就是上图中一个V*m随机矩阵，是一个参数（可学习）

”判断“，”一个“，”词“，“的”，”词性“

softmaX(U[tanh(WC+b1)]+b2)=[0.1,0.1,0.2,0.2,0.4] $\in[1,V_L]$

两层感知机

独热编码（one-hot编码）

独热编码：让计算机认识单词

词典V（新华字典里面把所有词集合成为一个集合V)

假设词典里面只有8个单词，计算机不认识单词，但是我们需要计算机认识单词”fruit"

独热编码：给出一个8*8的矩阵

“time”—>10000000

“fruit”—>01000000

"banana"—>00000001

余弦相似度：计算两者的相似度（ 0 ）—词向量(矩阵乘法)

如果向量a和b不是二维而是n维，上述余弦的计算法仍然正确。假定a和b是两个n维向量，a是，b是，则a与b的夹角的余弦等于：

余弦值越接近1，就表明夹角越接近0度，也就是两个向量越相似，夹角等于0，即两个向量相等，这就叫"余弦相似性"

词向量（神经网络语言模型的副产品Q)

给我一个词，如“判断”——》独热编码为W1[1,0,0,0,0]（假设总共有5个词）

W1*Q=c1（c1则为“判断”这个词的词向量）

词向量：就是用一个向量来表示一个单词

并且可以通过控制Q来控制词向量的维度（大小）

通过词向量也间接解决了词之间的相似度问题

再次采用余弦相似度计算两个词向量之间的相似度，结果不再是0，从而可以一定程度上描述两个词之间的相似度

训练出神经网络模型，找到一个合适的Q矩阵，得到一个合适的词向量

如果我们得到的词向量，第一个比较的问题也被解决了（后续的下游问题）

总结

神经网络语言模型：通过神经网络解决两个人说的话的问题

产生的副产品：Q矩阵$\longmapsto$新的词向量（词向量可以选择词向量的维度，可以求出两个词之间的相似程度）

引出之后会讲到的下游任务

标签：编码,模型,独热,网络,余弦,单词,神经网络,神经,向量
From： https://www.cnblogs.com/adam-yyds/p/18062949

无模型的强化学习方法
无模型的强化学习算法学习「强化学习」（基于这本教材，强烈推荐）时的一些总结，在此记录一下。动态规划算法需要马尔可夫决策过程是已知的（状态转移函数、奖励函数已知），智能体不用真正地与环境互动也能在「理性」世界里求得最优策略。现实通常并非如此，环境已知恰恰是很少见的。所以这里......
统计语言模型
2024.3.8统计语言模型统计语言模型1.语言模型语言(人说的话)+模型（表示某个东西，完成某个任务）P1（“判断这个词的词性”），P2（“判断这个词的磁性”）**“判断这个词的"**2.统计语言模型用统计的方法去解决上述两个问题“判断这个词的词性”="判断"，"这个",”词“，”的......
C++ Qt开发：QNetworkInterface网络接口组件
Qt是一个跨平台C++图形界面开发库，利用Qt可以快速开发跨平台窗体应用程序，在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置，实现图形化开发极大的方便了开发效率，本章将重点介绍如何运用QNetworkInterface组件实现查询详细的网络接口参数。在Qt网络编程中，QNetworkInterface是......
网络安全基础知识
POC（ProofofConcept）漏洞证明，漏洞报告中，通过一段描述或一个样例来证明漏洞确实存在EXP（Exploit）漏洞利用，某个漏洞存在EXP，意思就是该漏洞存在公开的利用方式（比如一个脚本）0DAY含义是刚刚被发现，还没有被公开的漏洞，也没有相应的补丁程序，威胁极大。CVE（CommonVulnerabiliti......
苹果AppleMacOs系统Sonoma本地部署无内容审查(NSFW)大语言量化模型Causallm
最近Mac系统在运行大语言模型（LLMs）方面的性能已经得到了显著提升，尤其是随着苹果M系列芯片的不断迭代，本次我们在最新的MacOs系统Sonoma中本地部署无内容审查大语言量化模型Causallm。这里推荐使用koboldcpp项目，它是由c++编写的kobold项目，而MacOS又是典型的Unix操作系统，自带clang编......
docker-compose3中网络通信
不同docker-compose中容器之间网络通信Adocker-compose文件中创建网络,并启动version:"3"services:nginx001:container_name:nginx001#容器名称domainname:nginx001#设置容器的域名。当容器需要与其他容器或主机进行通信时，可以使用域名来进行寻址。h......
王道计算机网络截图笔记
目录第一章概述1.计算机网络概览1.1网络与计算机网络1.2计算机网络的功能1.3计算机网络的组成1.3.1组成部分1.3.2工作方式1.3.3功能组成1.4计算机网络的分类1.5小结2.计算机网络的标准化工作2.1标准的分类2.2RFC2.3标准化工作的相关组织2.4小结3.计算机网络性能指标3......
AI大模型ChatGLM2-6B 第三篇 - ChatGLM2-6B部署
clone项目下载模型https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2Fchatglm2-6b&mode=list切换conda里面的py39环境cd/home/chq/ChatGLM2-6Bcondaactivatepy39执行pipinstall(py39)root@chq:/home/chq/ChatGLM2-6B#pipinstall-rrequirements.txtC......
AI大模型ChatGLM2-6B - 基础环境搭建
硬件环境cpui5-13600k内存64G显卡rtx3090软件环境window11专业版22H2n卡驱动：526.47wsl2ubuntu22.04安装nvidia-cuda-toolkit打开wsl2的ubuntu，安装nvidia驱动程序sudoaptupdatesudoaptupgradesudoubuntu-driversdevicessudoaptinstallnvidia-driver-......
05盒子模型
1<!DOCTYPEhtml>2<htmllang="en">3<head>4<metacharset="UTF-8">5<metaname="viewport"content="width=device-width,initial-scale=1.0">6<title>Document......

神经语言网络模型

2024.3.9 神经语言网络模型$\longmapsto$主要是预测出下一个词

独热编码（one-hot编码）

词向量（神经网络语言模型的副产品Q)

如果我们得到的词向量，第一个比较的问题也被解决了（后续的下游问题）

总结

相关文章

赞助商

阅读排行