首页 > 其他分享 >神经语言网络模型

神经语言网络模型

时间:2024-03-09 16:57:11浏览次数:29  
标签:编码 模型 独热 网络 余弦 单词 神经网络 神经 向量

2024.3.9 神经语言网络模型$\longmapsto$主要是预测出下一个词

神经网络+语言模型——》用是神经网络的方法去完成以下两个和人说的话相关的任务

第二个任务:v

”判断“,”一个“,”词“,“的”,” “

假设词库里有”词性“和”火星“

P(' '|"判断",”一个“,”词“,”的“)  

‘词性’

w1,w2,w3,w4(对应上述四个单词的独热编码)

W1*Q=C1
W2*Q=C2
W3*Q=C3
W4*Q=C4  #每个c都代表单词对应的词向量

C=[C1,C2,C3,C4]
Q就是上图中一个V*m随机矩阵,是一个参数(可学习)

”判断“,”一个“,”词“,“的”,”词性“

softmaX(U[tanh(WC+b1)]+b2)=[0.1,0.1,0.2,0.2,0.4] $\in[1,V_L]$

两层感知机

独热编码(one-hot编码)

独热编码:让计算机认识单词

词典V(新华字典里面把所有词集合成为一个集合V)

假设词典里面只有8个单词,计算机不认识单词,但是我们需要计算机认识单词”fruit"

独热编码:给出一个8*8的矩阵

“time”—>10000000

“fruit”—>01000000

"banana"—>00000001

余弦相似度:计算两者的相似度( 0 )—词向量(矩阵乘法)

如果向量a和b不是二维而是n维,上述余弦的计算法仍然正确。假定a和b是两个n维向量,a是 ,b是 ,则a与b的夹角 的余弦等于:

余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,夹角等于0,即两个向量相等,这就叫"余弦相似性"

词向量(神经网络语言模型的副产品Q)

给我一个词,如“判断”——》独热编码为W1[1,0,0,0,0](假设总共有5个词)

W1*Q=c1(c1则为“判断”这个词的词向量)

词向量:就是用一个向量来表示一个单词

并且可以通过控制Q来控制词向量的维度(大小)

通过词向量也间接解决了词之间的相似度问题

image-20240309162547329

再次采用余弦相似度计算两个词向量之间的相似度,结果不再是0,从而可以一定程度上描述两个词之间的相似度

训练出神经网络模型,找到一个合适的Q矩阵,得到一个合适的词向量

如果我们得到的词向量,第一个比较的问题也被解决了(后续的下游问题)

总结

神经网络语言模型:通过神经网络解决两个人说的话的问题

产生的副产品:Q矩阵$\longmapsto$新的词向量(词向量可以选择词向量的维度,可以求出两个词之间的相似程度)

引出之后会讲到的下游任务

标签:编码,模型,独热,网络,余弦,单词,神经网络,神经,向量
From: https://www.cnblogs.com/adam-yyds/p/18062949

相关文章

  • 无模型的强化学习方法
    无模型的强化学习算法学习「强化学习」(基于这本教材,强烈推荐)时的一些总结,在此记录一下。动态规划算法需要马尔可夫决策过程是已知的(状态转移函数、奖励函数已知),智能体不用真正地与环境互动也能在「理性」世界里求得最优策略。现实通常并非如此,环境已知恰恰是很少见的。所以这里......
  • 统计语言模型
    2024.3.8统计语言模型统计语言模型1.语言模型语言(人说的话)+模型(表示某个东西,完成某个任务)P1(“判断这个词的词性”),P2(“判断这个词的磁性”)**“判断这个词的"**2.统计语言模型用统计的方法去解决上述两个问题“判断这个词的词性”="判断","这个",”词“,”的......
  • C++ Qt开发:QNetworkInterface网络接口组件
    Qt是一个跨平台C++图形界面开发库,利用Qt可以快速开发跨平台窗体应用程序,在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置,实现图形化开发极大的方便了开发效率,本章将重点介绍如何运用QNetworkInterface组件实现查询详细的网络接口参数。在Qt网络编程中,QNetworkInterface是......
  • 网络安全基础知识
    POC(ProofofConcept)漏洞证明,漏洞报告中,通过一段描述或一个样例来证明漏洞确实存在EXP(Exploit)漏洞利用,某个漏洞存在EXP,意思就是该漏洞存在公开的利用方式(比如一个脚本)0DAY含义是刚刚被发现,还没有被公开的漏洞,也没有相应的补丁程序,威胁极大。CVE(CommonVulnerabiliti......
  • 苹果AppleMacOs系统Sonoma本地部署无内容审查(NSFW)大语言量化模型Causallm
    最近Mac系统在运行大语言模型(LLMs)方面的性能已经得到了显著提升,尤其是随着苹果M系列芯片的不断迭代,本次我们在最新的MacOs系统Sonoma中本地部署无内容审查大语言量化模型Causallm。这里推荐使用koboldcpp项目,它是由c++编写的kobold项目,而MacOS又是典型的Unix操作系统,自带clang编......
  • docker-compose3中网络通信
    不同docker-compose中容器之间网络通信Adocker-compose文件中创建网络,并启动version:"3"services:nginx001:container_name:nginx001#容器名称domainname:nginx001#设置容器的域名。当容器需要与其他容器或主机进行通信时,可以使用域名来进行寻址。h......
  • 王道计算机网络截图笔记
    目录第一章概述1.计算机网络概览1.1网络与计算机网络1.2计算机网络的功能1.3计算机网络的组成1.3.1组成部分1.3.2工作方式1.3.3功能组成1.4计算机网络的分类1.5小结2.计算机网络的标准化工作2.1标准的分类2.2RFC2.3标准化工作的相关组织2.4小结3.计算机网络性能指标3......
  • AI大模型ChatGLM2-6B 第三篇 - ChatGLM2-6B部署
    clone项目下载模型https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p=%2Fchatglm2-6b&mode=list切换conda里面的py39环境cd/home/chq/ChatGLM2-6Bcondaactivatepy39执行pipinstall(py39)root@chq:/home/chq/ChatGLM2-6B#pipinstall-rrequirements.txtC......
  • AI大模型ChatGLM2-6B - 基础环境搭建
    硬件环境cpui5-13600k内存64G显卡rtx3090软件环境window11专业版22H2n卡驱动:526.47wsl2ubuntu22.04安装nvidia-cuda-toolkit打开wsl2的ubuntu,安装nvidia驱动程序sudoaptupdatesudoaptupgradesudoubuntu-driversdevicessudoaptinstallnvidia-driver-......
  • 05盒子模型
    1<!DOCTYPEhtml>2<htmllang="en">3<head>4<metacharset="UTF-8">5<metaname="viewport"content="width=device-width,initial-scale=1.0">6<title>Document......