首页 > 其他分享 >Keras -- Embedding

Keras -- Embedding

时间:2022-10-13 10:05:00浏览次数:35  
标签:dim None embeddings Keras -- length Embedding output input


keras.layers.Embedding(input_dim, output_dim, embeddings_initializer='uniform', embeddings_regularizer=None, activity_regularizer=None, embeddings_constraint=None, mask_zero=False, input_length=None)

**将正整数(索引值)转换为固定尺寸的稠密向量。 例如: [[4], [20]] -> [[0.25, 0.1], [0.6, -0.2]]
该层只能用作模型中的第一层。**

model = Sequential()
model.add(Embedding(1000, 64, input_length=10))
# 模型将输入一个大小为 (batch, input_length) 的整数矩阵。
# 输入中最大的整数(即词索引)不应该大于 999 (词汇表大小)
# 现在 model.output_shape == (None, 10, 64),其中 None 是 batch 的维度。

input_array = np.random.randint(1000, size=(32, 10))

model.compile('rmsprop', 'mse')
output_array = model.predict(input_array)
assert output_array.shape == (32, 10, 64)

参数:

input_dim: int > 0。词汇表大小, 即,最大整数 index + 1。
output_dim: int >= 0。词向量的维度。
embeddings_initializer: embeddings 矩阵的初始化方法 。
embeddings_regularizer: embeddings matrix 的正则化方法。
embeddings_constraint: embeddings matrix 的约束函数。
mask_zero: 是否把 0 看作为一个应该被遮蔽的特殊的 "padding" 值。 这对于可变长的 循环神经网络层 十分有用。 如果设定为 True,那么接下来的所有层都必须支持 masking,否则就会抛出异常。 如果 mask_zero 为 True,作为结果,索引 0 就不能被用于词汇表中 (input_dim 应该与 vocabulary + 1 大小相同)。
input_length: 输入序列的长度,当它是固定的时。 如果你需要连接 Flatten 和 Dense 层,则这个参数是必须的 (没有它,dense 层的输出尺寸就无法计算)。

输入尺寸

尺寸为 (batch_size, sequence_length) 的 2D 张量。

输出尺寸

尺寸为 (batch_size, sequence_length, output_dim) 的 3D 张量。


标签:dim,None,embeddings,Keras,--,length,Embedding,output,input
From: https://blog.51cto.com/u_8771474/5752242

相关文章

  • part2-HOT100+剑指Offer
    leetcode:​​https://leetcode-cn.com/problemset/algorithms/​​​类别:热题HOT100easy篇共26道No.21--------------可将滑动窗口作为一个章节来看啦。。。标签:哈希......
  • Guzzle PHP HTTP客户端使用
    什么是guzzle安装GuzzleGuzzle基本使用安装PHPUnitAPI单元测试一.什么是guzzleGuzzle是一个PHPHTTP客户端,可以轻松发送HTTP请求,并且可以轻松集成Web服务。二.安装Guzzle1.......
  • KCF Matlab 代码运行
    我Matlab版本是R2016b%figure('Number','off','Name',['Precisions-'%error%figure('Name',['Precisions-'figure('NumberTitle','off',......
  • 库存超发问题
    1.库存超发的原因是什么?在执行商品购买操作时,有一个基本流程:例如初始库存有3个。第一个购买请求来了,想买2个,从数据库中读取到库存有3个,数量够,可以买,减库存后,更新库存为1个......
  • 临界资源和临界区
    1.临界资源临界资源是一次仅允许一个进程使用的共享资源。各进程采取互斥的方式,实现共享的资源称作临界资源。属于临界资源的硬件有,打印机,磁带机等;软件有消息队列,变量,数组,缓......
  • wabpack按需加载
    对于采用单页应用作为前端架构的网站来说,会面临着一个网页需要加载的代码量很大的问题,因为许多功能都集中的做到了一个HTML里。这会导致网页加载缓慢、交互卡顿,用户体验......
  • 如何30分钟搭建kubernets集群
    ​在master上安装rancher。其他node,安装docker,不需要安装rancher。每个服务器都得说清楚master,noderancher的相关资料:​​​https://blog.51cto.com/13043516/2299949​......
  • 软件测试入门学习
    caohongxing的博客​软件测试2小时入门​​​https://study.163.com/course/courseMain.htm?courseId=1004794006&trace_c_p_k2=debbdb37dde34011af67c8e4f996a17a​​......
  • 源码安装PHP扩展的两种方式
    Pear:php代码层面的扩展,PEAR的所有扩展都是用纯粹的PHP代码编写的,用户在下载到PEAR扩展以后可以直接使用将扩展的代码包含到自己的PHP文件中使用PECL:底层扩展而PECL是使用......
  • Illustrator 2021绘图软件下载 (AI 2021中文直装版)v25.4.1mac/win
    哪里可以下载 illustrator 2021直装版?illustrator,常被称为“AI”,借助这款行业标准的矢量图形软件,您可以制作适用于印刷、Web、视频和移动设备的徽标、图标、绘图、版式......