首页 > 其他分享 >5-LSTM模型开发

5-LSTM模型开发

时间:2023-02-09 00:01:34浏览次数:33  
标签:模型 batch 网络 shape 开发 model LSTM size


"""长短期记忆网络(LSTM)是一种循环神经网络(RNN)。

这种类型的网络的一个好处是它可以学习和记住长序列,并且不依赖于预先指定的窗口滞后观察作为输入。

在Keras中,这被称为有状态,并且涉及在定义LSTM层时将“ 有状态 ”参数设置为“ True ”。

默认情况下,Keras中的LSTM层维护一个批次内的数据之间的状态。一批数据是来自训练数据集的固定大小的行数,
用于定义在更新网络权重之前要处理的模式数。默认情况下,批次之间的LSTM层中的状态被清除,
因此我们必须使LSTM成为有状态。通过调用reset_states()函数,这使我们能够对LSTM层的状态何时被清除进行细粒度控制。

LSTM层期望输入在具有以下维度的矩阵中:[ 样本,时间步长,特征 ]。

样本:这些是来自域的独立观察,通常是数据行。
时间步长:这些是给定观察的给定变量的单独时间步长。
特征:这些是在观察时观察到的单独测量。
我们在如何为网络构建Shampoo Sales数据集方面具有一定的灵活性。我们将保持简单并构建问题,
因为原始序列中的每个步骤都是一个单独的样本,具有一个时间步长和一个特征。

鉴于训练数据集被定义为X输入和y输出,它必须重新整形为Samples / TimeSteps / Features格式,例如:"""


#X, y = train[:, 0:-1], train[:, -1]
#X = X.reshape(X.shape[0], 1, X.shape[1])



"""必须在LSTM层中使用“ batch_input_shape ”参数指定输入数据的形状作为元组,该元组指定读取每个批次的预期观察数,时间步数和特征数。

批量通常远小于样品总数。它与时期的数量一起定义了网络学习数据的速度(权重更新的频率)。

定义LSTM层的最后一个导入参数是神经元的数量,也称为内存单元或块的数量。这是一个相当简单的问题,1到5之间的数字就足够了。

下面的行创建了一个LSTM隐藏图层,该图层还通过“ batch_input_shape ”参数指定输入图层的期望值。"""


#layer = LSTM(neurons, batch_input_shape=(batch_size, X.shape[1], X.shape[2]), stateful=True)

#neurons=神经元个数,即记忆单元个数,1~5 就很高效了
#batch_input_shape=表示每个batch需要读取的数据格式(batch_size=每batch读的数据行数,步长,属性数)
#batch通常和epoch一起
#epochs:确定网络学习数据快慢,即权重的更新频率


"""网络需要输出层中的单个神经元具有线性激活,以预测下一时间步骤的洗发水销售数量。



在编译网络时,我们必须指定一个损失函数和优化算法。我们将使用“ mean_squared_error ”作为损失函数,
因为它与我们感兴趣的RMSE紧密匹配,以及有效的ADAM优化算法。

使用Sequential Keras API定义网络,下面的代码片段创建并编译网络。"""


#model = Sequential()#定义网络模型
#model.add(LSTM(neurons, batch_input_shape=(batch_size, X.shape[1], X.shape[2]), stateful=True))#添加一个LSTM隐藏图层
#model.add(Dense(1))#再用 model.add 添加神经层,添加的是 Dense 全连接神经层,所谓全连接就是每个节点都和上一层的节点有连接
#model.compile(loss='mean_squared_error', optimizer='adam')#mean_squared_error ”作为损失函数,adam是优化算法

"""编译后,它可以适合训练数据。由于网络是有状态的,我们必须控制何时重置内部状态。
因此,我们必须在所需数量的时期内一次手动管理一个时期的训练过程。

默认情况下,一个纪元内的样本在暴露给网络之前进行混洗。同样,这对于LSTM来说是不合需要的,因为我们希望网络在通过观察序列学习时建立状态。
我们可以通过将“ shuffle ” 设置为“ False ” 来禁用样本的混洗。

此外,默认情况下,网络会在每个时代结束时报告有关模型学习进度和技能的大量调试信息。我们可以通过将“ verbose ”参数设置为“ 0 ” 级别来禁用它。

然后我们可以在训练时期结束时重置内部状态,为下一次训练迭代做好准备。

下面是一个手动使网络适应训练数据的循环。"""


#for i in range(nb_epoch):
#	model.fit(X, y, epochs=1, batch_size=batch_size, verbose=0, shuffle=False)
#	model.reset_states()
#verbose设置为0可以禁用网络在每个时代结束时报告有关模型学习进度和技能的大量调试信息
#默认情况下,一个周期内的样本在暴露给网络之前进行混洗,可以通过设置shuffle = False来禁用样本混洗


"""综上所述,我们可以定义一个名为fit_lstm()的函数来训练和返回LSTM模型。作为参数,它将训练数据集置于监督学习格式,批量大小,
多个时期和许多神经元中。"""


def fit_lstm(train, batch_size, nb_epoch, neurons):
	X, y = train[:, 0:-1], train[:, -1]#获取数据集
	X = X.reshape(X.shape[0], 1, X.shape[1])#转换为矩阵
#	model = Sequential()#调用模型
#	model.add(LSTM(neurons, batch_input_shape=(batch_size, X.shape[1], X.shape[2]), stateful=True))#添加模型,设置模型参数
#	model.add(Dense(1))#再用 model.add 添加神经层,添加的是 Dense 全连接神经层
#	model.compile(loss='mean_squared_error', optimizer='adam')#定义损失函数和优化算法
#	for i in range(nb_epoch):#按照给定的训练周期循环训练
#		model.fit(X, y, epochs=1, batch_size=batch_size, verbose=0, shuffle=False)#训练模型
#		model.reset_states()#在训练时期结束时重置内部状态,为下一次训练迭代做好准备
#	return model#返回最后训练模型的参数


"""batch_size必须设置为1.这是因为它必须是训练和测试数据集大小的因子。

的预测()的模型函数也由批量大小约束; 它必须设置为1,因为我们有兴趣对测试数据进行一步预测。

我们不会在本教程中调整网络参数; 相反,我们将使用以下配置,通过一些试验和错误找到:

批量大小:1
时代:3000
神经元:4
作为本教程的扩展,您可能希望探索不同的模型参数,看看是否可以提高性能。

更新:考虑尝试1500个纪元和1个神经元,性能可能会更好!
接下来,我们将了解如何使用适合的LSTM模型进行一步预测。"""

标签:模型,batch,网络,shape,开发,model,LSTM,size
From: https://www.cnblogs.com/lotuslaw/p/17103780.html

相关文章

  • 6-完整的LSTM案例
    importpandasaspdimportdatetimefromsklearn.metricsimportmean_squared_errorfromsklearn.preprocessingimportMinMaxScalerfromkeras.modelsimportSequ......
  • 如何使用 Node.js 和 OpenAI API 快速开发一个私有的 ChatGPT 智能聊天机器人程序 All
    如何使用Node.js和OpenAIAPI快速开发一个私有的ChatGPT智能聊天机器人程序AllInOneOpenAIAPIhttps://platform.openai.com/docs/libraries/node-js-library$......
  • 【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享|附代码数据
    原文链接:http://tecdat.cn/?p=22410 最近我们被客户要求撰写关于逻辑回归的研究报告,包括一些图形和统计输出。本文介绍了逻辑回归并在R语言中用逻辑回归(Logistic回归)模......
  • #yyds干货盘点#Vite开发环境搭建
    ​​Vite​​​现在可谓是炙手可热,可能很多小伙伴还没有使用过​​Vite​​​,但是我相信大多数小伙伴已经在使用​​Vite​​​了,因为是太香了有没有。可能在使用过程中很多......
  • 机器学习模型集成管理介绍
    在本文中,我将尝试对MLOps进行友好的介绍,并以简单的方式解释关键概念。作为一开始也觉得很难理解的人,我理解有必要对这个主题进行更简单的介绍。我希望在阅读本文后,初学者......
  • 自开发钉钉机器人消息推送报警数据
    一.电脑下载钉钉软件因为要添加钉钉机器人需要在电脑端软件去做安全设置,所以需要在电脑上下载钉钉,并添加机器人;下载地址:https://www.dingtalk.com/#/(1)点击网页右上角的......
  • 一款WPF开发的B站视频下载开源项目
    更多开源项目请查看:一个专注推荐优秀.Net开源项目的榜单今天给推荐一款C#开发的、界面简洁的哔哩哔哩视频下载工具。项目简介这是一款基于WPF开发的,B站下载工具,操作界......
  • openwrt开发使用-wifi命令配置开发
    前言今天分享的内容是openwrt里面wifi的开发常用操作。作者:良知犹存转载授权以及围观:欢迎关注微信公众号:羽林君或者添加作者个人微信:become_meOpenWrt简单命令配置......
  • three.js教程4-层级模型
    1、组对象Group、层级模型-形成树状结构//创建两个网格模型mesh1、mesh2constgeometry=newTHREE.BoxGeometry(20,20,20);constmaterial=newTHREE.MeshLambe......
  • three.js教程3-模型对象、材质
    1、Object3D的position和scale是三维向量Vector3因此模型的位置和缩放等变化,也是使用Vector3的属性和方法实现,查询文档Vector3。三维向量Vector3有xyz三个分量,查看three.......