29.8.4 训练和测试数据集的划分
# 设置数据划分的阈值
threshold = int(X.shape[0] * 0.75) # 75%的数据用于训练
# 75%的数据用于训练
X_train, y_train = X[:threshold], y[:threshold]
# 25%的数据用于测试
X_test, y_test = X[threshold:], y[threshold:]
# 打印训练集和测试集的形状
print("X_train shape:", X_train.shape)
print("y_train shape:", y_train.shape)
print("X_test shape:", X_test.shape)
print("y_test shape:", y_test.shape)
X_train shape: (3468, 13, 13)
y_train shape: (3468,)
X_test shape: (1156, 13, 13)
y_test shape: (1156,)
29.8.5 构建和训练模型
- 设置模型架构:将定义模型架构,包括一个或多个层的类型、神经元的数量、激活函数和输入形状。
- 编译模型:接下来,将通过指定损失函数、优化器以及任何其他希望监控的指标来编译模型。
- 训练模型:最后,将通过指定训练的轮数、批次大小以及训练数据来训练模型。
- 评估模型:一旦模型训练完成,我们将通过计算在验证数据上的准确性和其他性能指标来评估模型。
# 定义一个Sequential模型
model = Sequential()
# 添加一个与训练数据形状相同的输入层
model.add(InputLayer((X_train.shape[1], X_train.shape[2])))
# 添加一个具有64个隐藏状态的GRU层
# 添加一个具有8个神经元并使用ReLU激活的Dense层
model.add(Dense(8, 'relu'))
# 添加一个具有1个神经元并使用线性激活的输出层
model.add(Dense(1, 'linear'))
# 打印模型的摘要
Model: "sequential"
Layer (type) Output Shape Param #
gru (GRU) (None, 64) 15168
dense (Dense) (None, 8) 520
dense_1 (Dense) (None, 1) 9
Total params: 15,697
Trainable params: 15,697
Non-trainable params: 0
# 创建一个早期停止回调以监控验证损失
callback = EarlyStopping(
# 监控验证损失
# 损失变化的最小值,才算作改进
# 如果连续5个周期没有改进则停止训练
# 输出详细模式
# 自动选择模式
# 监控数量的基准值
# 是否从最佳周期恢复模型权重
# 编译模型
model.compile(loss='mse', optimizer=Adam(learning_rate=0.001), metrics=[RootMeanSquaredError()])
# 训练模型
history = model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=100, callbacks=callback)
109/109 [==============================] - 4s 7ms/step - loss: 6.7591e-04 - root_mean_squared_error: 0.0260 - val_loss: 0.0035 - val_root_mean_squared_error: 0.0595
Epoch 2/100
109/109 [==============================] - 0s 4ms/step - loss: 1.7683e-05 - root_mean_squared_error: 0.0042 - val_loss: 0.0033 - val_root_mean_squared_error: 0.0571
Epoch 3/100
109/109 [==============================] - 0s 4ms/step - loss: 1.0447e-05 - root_mean_squared_error: 0.0032 - val_loss: 0.0033 - val_root_mean_squared_error: 0.0576
Epoch 4/100
109/109 [==============================] - 0s 4ms/step - loss: 7.8711e-06 - root_mean_squared_error: 0.0028 - val_loss: 0.0034 - val_root_mean_squared_error: 0.0584
Epoch 5/100
109/109 [==============================] - 0s 4ms/step - loss: 6.9226e-06 - root_mean_squared_error: 0.0026 - val_loss: 0.0033 - val_root_mean_squared_error: 0.0574
Epoch 6/100
109/109 [==============================] - 0s 4ms/step - loss: 6.7276e-06 - root_mean_squared_error: 0.0026 - val_loss: 0.0035 - val_root_mean_squared_error: 0.0588
Epoch 00006: early stopping
29.8.6 使用 GRU 进行预测
门控递归单元(GRU)是一种用于处理序列数据的递归神经网络(RNN)变体。GRU 通过引入门控机制来解决传统 RNN 在长序列训练中遇到的梯度消失和爆炸问题。它包含两个主要的门控:重置门和更新门。重置门决定了之前状态对当前计算的影响程度,而更新门则控制了当前状态对模型的影响。GRU 相较于长短期记忆(LSTM)网络,结构更简单,计算更高效,能够在处理序列数据时提供更好的性能。使用 GRU 进行预测时需要注意:
- 确保数据规范化:在将数据输入 GRU 模型之前,必须确保数据已经规范化。这有助于确保模型不会对某些特征产生偏倚。
- 选择合适的学习率:选择一个既不太大也不太小的学习率。这将有助于确保模型不会过拟合或欠拟合数据。
- 使用适当的正则化:正则化有助于防止过拟合和欠拟合。使用适当的正则化技术,如 dropout、L2 正则化或早期停止,以确保模型不会过拟合或欠拟合数据。
- 调整模型超参数:调整模型的超参数,如层数、每层的神经元数量、优化器等,以确保模型能够在未见数据上良好地进行泛化。
- 使用良好的验证策略:一个好的验证策略对于确保模型在未见数据上能够良好地泛化非常重要。使用交叉验证、保留法或自助法等良好的验证策略,以确保模型能够良好地泛化。
(1)使用训练好的 GRU 模型对测试数据集 X_test 进行预测,并将预测结果转换为一维数组。随后,创建一个数据框 test_results 来对比预测值与实际值,并显示这些值。
# 使用 GRU 模型对 X_test 进行预测,然后将数据转换为一维数组
test_predictions = model.predict(X_test).flatten()
# 创建一个数据框来对比测试预测值和实际值
test_results = pd.DataFrame(data={'Test Predictions': test_predictions, 'Actuals': y_test})
# 显示这些值
Test Predictions Actuals
0 0.377864 0.376329
1 0.378204 0.380764
2 0.378463 0.381507
3 0.375202 0.376793
4 0.374757 0.371249
... ... ...
1151 0.586198 0.593833
1152 0.592010 0.601970
1153 0.590334 0.602508
1154 0.589119 0.592959
1155 0.598000 0.622413
1156 rows × 2 columns
# 绘制预测值
plt.plot(test_results['Test Predictions'])
# 绘制实际值
# 移除顶部边框
# 移除右侧边框
# 添加图例
plt.legend(['Predictions', 'Actuals'])
# 设置 y 轴标签
plt.ylabel('Predictions / Actuals')
# 设置 x 轴标签
# 设置图表标题
plt.title('Predictions and Actuals over time, GRU Model', fontsize=18)
# 显示图表
图29-25 测试集上的预测图
29.8.7 模型评估
print('MSE of the GRU model ::', round(mse(test_results['Test Predictions'], test_results['Actuals']),6))
MSE of the GRU model : 0.003459
上面的输出结果表示 GRU 模型在测试数据上的均方误差(MSE)为 0.003459,这是衡量模型预测准确性的一种方式,数值越小表明模型的预测越接近实际值。
