首页 > 其他分享 >Spatial-Temporal Identity: A Simple yet Effective Baseline for Multivariate Time Series Forecasting(

Spatial-Temporal Identity: A Simple yet Effective Baseline for Multivariate Time Series Forecasting(

时间:2023-02-20 23:23:49浏览次数:53  
标签:Multivariate Forecasting Baseline MTS STID 样本 时间 时隙 数据

原文:https://arxiv.org/pdf/2208.05233.pdf
代码:https://github.com/zezhishao/STID

Abstract

MTS预测越来越复杂,但是性能改进有限,这一现象促使作者探索MTS预测的关键因素,所以在本文中,作者将空间和时间维度上样本的不可区分性识别为关键瓶颈,并通过附加 Spatial and Temporal IDentity information (STID) 为 MTS 预测提出了一个简单而有效的基线,它同时基于简单的多层感知器 (MLP) 实现了最佳性能和效率。这些结果表明,只要解决了样本的不可区分性,就可以设计高效有效的模型,而不仅限于 STGNN。

Introduction

以图1中的MTS数据为例,其中每个时间序列都来自交通流量传感器。首先,如图1(a)所示,样本是由大小为P+F的滑动窗口生成的,其中P和F分别表示历史数据和未来数据的长度。例如,W1、W2和W3是在不同时间的三个窗口。此外,考虑到不同的变量和时期有不同的模式,我们可以预期产生许多具有相似历史数据但不同未来数据的样本。例如,图1(b)在窗口W1下显示了来自不同变量(即传感器29和301)的样本,其中历史数据(左)非常相似,而未来数据(右)不同。类似地,图1(c)中示出了在不同周期(即窗口W2和W3)下来自传感器301的样本。简单回归模型(例如,MLP)不能根据它们相似的历史数据来预测它们不同的未来数据,即它们无法区分这些样本。因此,我们将图1(b)和1(c)中两种样本对背后的特征称为样本在空间和时间维度上的不可区分性。此外,最近的一项工作ST-Norm也揭示了STGNN成功的关键因素是GCN消除了空间不可分性。

为了缓解上述瓶颈,我们设计了一种简单而有效的MTS预测基线模型STID,该模型基于附加时空身份信息的直观思想。如图2所示,STID使用一个空间嵌入矩阵\(E∈R^{N×D}\)和两个时间嵌入矩阵\(T^{TiD}∈R^{N_d×D}\)和\(T^{DiW}∈R^{N_w×D}\),表示空间和时间上的同一性。N是变量的个数,\(N_d\)是一天中的时隙数(由采样频率确定),\(N_w=7\)是一周中的天数,D是隐藏的维度。随后,STID基于简单的MLP层对信息进行编码,并通过回归层进行预测。与基于STGNN的方法相比,STID具有更简洁的体系结构,大量的实验表明,STID比基于STGNN的方法更强大,具有显著的效率优势。这些结果表明,通过解决样本的不可区分性,我们可以设计出更有效的模型,而不局限于STGNN。

PRELIMINARIES

Definition 1. Multivariate Time Series Forecasting. 多元时间序列可表示为张量\(X∈R^{T×N}\),其中T是时隙数,N是变量数。给定历史信号\(X∈R^{P×N}\),从过去的P个时隙中,多元时间序列预测的目的是在F个最近的未来时隙中预测值\(Y∈R^{F×N}\)。我们还将时间序列i在时间步长t的样本表示为\(X^i_{t-P:t}∈R^P\)和\(Y^i_{t:t+F}∈R^F\)

Definition 2. Spatial and Temporal Identities. 假设一天中的 N 个时间序列和 \(N_d\) 个时隙,一周中的 \(N_w = 7\) 天,空间和时间身份被保留在三个嵌入矩阵中,即 \(E \in R^{

标签:Multivariate,Forecasting,Baseline,MTS,STID,样本,时间,时隙,数据
From: https://www.cnblogs.com/lijinrun/p/17139386.html

相关文章