Informer 时间序列模型
data
1. WTH.csv
- 水厂
- csv格式数据,总共13列,包含一列标签,12列特征,后面输入模型维度:12
- 每隔一小时一条记录
- 每个时间点对应多个特征,最后一个数据值作为数据标签
2. ECL.csv
- csv格式数据
3. data_loader
cols = list(df_raw.columns); cols.remove(self.target); cols.remove('date')
df_raw = df_raw[['date']+cols+[self.target]]
num_train = int(len(df_raw)*0.7)
num_test = int(len(df_raw)*0.2)
num_vali = len(df_raw) - num_train - num_test
border1s = [0, num_train-self.seq_len, len(df_raw)-num_test-self.seq_len]
border2s = [num_train, num_train+num_vali, len(df_raw)]
border1 = border1s[self.set_type]
border2 = border2s[self.set_type]
border: 由于输入数据是一个连续的序列,因此在原始数据集里取序列的时候【不可以把数据集里末端元素作为序列头】,因为后面没有元素了,无法组成一个完整的序列,因此在划分的训练集、测试集、验证集里会有一个序列边界border的概念,即【最后一个可以组成完整序列的序列头】元素位置。
- 以减去seq_len序列长度操作来实现【限定(组成完整序列)的边界】
model
标签:记录,df,模型,len,num,序列,Informer,csv,data From: https://www.cnblogs.com/tow1/p/17673740.html