接下来的几章我们会介绍时间序列分析模型,本章我们先来对时间序列概念进行介绍,并进行最初步的时间序列分解
时间序列分析大致可分成三大部分,分别是描述过去、分析规律和预测未来
一、基础名词解释
1.时间序列数据
时间序列数据是对同一对象在不同时间连续观察所取得的数据。
例如:
(1)从出生到现在,你的体重的数据(每年生日称一次)。
(2)中国历年来GDP的数据。
(3)在某地方每隔一小时测得的温度数据。
2.时间序列的要素与类别
(1)时间要素
年、季度、月、周、日、小时、分钟、秒
(2)数值要素
(3)时期序列与时点序列
时期序列中,数值要素反映现象在一定时期内发展的结果;
时点序列中,数值要素反映现象在一定时点上的瞬间水平。
时期序列可加,时点序列不可加
二、时间序列分解
因为时间序列是某个指标数值长期变化的数值表现,所以时间序列数值变化背后必然蕴含着数值变换的规律性,这些规律性就是时间序列分析的切入点。
一般情况下,时间序列的数值变化规律有以下四种:
1.长期变动趋势——T
长期趋势(Secular trend,T)指的是统计指标在相当长的一段时间内,受到长期趋势影响因素的影响,表现出持续上升或持续下降的趋势,通常用字母T表示。例如,随着国家经济的发展,人均收入将逐渐提升;随着医学水平的提高,新生儿死亡率在不断下降
2.季节趋势——S
季节趋势(Seasonal Variation,S)是指由于季节的转变使得指标数值发生周期性变动。这里的季节是广义的,一般以月、季、周为时间单位,不能以年作单位。例如雪糕和棉衣的销量都会随着季节气温的变化而周期变化;每年的长假(五一、十一、春节)都会引起出行人数的大量增加。
3.循环变动——C
循环变动(Cyclical Variation,C)与季节变动的周期不同,循环变动通常以若干年为周期,在曲线图上表现为波浪式的周期变动。这种周期变动的特
征表现为增加和减少交替出现,但是并不具严格规则的周期性连续变动。最典型的周期案例就是市场经济的商业周期和的整个国家的经济周期。
4.不规则变动——I
不规则变动(Irregular Variation,I)是由某些随机因素导致的数值变化,这些因素的作用是不可预知和没有规律性的,可以视为由于众多偶然因素对时间序列造成的影响(在回归中又被称为扰动项)。
5.叠加模型和乘积模型
(1)叠加模型
如果四种变动之间是相互独立的关系,那么叠加模型可以表示为:
Y=T+S+C+I
(2)乘积模型
如果四种变动之间存在相互影响关系,那么应该使用乘积模型:
Y=TxSxCxI
(3)选择哪种模型?
三、SPSS实现
1.处理时间序列中的缺失值
缺失值发生在时间序列的开头或者尾部,可采用直接删除的方法;
缺失值发生在序列的中间位置,则不能删除(删除后原有的时间序列会错位),可采用替换缺失值的方法。
2.定义时间变量
时间序列的要素之一就是时间要素,在SPSS中我们要重新定义一个时间要素
定义好后会在数据集中添加三个变量:第一个是年份,第二个是季度,第三个是年份和季度的综合,后续我们处理的时候只需要把第三个变量当作时间要素即可
3.创造时间序列图
找到SPSS中的序列图选项,设置好参数即可;其中差异和季节性差异选项就代表着差分
4.季节性分解
刚才我们创造了时间序列图,说白了就是以时间为横坐标,指标变化为纵坐标的图像,那做这个图有什么用呢?
通过这个图我们可以清楚地了解到指标变化随时间的变化程度,通过这个,我们可以判断季节性分解使用哪种模型
随着时间变化,销量数据的季节波动变化不大,因此可使用加法分解模型。
具体操作步骤如下图所示,其中我们需要选择好加法或是乘法模型。还要设置好移动平均值,这个选项只影响端点取值,周期是奇数选第一个,偶数选第二个。周期长度在下方已给出
5.结果分析
(1)变量解释
进行季节性分解后,SPSS会生成四个变量,下面我们来解释一下这四个变量
由于SPSS翻译,我们把这四个变量的标签修改成下图形式,即可很好地理解了
(2)季节性因子
从上表可知:第一二季度的季节因子为正,第三四季度的季节因子为负,这说明该产品一二季度的平均销量要高于三四季度,且第二季度的平均销量要高于全年平均水平20.930件,第四季度的平均销量要低于全年平均水平19.727件。注意: 加法季节因子的和为0
如果采用乘法分解,那么乘法季节因子的积为1;第二季度的季节因子为1.206,则表示第二季度的平均销量是全年平均销量的1.206倍。
(3)画出分解后的时序图
我们将影响销量的各个因素已经分解了出来,现在通过时序图将其可视化。分解后的各个因素已经呈现了直线的样子,这时候我们就可以使用直接拟合地方式对其进行描述,预测与规划
图右上方的可类别描述与变量的标签对应,可通过修改标签对其进行修改。此外,直线的颜色如果看不清,也可以进一步修改颜色进行优化