目录
(一)平稳性检验
平稳性检验是时间序列分析中的一个重要步骤,主要用于判断时间序列数据的统计特性(如均值和方差)是否随时间变化
方法一:图检验
• 时序图检验
• 自相关图检验
方法二:构造检验统计量进行假设检验(之后的文章详细介绍)
• 单位根检验
平稳性的时序图检验
平稳时间序列具有常数均值和方差。这意味着平稳序列的 时序图应该显示出该序列始终在一个常数值附近波动,而且波动的范围有界的特点。时序图:绘制时间序列的图形,通常以时间为横轴,数据值为纵轴。
观察要点:
- 趋势:若图中存在明显的上升或下降趋势,则可能是非平稳的。
- 季节性:如果数据在特定时间间隔内表现出规律性的波动,这表明可能存在季节性。
- 波动性:观察数据的波动幅度是否随时间变化,若波动幅度增大或减小,则可能是非平稳的。
平稳性的自相关图检验
自相关图是一一个平面二维坐标悬垂线图.横坐标表示延迟时期数,纵坐标表示自相关系数.悬垂线表示自相关系数的大小;通过分析序列与其滞后值之间的相关性来判断评估时间序列平稳性。
自相关的基本概念
自相关:自相关是时间序列中当前值与其过去值之间的相关性。它量化了时间序列数据在不同时间点上的依赖性。
自相关系数(ACF):表示时间序列在不同滞后数下的相关程度。自相关系数通常记作 ρ(k),其中 k 是滞后数。
解读自相关图
平稳序列:
- 自相关系数会迅速衰减,通常在滞后数的前几项内显著,之后接近零。
- 图中大部分条形应在置信区间内。
这种行为表明当前值与过去值的关系较短期,表明数据的统计特性(均值、方差)不随时间变化
非平稳序列:
- 自相关系数可能会缓慢衰减,或在多个滞后数(例如 20 以上)上仍然显著。
- 可能出现长期的自相关,表明数据具有趋势或季节性
这通常表示序列中存在趋势或季节性成分,说明统计特性随时间变化
虚线:2位标准差【±2/√n 的置信区间,以帮助判断自相关是否显著(其中 n是样本大小)】
(二)纯随机性检验
平稳性检验只能确定序列是否具有平稳性,但并不能保证序列中的信息是有价值的。即使一个序列是平稳的,它也可能只是一个纯随机序列,即白噪声序列。在这种情况下,历史数据不能提供关于未来的信息,此时建立时序模型将会是徒劳的。
如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影响,这种序列称为纯随机序列.从统计分析的角度而言,纯随机序列是没有任何分析价值的序列.
纯随机序列的定义
如果序列满足如下两条性质 ,我们称该序列为纯随机序列, 也称为白噪声(WhiteNoise) 序列简记为
$$
X_t \sim W N\left(\mu, \sigma^2\right) .
$$
(1) $E X_t=\mu, \forall t \in T$
(2) $\gamma(t, s)=\left\{\begin{array}{c}\sigma^2, t=s \\ 0, t \neq s\end{array}, \forall t, s \in T\right.$
白噪声序列的性质
纯随机性——各序列值之间没有任何相关关系,即为 "没有记忆" 的序列
$$
\gamma(k)=0, \quad \forall k \neq 0
$$
方差齐性——序列中每个变量的方差都相等
根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的
$$
D X_t=\gamma(0)=\sigma^2
$$
纯随机性检验
判断一个序列是否为纯随机序列,确保序列的各项之间没有相关性
检验自相关系数 r(k)=0(对于所有 k≠0)
理论上,纯随机序列的自相关系数应为零,但由于样本大小有限,实际计算的自相关系数可能不完全为零。故应从统计意义上判断序列的纯随机性质
原理:Barlett定理
如果一个时间序列是纯随机的,得到一个观察期数为n的观察值序列,那么该 序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布
以构造检验统计量来检验
检验统计量
1. 假设条件
-
原假设 H0:延迟期数小于或等于 m期的序列值之间相互独立。
$$
H_0: \rho_1=\rho_2=\cdots=\rho_m=0, \forall m \geq 1
$$
-
备择假设 Ha:至少存在某个延迟期的自相关系数不为零
$H_1$ : 至少存在某个 $\rho_k \neq 0, \forall m \geq 1, k \leq m$
2. 检验统计量
$$
Q=n \sum_{k=1}^m \hat{\rho}_k^2 \sim \chi^2(m)
$$
$$
L B=n(n+2) \sum_{k=1}^m\left(\frac{\hat{\rho}_k^2}{n-k}\right) \sim \chi^2(m)
$$
Q统计量:在原假设成立时,Q 统计量近似服从卡方分布,具有m 个自由度,
LB统计量(Ljung-Box统计量):在原假设成立时,LB 统计量也近似服从卡方分布,具有 m 个自由度。
3. 判别原则
-
拒绝原假设
-
不拒绝原假设