首页 > 其他分享 >08_自相关

08_自相关

时间:2024-05-03 22:13:57浏览次数:19  
标签:epsilon 08 cdots beta rho 相关 hat

第8章 自相关

8.1 自相关的后果

除了异方差,违反球形扰动项的另一情形是扰动项存在自相关。

定义 自相关(autocorrelation) / 序列相关(serial correlation)

对于\(\{\epsilon_1,\cdots,\epsilon_n\}\),如果存在\(i \ne j\),使得\(E(\epsilon_i\epsilon_j|X)\ne 0\),即协方差矩阵\(Var(\epsilon|X)\)的非主对角线不全为0,则存在自相关或序列相关。

存在自相关的情况下:

  1. OLS估计量依然是无偏的、一致的、渐近正态的。
  2. OLS估计量方差\(Var(\hat\beta|X)\)的表达式不再是\(\sigma^2(X’X)^{-1}\),即\(Var(\epsilon|X) \ne \sigma^2I\)
    • 普通标准误的t检验、F检验失效。
  3. 高斯马尔可夫定理不再成立,OLS不再是BLUE。

8.2 自相关的例子

例子:

  1. 时间序列自相关。
    • 经济活动通常具有某种连续性或持久性,在时间序列中比较常见。
  2. 横截面数据中的自相关。
    • 相邻单位存在溢出效应,空间自相关。
  3. 对数据的人为处理。
    • MA、内插值、季节调整
  4. 设定误差。
    • 遗漏了某个自相关的解释变量。

8.3 自相关的检验

1.画图

  • 将残差\(e_t\)与残差滞后项 \(e_{t-1}\) 画成散点图
  • 计算残差的各阶样本相关系数 \(\hat\rho_k\),是滞后阶数 \(k\) 的函数,将 \((k,\hat\rho_k)\) 画图。

2.BG检验

(Breusch,1978;Godfrey,1979)

  • 考虑多元线性模型: \(y_i=\beta_1+\beta_2x_{i2}+\cdots+\beta_Kx_{iK}+\epsilon_t\)
  • 假设扰动项 \(\epsilon_t\) 存在一阶(高阶)自相关:\(\epsilon_t = \gamma_1\epsilon_{t-1} +\cdots+\gamma_p\epsilon_{t-p}+ \mu_t \quad (t = p+1,\cdots,n)\)
  • 由于 \(\epsilon_t\) 不可观测,用 \(e_t\) 替代
    • 如果遗漏 \(x_{t}\),可能导致扰动项与 \(e_t\) 相关,使得估计不一致。
    • 所以辅助回归为: \(e_t=\gamma_1e_{t-1} +\cdots+\gamma_pe_{t-p}+ \delta_2x_{t2} +\cdots+\delta_kx_{tk}+ v_t\)
  • 原假设(无自相关性)为:\(H_0:\gamma_1=\cdots=\gamma_p=0\)
  • 拉格朗日统计量:$$LM=(n-p)R^2 \xrightarrow{d} \chi^2(p)$$

(Davidson-MacKinnon,1993):直接把残差中因滞后而缺失的项用期望值0代替。

3.Q检验

另一种思路是检验各阶自相关系数均为0。

  • 原假设:\(H_0:\rho_1=\cdots=\rho_p=0\)
  • 大样本下,如果原假设成立,\(\hat\rho_j\) 依概率收敛于0,\(\sqrt n \hat\rho_j\) 服从渐近正态分布。
    • BP-Q统计量:平方和(对 \(j\) 求和)渐近卡方分布$$Q_{BP} \equiv n\sum_{j=1}p\hat\rho_j2 \xrightarrow{d} \chi^2(p)$$

(Box&Pierce,1970)

  • 小样本下,经过改进的Ljung-Box Q统计量性质更好,大样本等价与BPQ。
    • LB-Q统计量:调整了自由度$$Q_{LB}\equiv n(n+2)\sum_{j=1}p\frac{\hat\rho_j2}{n-j} \xrightarrow{d} \chi^2(p)$$

Ljung&Box,1979

4.DW检验

DW检验是较早出现的检验,现已不常用。

  • 只能检验一阶自相关
  • 统计量依赖于数据矩阵X

那就不看了。

8.4 自相关的处理

经过检验发现存在自相关时,有如下四种处理方法。

1.使用“OLS+异方差自相关稳健的标准误” ——NW法

因在存在自相关的情况下,OLS估计量依然无偏且一致,故仍可使用OLS进行回归估计。为了正确进行统计推断,须使用异方差自相关稳健的标准误,这种方法称为Newey-West估计法

  • HAC:Heteroskedasticity and Autocorrelation Consistent Standard Error
  • 只改变标准误的估计值,不改变回归系数的估计值
  • 一般取\(p=n^{1/4}\) 或 \(p=0.75n^{1/3}\) ,比p更高阶的自相关系数将被截断不考虑,p就是截断参数。

Newwy和West,1987

2.准差分法

准差分法(quasi difference) / Cochrane-Orcutt估计法

思路:变换原模型使转换后的扰动项变成球形扰动项。

  • 假设原模型:\(y_t=\beta_1+\beta_2x_{t2}+\cdots+\beta_Kx_{tK}+\epsilon_t \quad (t=1,\cdots,n)\)
    • 其中 \(\epsilon_t\) 存在自相关,且一阶自相关:\(\epsilon_t=\rho\epsilon_{t-1}+\mu_t\)
      • 自回归系数\(|\rho|<1\)
      • \(\mu_t\)为白噪声
  • 将原模型滞后一期,两边同乘 \(\rho\) :\(\rho y_{t-1}=\rho(\beta_1+\beta_2x_{t-1,2}+\cdots+\beta_Kx_{t-1,K}+\epsilon_{t-1})\)
  • 方程组(n-1个) 的扰动项为球形扰动项,可消除异方差,且消除了自相关。$$y_t-\rho y_{t-1}=(1-\rho)\beta_1+\beta_2(x_{t2}-\rho x_{t-1,2})+\cdots+\beta_K(x_{tK}-\rho x_{t-1,K})+(\underbrace{\epsilon_t-\rho\epsilon_{t-1}}_{\mu_t})\quad {(8.14)}$$

但问题是:损失了一个样本容量,不是最有效率的BLUE。

Cochrane和Orcutt,1949

Prais-Winsten估计法 / PW

思路:不损失样本的话,就需要补一个\(y_1\)的方程,且同方差、无自相关

  • 因:\((1 -\rho^2)\sigma_{\epsilon}^2 = \sigma_{\mu}^2\)
  • 故:\(\sqrt{1-\rho^2}y_1\)是同方差的,为球形扰动项。将如下方程加入(8.14)就可得到BLUE。$$\sqrt{1-\rho2}y_1=\sqrt{1-\rho2}\beta_1+\sqrt{1-\rho2}x_{12}+\cdots+\sqrt{1-\rho2}x_{1K}+\sqrt{1-\rho^2}\epsilon_1$$

Paris和Winsten,1954,简称PW

无论CO估计法还是PW估计法均不可行(infeasible),在实践中必须用数据估计一阶自回归系数\(\hat\beta\):

  • OLS残差进行辅助回归:\(e_t=\hat\rho e_{t-1}+error_t\)
  • 残差的一阶自相关系数:$$\hat\rho=\frac{\sum_{t=2}ne_te_{t-1}}{\sum_{t-1}n e_t^2}$$
  • DW统计量进行估计:\(\hat\rho=1-\frac{DW}{2}\)

常使用迭代法进行估计,具体步骤:

  • 首先,用OLS估计原模型,用残差 {e} 作辅助回归,得到 \(\hat\rho^{(1)}\),再用 \(\hat\rho^{(1)}\)进行CO或PW估计
  • 然后,用CO或PW得到的新残差估计 \(\hat\rho^{(2)}\),再用 \(\hat\rho^{(2)}\) 进行CO或PW估计
  • 依次类推,直至收敛(即相邻两轮的\(\rho\)与系数估计值之差足够小)。

3.广义最小二乘法

如果同时存在异方差和自相关,应该使用广义最小二乘法(Generalized Least Square,GLS)
思路:通过变量转换,使得转换后的模型满足球形扰动项。

  • 协方差矩阵 \(Var(\epsilon |X)=\sigma^2V(X)\) ,首先找到非退化矩阵 C,使得 \(V^{-1}=C'C\)
  • 将原模型 \(y=X\beta+\epsilon\) 两边同时左乘C,得到\(Cy=CX\beta+C\epsilon\)
  • 记上面的方程为:\(\tilde y=\tilde X\beta+\tilde \epsilon\)
  • 可证明:\(Var(\tilde \epsilon|\tilde X)=\sigma^2 I_n\)
  • 使用OLS即可得到GLS估计量,与C无关,虽然C不唯一,但是\(\hat \beta_{GLS}\) 唯一:

\[\hat \beta_{GLS}=(\tilde X' \tilde X )^{-1}\tilde X' y=(X'V^{-1}X)^{-1}X'V^{-1}y \]

  • 此估计量是BLUE,且比OLS有效率。

定义 可行广义最小二乘法

  • 前提条件是要知道协方差矩阵V,而V通常未知,GLS是不可行的。
  • 在实践中,必须通过数据估计\(\hat V\),再进行GLS,称为(FGLS)。

命题 对于对称正定矩阵\(V_{n\times n}\),存在非退化矩阵\(C_{n\times n}\),使得\(V^{-1}=C'C\)

4.修改模型设定

有些情况,自相关深层原因可能就是模型设定错了。因此,最好从改进模型设定着手,而不是机械的使用FGLS。

8.5 处理自相关的python命令及实例

1.时间序列算子

![[pandas_docs#16. 时间序列相关的实例方法:]]

2.画残差图

sm.graphics.tsa.plot_acf(y, ax=plt.gca(),zero=False,lags=15)
plt.show()

![[8-5-1残差自相关图.png]]

3.BG检验

from statsmodels.stats.diagnostic import acorr_breusch_godfrey

bg_result = acorr_breusch_godfrey(results, nlags=1)

4.Q检验

from statsmodels.stats.diagnostic import acorr_ljungbox

bp_result = acorr_ljungbox(results.resid,
                           lags=[i for i in range(1, 14)],
                           boxpierce=True,
                           return_df=True,
                           # auto_lag=True
                           )

5.DW检验

# from statsmodel.stats impotr durbin_watson

sm.stats.durbin_watson(results.resid)

6.HAC稳健标准误

![[statsmodel_docs#处理方法:HAC稳健标准误]]

7.处理一阶自相关的FGLS

此部分内容很复杂,代码后续补充

标签:epsilon,08,cdots,beta,rho,相关,hat
From: https://www.cnblogs.com/watalo/p/18166950

相关文章

  • MySQL-08.索引的创建和设计原则
    C-08.索引的创建和设计原则1.索引的声明和使用1.1索引的分类MySQL的索引包括普通索引、唯一性索引、全文索引、单列索引、多列索引和空间索引等。从功能逻辑上分类,索引主要有4种,分别是普通索引,唯一索引,主键索引,全文索引。按照物理实现方式,索引可以分为2种,聚簇索引和非聚簇......
  • 【软件构造课程相关】幻方及其构造(上)
    介绍​幻方(MagicSquare),有时又称魔术方阵或纵横图,由一组排放在正方形中的整数组成,其每行、每列以及每一条主对角线的和均相等。通常幻方由从1到$N2$的连续整数组成,其中N为正方形的行或列的数目。因此N阶幻方有N行N列,并且所填充的数为从1到$N2$。​幻方可以使用N......
  • 8086 汇编学习 Part 6
    用MUL指令做乘法格式MUL寄存器MUL寄存单元8位乘法16位乘法被乘数(默认)ALAX乘数8位寄存器或内存单元16位寄存器或内存字单元结果AXDX(高位)和AX(低位)模块化程序设计调用子程序:CALL指令返回:RET指令实质流程转移指令,它们都修改......
  • Noise label相关文章随记
    ContrastiveLearningImprovesModelRobustnessUnderLabelNoise2021观察:监督的鲁棒学习方法在有噪音的时候下降明显半监督的鲁棒学习能利用无标签的数据取得更好的效果那么监督的鲁棒学习方法的性能下降是由标签噪音引起的,还是不够好的表征引起的?作者的答案是学到的表......
  • c语言实现vector及其相关函数(自存)
    #include<stdio.h>#include<stdlib.h>#definePREALLOC_MAX1024#defineDEFAULT_CAPACITY8typedefintE;typedefstruct{E*elements;//指向堆空间的数组intsize;//元素的个数intcapacity;//数组的容量}Vector;voidpush_back(Vect......
  • cpp字符串相关
    字符串相关文章参考:[详解-字符串]C++必知必会字符串-string常用各种操作解析-知乎(zhihu.com)C++字符串(string)常用操作总结-知乎(zhihu.com)c++读取字符串和字符的6种函数_c++获取字符串的每个字符-CSDN博客头文件#include<string>定义字符串stringstr;初始......
  • 操作系统相关知识总结
    计算机由硬件系统和软件系统两个部分组成,它们构成了一个完整的计算机系统。计算机软件是指程序、数据和文档的集合,是计算机系统的重要组成部分。按功能划分,软件可分为系统软件,开发系统(编程语言)和应用软件三种。操作系统是计算机硬件上加载的第一层软件,是对计算机硬件功能的首次......
  • 微机结构相关知识
    微机结构是指微型计算机的硬件组成和相互连接的方式。大致分为硬件系统和软件系统。硬件系统包括运算器、存储器、控制器、输入输出设备等组成部分。CPU,即中央处理器,是计算机的核心部件之一,负责处理和执行计算机程序中的指令。CPU的主要功能包括算术逻辑运算、控制和流水线执行指......
  • Spring配置相关
    SpringSpring技术是JavaEE开发必备技能,企业开发技术选型命中率>90%专业角度简化开发:降低企业级开发的复杂性框架整合:高效整合其他技术,提高企业级应用开发与运行效率初识Spring了解Spring家族Spring官网:https://spring.io/Spring发展到今天已经形成了一种开发的生态......
  • 末路狂花钱迅雷BT下载[MP4/1.82GB/5.35GB]超级清晰[HD720p/1080p]
    电影《末路狂花钱》是一部由斯蒂文·索德伯格执导的黑色喜剧电影,于20xx年上映。这部电影讲述了一个普通女人在生活的困境中,决定通过偷窃银行来改变自己的生活轨迹的故事。这部影片将观众带入了一个离奇又荒诞的旅程,展现了金钱和欲望对一个人的影响。 影片的主角是......