首页 > 其他分享 >07_异方差

07_异方差

时间:2024-05-03 22:14:44浏览次数:26  
标签:07 方差 epsilon WLS OLS delta sigma

第7章 异方差

7.1 异方差的后果

定义 条件异方差

简称异方差,违背[[05_多元线性回归#^2b980b|球形扰动项]]假设的一种情况,即条件方差依赖于\(i\),而不是常数\(\sigma^2\)。

条件异方差的后果:

  • OLS估计量依然是无偏的、一致的、渐近正态的
  • OLS估计量的方差\(Var(\hat\beta|X)\)的表达式不再是\(\sigma^2(X'X)^{-1}\)
    • 普通标准误的t检验、F检验失败
  • 高斯-马尔可夫定理不再成立,OLS不再是BLUE。
    • 异方差下,加权最小二乘法才是BLUE

7.2 异方差的例子

  • 消费函数
  • 企业规模
  • 组间异方差
  • 组平均数

7.3 异方差的检验

1.画残差图

最直观,不严格

  • 看残差 \(e_i\) 与拟合值 \(\hat y_i\) 的散点图
  • 看残差 \(e_i\) 与某个解释变量 \(x_{ik}\) 的散点图

2.BP检验

Breusch & Pagan (1979)

  1. 对于回归模型:\(y_i = \beta_1+\beta_2 x_{i2}+\cdots+\beta_K x_{iK}+\epsilon\)
    • 样本数据为iid,则有\(Var(\epsilon_i|X)=Var(\epsilon_i|\mathbf x_i)\)
  2. 原假设:\(H_0:Var(\epsilon_i | x_i) = \sigma^2\)
    • 可转化为:\(H_0:E(\epsilon_i^2 | x_i) = \sigma^2\)
    • 假设条件方差函数是线性函数:\(\epsilon_i^2=\delta_1+\delta_2x_{i2}+\cdots+\delta_K x_{iK}+\mu_i\)
    • 可转化为:\(H_0:\delta_2=\cdots=\delta_k=0\)
  3. 对于辅助回归:\(e_i^2 = \delta_1+\delta_2x_{i2}+\cdots+\delta_K x_{iK}+error_i\)
    • 显然拟合优度 \(R^2\) 越高,回归方程接越显著,则更可以拒绝原假设。
    • BP使用的是LM统计量进行的LM检验:$$LM = nR^2 \xrightarrow{d}\chi^2(K-1)$$

3.怀特检验

White(1980)

在辅助回归中加入了二次项和交叉项:

  • 优点:可检验任何形式的异方差
  • 缺点:如果解释变量较多的画,损失较多有效样本容量和自由度

7.4 异方差的处理

1.使用“OLS+稳健标准误”

只要样本容量足够大,此方法可行。

2.加权最小二乘法(WLS)

基本思想:通过变量转换,使变换后的模型满足球形扰动项的假定(同方差),然后进行OLS。

  1. 假设:\(Var(\epsilon_i|x_i) \equiv \sigma_i^2 = \sigma^2 v_i\),且异方差因子 \(v_i\) 已知。
  2. 回归函数同时乘于权重 \(1/\sqrt v_i\)
  3. 新扰动项:\(Var(\epsilon/\sqrt v_i) = \sigma^2\) 变成同方差

WLS的\(R^2\)失去意义。因为解释变量和被解释变量都变了

3.可行加权最小二乘法(Feasible WLS)

WLS虽然是BLUE,但前提是,必须确切的知道每个个体的方差。在实践中,这是不可能的,所以WLS不可行。

FWLS:解决方法是先通过样本数据估计出\(\lbrace \sigma_i^2 \rbrace_{i=1}^n\),然后再使用WLS。

步骤:

  • 为确保方差为正,辅助回归函数约定为:$$\ln e_i^2=\delta_1+\delta_2x_{i2}+\cdots+\delta_K x_{iK}+error_i$$
  • 进行OLS后,可得\(\ln \hat\sigma^2 \equiv \ln e_i^2\)
  • 计算:\(\hat\sigma_i^2 = exp(\ln \hat\sigma_i^2)\)
  • 权重:\(1/\hat\sigma_i^2\)
  • 再进行WLS

4.“OLS+稳健标准误”还是FWLS

"OLS+稳健标准误" 适用于大多数情况,
FWLS:在大样本中可能更有效

7.5 处理异方差的python命令及实例

[[Chapter_07.ipynb]]

statsmodel 的bptest和whitetest好像都是对所有解释变量做的检验,还没有找到对y或者单独某个解释变量进行检验的方法。

标签:07,方差,epsilon,WLS,OLS,delta,sigma
From: https://www.cnblogs.com/watalo/p/18166949

相关文章

  • 题解【[ABC077D] Small Multiple】
    题目链接题意简述:给定正整数\(K\),求数位之和最小的\(K\)的倍数的数位和。错误方向:\(K\)的倍数一定满足\(K\timesS\),根据\(K\)的特征构造出合适的\(S\)。正确方向考虑直接构造出K的倍数,由于从1开始可以通过×10和+1构造出所有数字,并且在此......
  • https://geek-docs.com/python/python-ask-answer/74_hk_1707485473.html
    Python中的b是什么介绍 在Python中,我们经常会看到一种奇特的表示方法,即以字符’b’开头的字符串,例如b'Hello'。这种表示方法在Python中被称为字节字符串(bytestring),简称为b字符串。在本文中,我们将详细介绍b字符串的特点、用途和常见应用场景。b字符串的特点字节字符串以字......
  • 题解:CF607E Cross Sum
    Problem给定\(N\)条不平行的直线\(y=\frac{k_i}{1000}x+\frac{b_i}{1000}\),\(N\)条直线总共会有\(\frac{N(N-1)}{2}\)个交点(包含在同一个位置的点,即相同位置算不同的点),找出距离原点前\(K\)近的交点的距离和。$2\leN\le5\times10^4$,\(1\leK\le\frac{N(N-1)}{2}\)......
  • 对于 CF1107E 中 dp 状态设计的一点想法
    不太想发到洛谷讨论区,就往这里放了。我觉得现有的题解都没说明白为什么本题的状态和转移能覆盖所有情况,并且感觉也非常不自然,没见过的话感觉挺难发现这么一个东西。然而这个dp其实是可以自然地推导出来的。首先发现这个过程非常难以描述,主要原因在于很难刻画一个局面。然而,如......
  • P6070 『MdOI R1』Decrease
    P6070『MdOIR1』Decrease题目给定一个\(n\timesn\)的矩阵,你可以进行若干次操作。每次操作,你可以将一个\(k\timesk\)的连续子矩阵里的所有数全都加上\(1\)或者全都减去\(1\)。初始时,矩阵中有\(m\)个位置上的数不为\(0\),其它位置上的数均为\(0\)。请你求出......
  • stm32F07 HAL 库 通过定时器方式实现呼吸灯 自定义呼吸灯函数 (以参数方式设置io
    效果: 1、通过Stm32CubMX开启定时器、设置对应的io口,然后生成工程STM32CubeMX|STM32HAL库方式的微秒延时函数  2、自定义呼吸灯函数代码://呼吸灯函数//GPIO_TypeDef*GPIOx:GPIO组(A-G)//uint16_tGPIO_Pin:IO口(GPIO_Pin_0--GPIO_Pin_16)//......
  • Window 安装 Python 失败 0x80070643,发生严重错误
    问题现象用安装包在window安装python,会遇到没有安装成功,卸载后,再次双击安装包安装的时候,直接无法安装了。这个问题在githubissue中有提到,但是都是2022年的时,代码修复,但是在2024年,安装的时候还是遇到了这个问题。测试下来:python3.7,3.8没有这个问题,如果着急,就先安......
  • mORMot 1.18 第07章 简单的读写操作
    mORMot1.18第七章简单的读写操作本章描述了典型的数据读写操作。首先,我们将注意力集中在数据上,而不是函数。读取操作返回一个TID,它是一个32位或64位整数(取决于你的内存模型),反映了表的信息。TID在表中的每一行都是唯一的。ORM的新手可能会感到惊讶,但通常你不需要创建SQL查询......
  • P4707 重返现世 题解
    Description为了打开返回现世的大门,Yopilla需要制作开启大门的钥匙。Yopilla所在的迷失大陆有\(n\)种原料,只需要集齐任意\(k\)种,就可以开始制作。Yopilla来到了迷失大陆的核心地域。每个单位时间,这片地域就会随机生成一种原料。每种原料被生成的概率是不同的,第\(i\)种......
  • TODO-力扣-707. 设计链表
    1.题目题目地址(707.设计链表-力扣(LeetCode))https://leetcode.cn/problems/design-linked-list/题目描述你可以选择使用单链表或者双链表,设计并实现自己的链表。单链表中的节点应该具备两个属性:val和next。val是当前节点的值,next是指向下一个节点的指针/引用。如果......