首页 > 其他分享 >拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法

时间:2022-12-15 16:33:30浏览次数:39  
标签:偏误 偏差 变量 10 process 模型 tecdat 拓端 模拟

引言

本文中主题是内生性,它可能严重偏向回归估计。我将专门模拟由遗漏变量引起的内生性。在本系列的后续文章中,我将模拟其他规范问题,如异方差性,多重共线性和对撞机偏差。

数据生成过程

考虑一些结果变量的数据生成过程(DGP)

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_02

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_03

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_04

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_05对于该模拟,我设置参数值

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_06

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_07

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_08

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_09以及

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_10

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_11与模拟正相关的独立变量,

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_12

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_13(N = 500)。

# simulation parameters

set.seed(144);

a=50; b=.5; c=.01;



x=rnorm(n=ss,mean=1000,sd=50);

z=d+h*x+rnorm(ss,0,10)

模拟

模拟将估计下面的两个模型。第一个模型是正确的,它包含实际DGP中的所有术语。但是,第二个模型省略了DGP中存在的变量。相反,变量被误入了误差项  

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_14

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_15

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_16

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_17

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_18

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_19第二个模型将产生一个有偏差的估计

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_20

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_21。差异也会有偏差。这是因为它

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_22

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_23是内生的,这是一种说它与错误术语相关的奇特方式

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_24

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_25。由于

心病(X,Z)> 0

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_27

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_28

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_29,然后

心病(X,\ epsilon_1)> 0

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_31。为了说明这一点,我在下面进行了5000次迭代的模拟。对于每次迭代,我

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_32

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_33使用DGP 构造结果变量。然后我运行回归估计

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_34

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_35,首先是模型1,然后是模型2。

sim=function(endog){

e=rnorm(n=ss,mean=0,sd=10)

# Select data generation process

if(endog==TRUE){ fit lm(y~x) }else{ fit=lm(y~x+z)}

return(fit$coefficients)

}



sim_results_endog=t(replicate(trials,sim(endog=TRUE)))

仿真结果该仿真产生两种不同的采样分布

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_36

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_37。请注意,我已将true值设置为

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_38

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_39。如果

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_40

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_41不省略,则模拟产生绿色采样分布,以真实值为中心。所有模拟的平均值为0.4998。当

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_42被省略,仿真得到的红色采样分布,围绕0.5895居中。它偏离.5895的真实值。此外,偏差采样分布的方差远小于周围的真实方差

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_43

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_44。这会影响对真实参数执行任何有意义推断的能力。 

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_45

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_46

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_47

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_48可以通过分析得出。考虑在模型1中(如上所述),

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_49

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_50并  

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_51

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_52通过以下方式相关:

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_53

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_54

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_55用等式3 代入等式1并重新排序:

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_56

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_57

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_58

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_59省略变量时

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_60

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_61,实际上是估计的等式4。可以看出,

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_62

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_63数量有偏差

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_64

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_65。在这种情况下,由于

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_66

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_67并且

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_68

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_69通过构造正相关并且它们的斜率系数是正的,所以偏差将是正的。根据模拟的参数,应该是“真实的”偏差   

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_70

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_71。这是偏差的分布,它以.0895为中心,非常接近真实的偏差值。

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_72

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_73上述推导还可以让我们确定从知道的相关偏差的方向

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_74

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_75

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_76

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_77以及的符号

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_78(的真局部效果

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_79

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_80

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_81

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_82)。如果两者都是相同的符号,那么估计值

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_采样分布_83

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_84会有偏见。如果符号不同,则估计值

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_数据_85

拓端tecdat|R语言代写辅导模型中的加总偏误与内生性:一种数值模拟方法_方差_86将向下偏移。结论上面的案例很一般,但有特殊的应用。例如,如果我们认为个人的收入是教育年限和工作年经验的函数,那么省略一个变量将偏向另一个变量的斜率估计。

 

 


标签:偏误,偏差,变量,10,process,模型,tecdat,拓端,模拟
From: https://blog.51cto.com/u_14293657/5940236

相关文章