目录
一、文献综述
Heckman 模型自提出以来,在众多领域得到了广泛且深入的应用。例如,在劳动经济学领域,Heckman(1979)率先将该模型应用于劳动力供给的研究,成功解决了样本选择偏差问题,为后续的相关研究奠定了基础。此后,许多学者在这一方向上不断拓展和深化。Mincer(1980)在研究女性劳动力参与率时,运用 Heckman 模型发现了教育和家庭背景等因素对女性就业决策的影响。
在教育经济学中,Card(1999)利用 Heckman 模型探讨了教育回报率的估计,纠正了由于样本选择导致的偏差,得出了更准确的教育对收入影响的结论。
在健康经济学领域,Smith(2005)借助 Heckman 模型分析了医疗服务利用的决定因素,揭示了个体特征和经济因素在医疗选择中的作用。
这些研究都充分展示了 Heckman 模型在处理样本选择偏差问题上的有效性和重要性,为相关领域的研究提供了有价值的方法和思路。
二、理论原理
Heckman 模型主要用于解决样本选择偏差问题。在许多实际研究中,我们所观察到的样本并非完全随机的,而是由于某种选择机制导致的。例如,在研究个人工资收入时,我们只能观察到有工作的人的工资,而那些没有工作的人(即未进入样本的个体)的工资信息是缺失的。这种非随机的样本选择可能导致估计结果出现偏差。
例如,如果研究个人的收入,选择方程可能是个人是否选择工作的决策,取决于教育程度、家庭状况等因素;结果方程则是对于有工作的人,其收入与工作经验、技能水平等因素的关系。
三、实证模型
通过这样的实证模型设定,我们可以更准确地分析个体创业决策的影响因素以及创业收入的决定因素,并解决可能存在的样本选择偏差问题。
四、稳健性检验
为了检验模型的稳健性,可以改变解释变量的形式或加入其他控制变量,重新估计模型,观察结果是否发生显著变化。
五、程序代码及解释
// 导入数据
use "your_data.dta", clear
// 估计选择方程(使用 Probit 模型)
probit entrepreneurship education age assets // 这里假设 entrepreneurship 是表示是否创业的二元变量,education、age 和 assets 是影响创业选择的解释变量
// 查看选择方程的估计结果
estimates store selection
// 生成逆米尔斯比率
predict lambda, lambdai
// 估计结果方程(使用普通最小二乘法)
reg income education age assets lambda // 这里假设 income 是创业个体的收入,education、age 和 assets 是影响收入的解释变量,lambda 用于校正样本选择偏差
// 查看结果方程的估计结果
estimates store outcome
// 比较选择方程和结果方程的估计结果
estimates table selection outcome
上述代码的详细解释如下:
-
use "your_data.dta", clear
:用于导入名为your_data.dta
的数据集,并清除可能存在的已有数据。 -
probit entrepreneurship education age assets
:使用 Probit 模型来估计选择方程。Probit 模型适用于处理二元选择变量(如是否创业)。 -
estimates store selection
:将选择方程的估计结果存储起来,以便后续进行比较和分析。 -
predict lambda, lambdai
:根据选择方程的估计结果生成逆米尔斯比率lambda
。 -
reg income education age assets lambda
:使用普通最小二乘法(OLS)来估计结果方程,将逆米尔斯比率lambda
纳入方程以校正样本选择偏差。 -
estimates store outcome
:存储结果方程的估计结果。 -
estimates table selection outcome
:将选择方程和结果方程的估计结果以表格形式展示,方便对比和分析。
六、代码运行结果
运行上述代码后,Stata 会输出选择方程和结果方程的详细估计结果,包括系数估计值、标准误、t 值、p 值等。通过分析这些结果,可以判断解释变量对被解释变量的影响是否显著,以及样本选择偏差的校正效果。
例如,在结果方程中,如果教育水平(education
)的系数显著为正,说明教育水平的提高对创业收入有显著的正向影响。同时,观察逆米尔斯比率(lambda
)的系数及其显著性,可评估样本选择偏差的程度和校正的有效性。