问题集3:SIPA INAF U8145 危地马拉的贫困和不平等关系分析
定于4月5日星期五晚上11:59,上传到Courseworks上的一个pdf文件中在本练习中,您将对危地马拉的贫困和不平等现象进行评估。数据来自《生活条件百科全书》(ENCOVI)2000年,由国家统计研究所(INE)收集危地马拉国家统计研究所,在世界银行生活水平计量的协助下研究(LSMS)。有关这一调查和其他LSMS调查的信息,请访问世界银行网站http://www.worldbank.org/lsms.这些数据被用于世界银行的官方贫困评估2003年的危地马拉,点击这里。
危地马拉的两条贫困线是根据2000年国家统计和分析中心的数据计算出来的。第一个是极端贫困线,定义为购买每日最低热量需求2172卡路里的年成本。根据这一定义,极端贫困线为1912克查尔(Q),或约649伊加元(购买力平价转换),每人每年。第二种是完全贫困线,定义为极端贫困线加上非食品补贴,其中补贴是根据家庭的平均非食品预算份额计算的热量消耗大约是每天的最低需求。(换句话说,完整的贫困线是家庭的平均人均支出,其人均粮食消费量约为
最低限度根据这一定义,完全贫困线为4319 Q,即1467 I美元。抽样设计注意事项:ENCOVI样本不是整个人群的随机样本。首先,集群(或“阶层”),然后在每个集群中对家庭进行抽样。给定采样设计从技术上讲,应针对不同的观测值使用不同的权重进行分析。Stata有一套特殊的进行这种加权的命令(svymean、svytest、svytab等)。但是为了这个练习的目的,我们将忽略样本是分层的这一事实,并为所有观测值分配相等的权重。1因此答案将与世界银行的贫困评估不同,在某些情况下也不可靠。1.获取数据。从课程网站下载数据集ps3.dta,其中包含变量的子集ENCOVI 2000中提供。变量描述包含在ps3vardesc.txt中。2.启动一个新的do文件。我的建议是,您可以从问题集1的入门Stata程序重新开始(或根据问题集1的代码),保持第一组命令(“内务管理”部分)的更改更改日志文件的名称,删除其余文件,然后用新名称保存do文件。3.在Stata中打开数据集(“use ps3.dta”),运行“describe”命令,检查是否有7230对ps3vardesc.txt中变量的观察。
4.计算数据集中每个家庭的收入等级(egen-incrank=等级(incomepc))。绘制贫困状况。包括与完全贫困线和极端贫困线相对应的水平线。(提示:您可能希望创建与完全贫困线和极端贫困线相等的新变量。)在绘制贫困状况,只包括图表上人均收入达到第95百分位的家庭。(即,将排名前5%的家庭排除在图表之外。)以这种方式消除最高收入家庭将允许你可以使用一个合理的比例来绘制图表,你将能够更好地看到低收入下发生的事情水平。
5.使用完整的贫困线和人均消费变量,计算贫困指标P0、P1、P2。(注意:要对所有观测值的变量求和,请使用命令“egen-newvar=total(oldvar);”。)6.使用极端贫困线和人均消费变量,再次计算P0、P1和P2。1在所有方面,你都应该把每个家庭视为一个观察对象。也就是说,不要试图适应这样一个事实有些家庭比其他家庭大。因此,您将计算家庭的贫困统计数据,使用家庭内的人均消费,作为整个家庭幸福感的指标。
7.使用完全贫困线和人均消费变量,分别计算城市和农村的P2家庭。
8.使用完整的贫困线和人均消费变量,分别计算土著和非土著家庭。
9.使用完整的贫困线和人均消费变量,分别计算每个地区的P2。(在Stata中的“while”循环中这样做可以获得三个加分,就像你在问题集1中使用的一样。)10.使用第7-9部分中的一个比较,计算每个子群对总体贫困。注意,代 写SIPA INAF U8145 危地马拉的贫困和不平等关系分析如果P2是整个人口(家庭或个人)的贫困衡量标准,并且P2j和sj是人口的子组j的贫困测度和人口份额,则每个亚组对总体贫困的贡献可以写成:sj*P2j/P2。11.在一段话中总结第4-10部分的结果,注意你发现的特别计算有趣的或重要的以及为什么。
12.在许多情况下,详细的消费或收入数据不可用,或仅适用于家庭,以及扶贫项目的目标必须依赖于基于几个容易观察到的贫困相关因素的贫困指数。假设除了ENCOVI调查之外,危地马拉还有一个人口人口普查包含所有家庭的数据,但也假设人口普查不包含人均信息消费,仅包含以下变量的信息:城市,印度,西班牙语,n0_6,n7_24,n25_59、n60_plus、hhhfemal、hhhage、ed_1_5、ed_6、ed_7_10、ed_11、ed_m11,以及每个区域的虚设。(在Stata中,为每个区域创建伪变量的一个方便命令是“xi i.region;”。)使用ENCOVI的“消费指数”,通过(a)对变量的人均消费对数进行回归人口普查中可用的,以及(b)恢复预测值(命令:预测),(c)转换使用Stata中的“exp()”函数从日志到级别。这些预测值就是你的消费指数。笔记在人口普查中,可以使用
使用ENCOVI数据对该回归的系数估计。解释如何。13.使用您的指数(使用完整的贫困线)计算P2,并与您在中计算的P2值进行比较问题5。
14.使用人均收入变量,计算家庭的基尼系数(假设
家庭同等重要地进入。)一些注意事项:(1)您的垃圾箱宽度为1/N,其中N是家庭。(2) 您计算的基尼系数值将不等于的实际基尼系数危地马拉,因为上述权重问题。(3) 为了在Stata中生成变量的累积和,使用语法“gen-newvar=sum(oldvar);”。试试看。(4) 如果你感兴趣(尽管不是严格意义上的在这种情况下是必要的),您可以在一个观察中的变量值和值之间创建差异对于Stata中先前观察到的相同变量,请使用命令“gen xdiff=x-x[n-1];”。小心关于在执行此操作时如何对数据进行排序。
上交内容:在你的书面报告中,你应该为每个部分报告你所做的任何计算任何问题的答案。请记住,欢迎你分组工作,但你必须在你自己的,并记下你和谁一起工作。您还应该附上您的Stata代码的打印件。