1.数据集中含有“hh”,代表问卷中家庭部分的数据,例如:资产与负债,家庭的支出与收入等; 2.数据集中含有“ind”,代表问卷中个人部分的数据,例如:人口统计特征(部分),个人工作收入,保险与保障等; 3.数据集中含有“master”,代表是非问卷变量数据,具体包括调查样本所属省份信息、同一城市标识码、样本权重变量等等。
中心的综合变量主要包含四个:家庭总资产(asset)、家庭总负债(debt)、家庭总收入(total_income)、家庭消费性支出(total_consump),四个综合变量,是单独计算相互独立的变量。 家庭总资产包括非金融资产和金融资产。非金融资产包括农业经营资产、工商业经营资产、土地资产、房产、车辆资产、其他非金融资产。金融资产包括社保账户余额、现金、存款、股票、基金、债券、衍生品、理财、外币资产、黄金、其他金融资产和借出款。 家庭总负债包括农业负债、工商业负债、房产负债、车辆负债、其他非金融资产负债、股票负债、其他金融资产负债、教育负债、医疗负债和其他负债。 家庭总收入包括工资性收入、农业经营收入、工商业经营收入、转移性收入和投资性收入。中心数据集中,部分家庭收入为负数,主要由于生产经营性项目亏损或者金融市场投资亏损导致。 家庭消费性支出包括食品支出、衣着支出、居住支出、生活用品及服务支出、教育娱乐支出、交通通信支出、医疗保健支出和其他支出。
在我们的抽样设计下,由于每户家庭被抽中的概率不同,因此每户家庭代表的中国家庭数量也就不同。在推断总体的时候,需要通过权重的调整来真实准确地反映每户样本家庭代表的家庭数量,以获得对总体的正确推断。中国家庭金融调查的所有计算结果都经过抽样权重的调整。在 master 数据集中含有权重变量:“swgt_h”代表家庭权重,“swgt_p”代表个人权重。 其抽样权重的计算方法如下:根据每阶段的抽样分别计算出调查市县被抽中的概率 p1、调查社区(村)在所属区县被抽中的概率 p2 、以及调查样本在所属社区(村)被抽中的概率p3,分别计算出三阶段的抽样权重 w1=1/p1、w2=1/p2、w3=1/p3,最后得到该样本的抽样权重为swgt_h=w1?w2?w3 。 考虑到样本在性别、年龄、地区等属性上与全国人口偏差较大,因此还会进行分组调整,基于国家统计局人口结构和总数,设定每个组相应的调整系数值。家庭权重(swgt_h)为没有经过调整的权重,个人权重(swgt_p)等于家庭权重乘以调整系数。
标签:文件,抽样,负债,权重,家庭,说明,支出,swgt,CHFS From: https://www.cnblogs.com/xkdn/p/17442442.html