首页 > 其他分享 >分享一下最近清洗CFPS心得,有错误求指正

分享一下最近清洗CFPS心得,有错误求指正

时间:2024-10-30 21:47:27浏览次数:7  
标签:CFPS dta keep 指正 using var 2014 心得 qea0

目标:得到一个四期面板数据,每期包括家庭库和个人库

一、提取变量

以2014年为例,2016、2018、2020省略处理过程

1.处理个人库

keep fid14 pid provcd14 urban14 cfps2014_age cfps_gender qea0 qp201 cfps2014eduy_im qz207 ku802 

替换缺失值
for var _all: replace X =. if inlist(X, -10, -9, -8, -2, -1)
婚姻状况
codebook qea0
recode qea0 (2 = 1 "已婚")(1 3 4 5 = 0 "未婚"), gen(qea0_1)
drop qea0

2.处理家庭库

keep fresp1pid fid14 provcd14 urban14 finc familysize fwage_1 foperate_1 fproperty_1 ftransfer_1 fu201 fo1
替换缺失值
for var _all: replace X =. if inlist(X, -10, -9, -8, -2, -1)
对收入、人情支出取对数
foreach var of varlist finc fwage_1 foperate_1 fproperty_1 ftransfer_1 fu201 {
gen log`var'=log(`var')
}
drop finc fwage foperate fproperty ftransfer fu201
3.合并个人库和家庭库

use "D:\2014famecon.dta"
rename fresp1pid pid
merge 1:1 fid14 pid using "D:\2014person.dta"
keep if _merge==3
drop _merge
gen year=2014

4.数据核查

egen miss = rowmiss(fo101 familysize logfinc logfwage_1 logfoperate_1 logftransfer_1 logfu201 age age2 gender qp201 eduy_im qu802 qz207 qea0_1)
tab miss
keep if miss == 0

2014、2016、2018、2020都按照以上方法处理保存

5.合并四年

use"D:\2014.dta"
append using "D:2016.dta"
append using "D:\2018.dta"
append using "D:\2020.dta"

6.构建非平衡面板

duplicates tag fid14 year, gen(num)

tab num

keep if num == 0

order fid year

7.到此,整理结束.但清洗结束后,所剩样本量不到2000个,显然清洗过程有问题,还请大家指正。

标签:CFPS,dta,keep,指正,using,var,2014,心得,qea0
From: https://blog.csdn.net/jk182/article/details/143375642

相关文章

  • patchTST代码复现心得
    patchTST代码复现心得NieY,NguyenNH,SinthongP,etal.Atimeseriesisworth64words:Long-termforecastingwithtransformers[J].arXivpreprintarXiv:2211.14730,2022.代码先来预测模块defforecast(self,x_enc,x_mark_enc,x_dec,x_mark_dec):......
  • 《Java 大厂面试基础真题及解析 —— 来自一位程序员的心得分享》
    作为一名Java程序员,在经历了众多面试后,深知Java基础在大厂面试中的重要性。以下是我总结的一些常被问到的Java基础面试题及解析,希望对大家有所帮助。2024Javaoffer收割指南分享一、面向对象的三大特性(一)封装概念封装是将数据和操作数据的方法绑定在一起,形成一个......
  • 从小白到大牛:IT人的日常代码苦练心得
    从小白到大牛:IT人的日常代码苦练心得日常代码苦练名称:一元稀疏多项式计算器一、问题描述:设计一个一元稀疏多项式的简单计算器,要求能进行加减运算,**问题输入:**每组数据有3行构成,第1行为3个正整数n,m,t,n表示第一个多项式的项数,m表示第二个多项式的项数,t表示运算类型,0为......
  • 中断系统概念、组成、使用,(有错误欢迎指正)
    基本概念    中断:在执行程序过程中,外部设备向CPU发出中断请求信号,要求暂时中断当前程序的执行转而执行相应的处理程序,待处理程序执行完,再继续执行原来被中断的程序    中断源:一些特定的时间,也称中断信号    中断请求:中断源要求服务所提出的请求 ......
  • C语言小白 记录自己对一些概念的理解 若有错误 多包涵 若能指正 万分感激
    当你想将输入和判断输入一起做时可以用while((数组名[i]=getchar())!='\n')记得拿括号括起来辅助在写!=CG平台使用输入重定向输入测试数据,需要使用(ch=getchar())!=EOF判断字符串输入结束,如果使用(ch=getchar())!='\n'上传到CG平台后可能会超时。写oj的时候如......
  • C语言小白 记录自己对一些概念的理解 若有错误 多包涵 若能指正 万分感激
    指向第一个元素或整个数组用p1=test;直接数组名不用加*而指向第二个或以后的元素则要加*例如p2=&test[1]在C语言中,两个指向同一个数组中相邻元素的指针,计算他们的差值,得到的是它们之间元素的个数,是一个整数比如p1-p0等于1表明第一个到第二个相差一而不是字节数。若想求......
  • 【开发心得】筑梦上海:项目风云录(8)
    目录开心的日子总是过的快秋天终于来了。感谢欣赏,未完待续。。。不知不觉已经写到第8篇,感谢大家的关注和阅读。这一篇,公交项目已经走向尾声,感觉有很多东西还没有写出来。好在印象深刻的事情都记录了,之前走了很多坑,也算是项目开发的避坑指南吧。开心的日子总是过的快上......
  • (八千字心得笔记)零基础C语言入门第一课——初识C语言
    这一课主要是让大家初步了解C语言,了解我们的开发环境,main函数,库函数,关键字,字符和字符串等内容的介绍,后面会一一讲解文章目录一.C语言是什么1.1C语言的历史二.开发环境编译型语言和解释型语言2.1编译和链接2.2编译器的选择2.2.1VS项目和源文件、头文件介绍2.2.2......
  • 【开发心得】筑梦上海:项目风云录(7)
    目录出租房的放松日子日常的项目生活荣誉员工小海的定检编排算法未完待续。。。不知不觉已经来到第7篇了,还好之前还留了一套当时记录项目工作的文档,否则这么多细节,还真的很难全靠脑子记录。出租房的放松日子租房子大概有半年,除了周末,每天几乎都是两点一线的生活,那时......
  • Issac_GYM对Go2机器人的仿真心得
    override覆盖torques扭矩1args()参数信息等cd/home/yyds/桌面/Gym2/legged_robot_competition-master/legged_gym/legged_gym/utils/helpers.py这里对train等参数的调用情况进行了说明比如:pythonplay.py--task=go2--num_envs=64--checkpoint=50--load_run=/ho......