Stata:删除重复观测值

时间：2023-01-14 21:00:18浏览次数：44

标签：变量删除重复样本 mark Stata keyvar 观测 id

1.当一条样本的全部变量均与另一条或多条样本重复时，直接使用duplicates drop _all, force

或gduplicates drop _all, force，后者为外部命令，在样本较大时对运算速度的提升非常明显。

2.当一条样本的部分变量与另一条或多条样本重复时，需要

(a) 判断不重复的那些变量是否发生了错误以确定应该保留哪一条并设置mark变量标记为1

如 gen byte mark=(keyvar=="最好") //keyvar为关心的那个产生重复的变量

bys id: gen byte max_mark=max(mark) //其中，id为对个体的分组变量，如工企库中的企业法人代码或企业名称等，可能有几个个体的相似程度很高，需要在整理数据的时候去重

keep if mark==max_mark

drop mark max_mark

(b) 无法判断哪一条更为重要或不在意保留哪一条时，由于不同个体(对应不同id)可能在某个变量keyvar有相同的取值，而想要删除的是同一个个体(相同id的不同样本)出现多条样本时，keyvar的取值不同，此时可以

gduplicates tag id keyvar, g(tag) //生成重复次数变量

bys id tag : gen count=_n //生成重复组的顺序变量

keep if count=1 //在不关心保留重复样本中的哪一条时，随意选择保留第一条

drop count tag

gduplicates report id //观察是否有个体id的重复

标签：变量,删除,重复,样本,mark,Stata,keyvar,观测,id
From： https://www.cnblogs.com/xkdn/p/17052535.html

链表使元素的追加和删除更容易
在数组的各个元素中，除了数据的值之外，通过为其附带上下一个元素的索引，即可实现链表。数据的值和下一个元素的索引组合在一起，就构成了数组的一个元素。这样，数组元素相连就构......
Stata:字符串函数
我们在做数据清理时经常会遇到字符型变量的清理问题，Stata提供了大量、功能强大的字符函数，灵活运用字符函数可以高效、快速、精确、准确地清理数据。本文为大家介绍一些常用......
LeetCode.19 删除链表的倒数第n个元素
1.题目给你一个链表，删除链表的倒数第 n 个结点，并且返回链表的头结点。 2.代码/***Definitionforsingly-linkedlist.*publicclassListNode{*int......
Stata:rename用法
2.1圆括号与批量重命名rename(old1old2...)(new1new2...)[,options]将需要批量重命名的变量放置在第1对圆括号中，新的变量名放置在第2对圆括号中，这个操作方......
代码随想录算法训练营第四天 | 24. 两两交换链表中的节点、19.删除链表的倒数第N个节
day424.两两交换链表中的节点/***Definitionforsingly-linkedlist.*structListNode{*intval;*ListNode*next;*ListNode():val(0),......
LeetCode刷题（160）～删除字符串中的所有相邻重复项
题目描述给出由小写字母组成的字符串S，重复项删除操作会选择两个相邻且相同的字母，并删除它们。在S上反复执行重复项删除操作，直到无法继续删除。在完成所有重复项删除操作......
怎么删除github上的仓库?
1.到你的个人中心.点击你的个人账号.下图的红色部分2.点击repositories(仓库),选择你要删除的项目3.code这一行导航栏最后的一个.setting4.下拉页面到最下面Deletethis......
无法删除文件提示已在另一个程序中打开
原文链接：https://blog.csdn.net/zxw1473474655/article/details/103816176由于文件正在打开着，所以无法删除。在能清楚知道该文件在哪个程序中打开的情况下，比如文件夹里有......
代码随想录算法训练营第四天|24. 两两交换链表中的节点，19.删除链表的倒数第N个节点，面
一、参考资料两两交换链表中的节点题目链接/文章讲解/视频讲解：https://programmercarl.com/0024.%E4%B8%A4%E4%B8%A4%E4%BA%A4%E6%8D%A2%E9%93%BE%E8%A1%A8%E4%B8%AD......
jQuery事件（事件委托/优化添加删除表格记录/事件委托delegate中的this对应关系）
视频为什么要用事件委托：新增的dom元素没有对应点击事件。子元素的事件交给父元素来代为处理。父元素要知道是哪个子元素发生的。<!DOCTYPEHTML><html><head><meta......

Stata:删除重复观测值

相关文章

赞助商

阅读排行