首页 > 其他分享 >STATA fc 比较两个数据集

STATA fc 比较两个数据集

时间:2023-12-06 20:35:57浏览次数:32  
标签:mpg Stata mycf cf fc STATA using 数据

使用Stata 对双次录人后的数据集进行-致性检查。 
对两个数据集进行-致
性检查的Stata命令为cf (compare files) ,对应的Stata菜单操作方式为Data - . Data utilities- .
Compare two datasets。
Stata 是这样描述duplicates命令的: 
cf 命令用来比较主从数据集是否存在某
些变量上差别(只比较变量值,标签、注释及特征等不在比较之列)。
cf 的返回值若为空,说明
两个数据集是--致的;
cf的返回值若为9,说明两个数据集不一致。
如果cf命令后加上all选项,
则列出全部结果(Stata 默认只列出有差异的结果) ;
如果cf命令后加上verbose选项,则列出不
一致的结果清单。

cf _all using mycf
/
/比较mycf与当前数据集的差别

cf - all using mycf, verbose

//同上,并且列出不一致的清单

cf - all using mycf, verbose all

//同上,并且列出一致的清单
cf_ all using myef, all

//*同上*/

cf mpg using mycf, all

/*只基于变量mpg比较,列出全部清单*/

cf mpg using mycf, verbose

/*只基于变量mpg比较,列出不一致的清单*/

mpg:
2 mismatches

obs 5. 59 in master; 15 in using

obs 11. 55 in master; 14 in using

r(9);

/*ef的返回值若为9,说明两个数据集不一致*/

根据cf命令的结果,在核对原始问卷修正数据后再进行一致性检查, 直至两个数据集完全一
致。然后,就可以开始数据清理(数据检查和数据纠正)工作了。

 

标签:mpg,Stata,mycf,cf,fc,STATA,using,数据
From: https://www.cnblogs.com/xkdn/p/17880452.html

相关文章

  • MySQL数据库的CURD
    一、数据库的CURD对数据库进行增(Create)、改(Update)、查(Retrieve)、删(Delete)等操作。CREATE{DATABASE|SCHEMA}[IFNOTEXISTS]db_name[create_specification[,create_specification]...]IFNOTEXISTS表示只有数据库不存在的时候才创建,如果存在同名就不再执......
  • openGauss学习笔记-146 openGauss 数据库运维-备份与恢复-配置文件的备份与恢复
    openGauss学习笔记-146openGauss数据库运维-备份与恢复-配置文件的备份与恢复146.1背景信息在openGauss使用过程中,如果静态配置文件无意损坏后,会影响openGauss感知openGauss拓扑结构和主备关系。使用gs_om工具生成的静态配置文件,可以替换已经损坏的配置文件,保证openGauss的正......
  • # yyds干货盘点 # 分享一个Python网络爬虫数据采集利器
    前言你是否曾为获取重要数据而感到困扰?是否因为数据封锁而无法获取所需信息?是否因为数据格式混乱而头疼?现在,所有这些问题都可以迎刃而解。让我为大家介绍一款强大的数据收集平台——亮数据BrightData。作为世界领先的数据收集平台,亮数据以其高效、可靠和灵活的方式检索提取关键的......
  • 【数据结构】线段树 (二) 学习笔记
    线段树(二)点击查看:线段树(一)学习笔记本文介绍权值线段树与动态开点线段树,(可能后面还会加线段树合并等等)。权值线段树线段树的动态开点线段树合并推荐题目&&参考资料&&拓展阅读《算法竞赛进阶指南》0x43线段树P3870 [TJOI2009]开关P1438 无聊的数列P1253 扶苏的问......
  • 数据集成和人工智能驱动的见解
    数字时代使数据成为人们关注的焦点,将其从单纯的二进制序列转变为有价值的组织资产。随着企业越来越多地转向数据驱动战略,数据管理的复杂性也随之增加。当前的任务不仅仅是存储甚至收集数据,而是将其转化为可操作的情报。本博客旨在剖析寻求这种智能的两个重要支柱:数据集成和人工智能......
  • pfc-dfn单轴压缩/二维直剪试验试验
    单轴压缩试验和二维直剪试验实际上属于同一类,都是通过简单的模型生成,伺服机制,加压及后处理,然而现在更多的pfc模拟要求模拟破碎过程,不模拟cluster的破碎总是显得深度不够。不可避免的就要求基本cluster的生成,提供一种简单的生成方式。;首先定义簇----------------------------------......
  • 「GIS数据」下载全国的GeoJSON、shp格式数据(精确到乡镇街道级)-2023年12月更新
    发现个可以免费下载全国 geojson 数据的网站,推荐一下。支持全国、省级、市级、区/县级、街道/乡镇级以及各级的联动数据,支持导入矢量地图渲染框架中使用,例如:D3、Echarts等geojson数据下载地址:https://geojson.hxkj.vip该项目github地址:https://github.com/TangSY/echarts-m......
  • Linux如何备份数据库
    前言数据库备份还是很重要的,毕竟总不能当自己不小心把数据删了,就真的只剩下偷偷跑路吧!说笑了,对于这种情况我们要学会备份和恢复,这样面对误删的情况也能沉着冷静处理。数据库备份什么是数据库备份呢?以MySQL举个栗子(当然,备份方式有很多,冷、热备份、逻辑备份、快照备份,我们这次讲的是......
  • C++_调用函数以及不同数据类型
    调用其他文件中的函数add_library可以生成我们所需的动态库或者静态库,我们要把制作出的库文件发布出去供第三方使用一些函数方法单独在一个cpp的源文件中定义,然后在另一个源文件中需要用到自定义的函数时直接调用就可以了!方法1.学过c++的人可能最熟悉的方法还是利用头文件......
  • pandas映射与数据转换
    pandas映射与数据转换在pandas中提供了利用映射关系来实现某些操作的函数,具体如下:replace()函数:替换元素;map()函数:新建一列;rename()函数:替换索引。一、replace()用映射替换元素在数据处理时,经常会遇到需要将数据结构中原来的元素根据实际需求替换成新元素的情况。要......