首页 > 其他分享 >数据清洗5

数据清洗5

时间:2024-03-22 15:23:09浏览次数:22  
标签:name df1 df2 merge pd 清洗 数据

merge函数:

pd.merge(df1,df2,how='inner')
#双表连接将两个表共有的数据连接结
#后面如果是on的话就是以哪一行为标准进行链接

pd.merge(df1,df2,on=['name'])  #name这一列作为标准进行链接name是共同的列


pd.merge(df1 ,df2,on=['name'],how='left')#以name为标准链接,但是向左表看齐


#如果说左表有4条数据,右表有三条数据,那么在整合的表中右表没有的值就是为空

#把left改成right那么主表就变成了右

 左右表不一样的情况下可以采用left_on h和right_on 字段来合并

 

 

 

 

duplicated函数删除两列值相同的数据

Pandas如何删除两列中值相同的行|极客教程 (geek-docs.com)

 

 

df2.drop_duplicates(subset=['省市','成果名称'],inplace=True) #删除了这两列相同的数据

 

 改正一下上面讲述的是两个标的相互融合,而我想要的结果是两个表拼接后期我在进行数据的修改

pandas df上下拼接_pandas 上下拼接-CSDN博客

 

 

标签:name,df1,df2,merge,pd,清洗,数据
From: https://www.cnblogs.com/222wan/p/18069291

相关文章

  • elasticsearch 6.8 常用数据字段类型
    在es中,字段类型主要有以下几种:ArraysBinarydatatypeRangedatatypesBooleandatatypeDatedatatypeGeo-pointdatatypeGeo-ShapedatatypeIPdatatypeKeyworddatatypeNesteddatatypeNumericdatatypesObjectdatatypeTextdatatypeTokencountdatatypePercol......
  • LKT4305GM芯片—网关数据安全解决方案
    随着互联网、智能终端等相关行业的飞速发展,对终端产品远程控制的需求在人们生活中越来越普遍。如何保障后台与终端产品之间数据安全交互、不被篡改、不被盗取成为产品安全性的主要问题。密钥管理和分配:方案中使用的对称密钥可以提前设置或采用临时生成方式;平台和终端存储自身的......
  • 【折腾笔记】兰空图床数据迁移
    【折腾笔记】兰空图床数据迁移前言源数据环境:基于绿联私有云NASDX4600Pro的Docker功能安装LskyProVer2.1MySQLVer8.3.0目标数据环境:基于群晖NASDS423+的Docker功能安装LskyProVer2.1MySQLVer5.7.44目标数据环境是我迁移后的新的环境,仅供参考。迁移......
  • d盘格式化了能正常使用吗?d盘格式化数据还能恢复吗
    在日常使用电脑的过程中,D盘作为存储大量数据的分区,其重要性不言而喻。然而,有时由于各种原因,我们可能需要对D盘进行格式化。那么,D盘格式化了能正常使用吗?D盘格式化数据还能恢复吗?本文将围绕这两个问题展开讨论,为您提供相关的解答和建议。图片来源于网络,如有侵权请告知一、D......
  • LDA主题词提取 完整实战代码 详细代码数据
     importpandasaspdfromgensim.modelsimportLdaModelfromgensim.corporaimportDictionaryfromwordcloudimportWordCloudimportmatplotlibimportmatplotlib.pyplotaspltmatplotlib.rcParams['font.sans-serif']=['SimHei']matpl......
  • 怎么加密磁盘数据?电脑磁盘怎么加密?
    磁盘是电脑的主要存储工具,为了避免数据泄露,我们需要加密保护磁盘数据。那么,电脑磁盘数据该怎么加密呢?下面我们就来了解一下。BitLocker加密BitLocker加密功能是电脑提供的磁盘加锁工具,支持使用密码保护磁盘。在使用时,需要在资源管理器中右键单击U盘,选择“启用BitLocker”,随......
  • 目标检测——植物病害数据集
    植物病害是植物正常状态的偏离,会破坏或改变其生命功能。植物病害会导致严重的产量损失,全球潜在损失估计高达16%。因此,研究植物病害以及开发诊断和治疗它们的方法是植物病理学领域的重要研究内容。有效识别植物病害对于采取有效的控制措施至关重要,因为如果不了解病害类型,控......
  • 超高性能数据库 OpenM(ysq)LDB:无缝兼容 MySQL 协议 和多语言 MySQL 客户端
    OpenM(ysq)LDB项目介绍OpenM(ysq)LDB是高性能时序数据库OpenMLDB的全新服务模块,OpenMLDB中“ML”既是MachineLearning的缩写,也可以是MySQL的缩写,通过此模块用户可以直接使用MySQL命令行客户端或多种编程语言的MySQLSDK,从而实现OpenMLDB数据库特有的在线离线特......
  • 我的postgresql数据库报端口错误,连接失败
    原因是服务没有启动下面这个命令是启动方式pg_ctl.exerestart-D"D:\ProgramFiles\PostgreSQL\14\data"""引号内的内容是下载postgresql数据库时候的data路径。一般就在postgresql安装路径里面D:\ProgramFiles\PostgreSQL\14\bin>pg_ctl.exerestart-D"D:\ProgramFiles......
  • C语言中,四则运算导致数据类型的转换
    在C语言中,四则运算可能导致数据类型的转换,这种转换称为隐式类型转换。以下是一些常见的数据类型转换情况:1.整数提升:当不同大小的整数类型(如`char`、`short`、`int`、`long`)进行混合运算时,较小的操作数会被提升为较大的类型,以便进行运算。例如,`char`类型的操作数会被提升为`......