首页 > 其他分享 >[pandas] 两个相同列的df求差集

[pandas] 两个相同列的df求差集

时间:2023-06-13 16:33:05浏览次数:41  
标签:df 求差 df1 DataFrame df2 merge pd print pandas

求在df1不在df2的数据

使用Pandas中的drop_duplicates()和merge()方法来计算两个相同列的DataFrame的差异。

例子:

import pandas as pd

# 创建两个相同列的DataFrame
df1 = pd.DataFrame({'value': ['A', 'B', 'C', 'D', 'E']})
df2 = pd.DataFrame({'value': ['C', 'D', 'E', 'F', 'G']})
print("df1:")
print(df1)
print("df2:")
print(df2)
# 使用merge()方法获取df1中不在df2中的元素
diff = pd.merge(df1, df2, how='outer', indicator=True)
result = diff[diff['_merge'] == 'left_only'].drop(columns=['_merge'])

# 打印结果
print("result:")
print(result)

标签:df,求差,df1,DataFrame,df2,merge,pd,print,pandas
From: https://www.cnblogs.com/afra17/p/17478001.html

相关文章

  • cloudflare 通过api删除ns 记录
    取dns记录idcurl--requestGET\--urlhttps://api.cloudflare.com/client/v4/zones/zone_id/dns_records\--header'Content-Type:application/json'\--header'X-Auth-Email:email'\--header'X-Auth-KEY:global_key' 通过dnsid删除......
  • 三种方法让.NET轻松实现Excel转PDF
    前一段时间有网友问Excel转pdf怎么转pdf,小编帮他实现了一个,方法是使用EPPlus和PdfSharp组件实现,由于依赖OfficeOpenXml他也没有用上,后来小编又实现了二种不依赖OfficeOpenXml的方法。本文将介绍这三种方法实现Excel转pdf。一、EPPlus和PdfSharp组件实现逻辑是先将Excel内容转换......
  • java实现dwg转pdf
    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、无奈选择第二种二、jar引入1.jar地址2.使用jar,完成dwg转为pdf总结前言由于公司需要最近研究一个cad文件需要在浏览器中展示,经过研究发现大致有两种方式:1将.dwg转换为vds文件,就可以在web端展示......
  • Pandas中执行元素级的逻辑运算符使用“&”、“|”、“~”,而不是“and”、“or”、“no
    目录1.两种运算符工作方式不同2.举例对比1.两种运算符工作方式不同在Python中,and和&是两个不同的运算符,它们的工作方式有所不同。and是Python的内置逻辑运算符,它是用来连接两个逻辑表达式的。当and两边的表达式都为True时,整个逻辑表达式的结果才为True。例如,TrueandTrue结......
  • 物体反射光场BRDF模型
    一、基本概述    双向反射分布函数(BidirectionalReflectanceDistributionFunction,BRDF)是用来定义给定入射方向上的辐射照度如何影响给定出射方向上的辐射率。更笼统地说,它描述了入射光线经过某个表面反射后如何在各个出射方向上分布这可以是从理想镜面反射到漫反射、......
  • 软件测试|数据分析神器pandas教程(一)
    前言Python是非常适合用于数据分析的,除了Python代码简单以外,Python还有非常多的第三方库,对于数据分析有很大帮助,今天我们就介绍一下Python进行数据分析的神器——pandas。安装从2019年1月1号开始,新发布的pandas将只支持Python3版本,所以我们的教程也以python3.7为例进行演示。......
  • 软件测试|数据分析神器pandas教程(二)
    前言上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。数据结构-SeriesPandasSeries类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。Series由索引(index)和列组成,函数如下:pandas.Series(data,index,dtyp......
  • nginx-gridfs Benchmarking Raw Results
    RawDataSpreadsheetwithtestresults(ODFformat)Thesefollowinglinksshowtherawoutputfromthebenchmarkingutilities.GridFSOverNetworkThistestscenarioshowsperformanceforHTTPrequestsoveragigabitEthernetLANconnection.MongoDBand......
  • pandas读取excel表格内容后重新生成表格时因为序号再次生成,出现:Unnamed: 0
    出现的问题如下图:在读取数据的函数中增加:index_col=0,即可。......
  • 【技术积累】Python中的Pandas库【三】
    什么是SeriesSeries是一种带有标签的一维数组,可以容纳各种类型的数据(例如整数,浮点数和字符串)。每个Series对象都有一个索引,它可以用来引用每个元素。Series对象的主要特征是可以进行矢量化操作(即一次对整个序列进行操作),因此非常适合处理数值数据。什么是DataFrame?DataFrame是一......