首页 > 其他分享 >pandas - 常用功能函数

pandas - 常用功能函数

时间:2023-10-13 15:49:35浏览次数:28  
标签:常用 set name df 18 age print pandas 函数

 

1.drop_duplicates函数

删除数据中的重复值;可以选择根据某个或者多个字段来删除。

在删除数据的时候,默认保留的是第一条重复的数据,我们可以通过参数keep来指定保留最后一条

 

 

data = [{'name': '小明', 'age': '18', 'set': 'a'},
        {'name': '徐先生', 'age': '18', 'set': 'b'},
        {'name': '赵先生', 'age': '18', 'set': 'c'},
        {'name': '刘女士', 'age': '18', 'set': 'a'}]


df = pd.DataFrame(data)
drop_df = df.drop_duplicates('set', keep='last')
print(drop_df)

结果:

name age set
1 徐先生 18 b
2 赵先生 18 c
3 刘女士 18 a

 

2.contains函数

针对Series中的包含字符信息:

筛选某字段中,保函字符的信息

 

data = [{'name': '小明', 'age': '18', 'set': 'a'},
        {'name': '徐先生', 'age': '18', 'set': 'b'},
        {'name': '赵先生', 'age': '18', 'set': 'c'},
        {'name': '刘女士', 'age': '18', 'set': 'a'}]

df = pd.DataFrame(data)

cont_df=df['name'].str.contains('先生', regex=False)
print(cont_df)

结果:
0    False
1     True
2     True
3    False
Name: name, dtype: bool
# 选择name中带有 ‘先生’的数据
a=df[df['name'].str.contains('先生')]
print(a)
结果:
  name age set
1  徐先生  18   b
2  赵先生  18   c

3.iterrows函数

iterrows函数用于对DataFrame进行迭代循环

 

data = [{'name': '小明', 'age': '18', 'set': 'a'},
        {'name': '徐先生', 'age': '18', 'set': 'b'},
        {'name': '赵先生', 'age': '18', 'set': 'c'},
        {'name': '刘女士', 'age': '18', 'set': 'a'}]

df = pd.DataFrame(data)

for index, row in df.iterrows():
    print(index)  # 打印索引号
    print(row)  # 打印每行数据
    print(type(row))  # row的类型,Series表示
    print(tuple(row))  # row数据转换为元组类型
    print('--------')

结果:
0
name    小明
age     18
set      a
Name: 0, dtype: object
<class 'pandas.core.series.Series'>
('小明', '18', 'a')
--------
1
name    徐先生
age      18
set       b
Name: 1, dtype: object
<class 'pandas.core.series.Series'>
('徐先生', '18', 'b')
--------
2
name    赵先生
age      18
set       c
Name: 2, dtype: object
<class 'pandas.core.series.Series'>
('赵先生', '18', 'c')
--------
3
name    刘女士
age      18
set       a
Name: 3, dtype: object
<class 'pandas.core.series.Series'>
('刘女士', '18', 'a')
--------

 

4.join函数

join函数用于合并不同的DataFrame

 

 

 

标签:常用,set,name,df,18,age,print,pandas,函数
From: https://www.cnblogs.com/xujunhui/p/17762242.html

相关文章

  • Python 累乘函数
    Python累乘函数是一个可以计算一个序列中所有元素的乘积的函数。有多种方法可以实现Python累乘函数,例如:使用循环结构,如for或while,遍历序列中的每个元素,并用一个变量存储累乘的结果。¹²使用递归函数,即自己调用自己的函数,将序列中的第一个元素与剩余元素的累乘结果相乘,直到序......
  • matalab实验imread函数和FFT使用!【图像的傅立叶变换实验】
    解决的问题:Imread函数一般不要用动态的图,否则会如下的报错!步骤:随便搞一张.png图片—>新建一个文件夹—>存放你找的图片和你建的工程(matalab工程命名不可以使用空格)—>把当前文件夹设置成改你设置的文件【如图】:如果没有后缀出现(点击查看,打开显示后缀名,修改成.gif,如果实验要求是。p......
  • 解决SUM函数返回为NULL
    解决SUM函数返回为NULLSUM函数的作用:计算某一字段中所有行的数值和,使用SUM函数进行对符合条件的结果行数进行求和。问题产生:sum求和时会对null进行过滤,不计算,但如果没有返回结果,则sum函数的返回值为null,不是0:解决方式:1.IFNULL使用IFNULL函数进行查询,判断第一个......
  • OpenBmc 常用命令汇总
    bitbake相关#编译u-bootbitbakeuboot#编译系统镜像bitbakecore-image-minimalbitbakecore-image-basebitbakefsl-image-guibitbakefsl-image-qt5bitbakefsl-image-multimedia#只下载不编译:bitbake-cfetchallcore-image-minimal#跳过错误,继续编译:bitb......
  • django常用模型查询
    classStockFilter(django_filters.rest_framework.FilterSet):#搜索名称要与前端搜索名称一致tradeName=django_filters.CharFilter(field_name='trade_name',lookup_expr='icontains')tradeCode=django_filters.CharFilter(field_name='trad......
  • 常用编码格式介绍
    常用编码格式介绍 编程过程中经常会遇到各类字符的编码方式,经常会混淆,在此总结下常用的编码方式以及其原理。Ascii:因为对于计算机来说只能识别0、1这两种字符(0表示低电平,1表示高电平),所有的数据都是通过二进制来表示,对于其他的比如说3、4、s、z、#等字符用二进制表示就......
  • C语言 - 内联函数
    在C语言中,内联函数(InlineFunction)是一种用于优化代码执行效率的机制。内联函数在编译时将函数的代码直接插入到调用它的地方,而不是通过函数调用的方式执行,从而减少了函数调用的开销,提高了代码的执行速度。C语言的内联函数使用inline关键字来声明。将函数声明为内联函数只是给......
  • python -- 定义函数 def 后面的 ->,:表示的含义
    -> 常常出现在python函数定义的函数名后面,为函数添加元数据,描述函数返回的类型。: 表示参数的类型建议符示例:defadd(x:int,y:int)->bool:if(x>y):returnTrueelse:returFalse这里,表明了函数的参数传入为int类型,输出的类型为bool类型。......
  • C++ 函数 const
    分为两种情况:在函数前加constconstintget_value(){}表示函数返回值为const。使用指针时有用。在函数后加constLinkList_length()const{}表示函数不修改class的成员。......
  • 2023-10-12 javac : 无法将“javac”项识别为 cmdlet、函数、脚本文件或可运行程序的
    找到你的jdk安装路径/bin,复制并扔到环境变量中去即可,如:   ......