首页 > 其他分享 >pandas 常用方法使用示例

pandas 常用方法使用示例

时间:2023-02-24 19:23:38浏览次数:39  
标签:常用 示例 df pd print import csv pandas

#生成DataFrame,保存至文件
from pandas import DataFrame
import numpy as np
import pandas as pd

t={
    "称呼": ["爸爸","妈妈","宝宝"],
    "年龄": [18, 30, np.nan],   
    "性别": [None, "male", "female"],
    "生日": ["2000-02-10", "1988-10-17", None]
}

df =DataFrame(t)
df.to_csv("Result.csv",header=1,index=0) #保存列名、不保存行索引

 

#读取文件,生成DataFrame
import pandas as pd

df = pd.read_csv("Result.csv") #扩展名也可不是 .csv
print(df)
print(df.isnull()) 

  

#显示“年龄”列,行号1,2的单元格,求和
import pandas as pd

df = pd.read_csv("Result.csv") 
print(df.loc[[0,1],['年龄']])
print(type(df.loc[[0,1],['年龄']]))  
print(df.loc[[0,1],['年龄']].sum())

  

#将DataFrame中的空值设为0
import pandas as pd

df = pd.read_csv("Result.csv") 
df.fillna(0,inplace = True)  
print(df)

  

#插入列
import pandas as pd

df = pd.read_csv("Result.csv") 
df.insert(loc=2, column='插入列', value="插队")  
print(df)

或:     df.loc[:,新列名]=值  

 

#插入行(实际是两个表在纵轴方向上拼接)并去除重复数据行
import pandas as pd

df = pd.read_csv("Result.csv") 
df1=DataFrame({
    "插入行": ["插入1","插入1","插入1"]
})
pd.concat([df1,df2],ignore_index = True)
#当两个表中有重叠的数据时,使用drop_duplicates()去除重复数据
pd.concat([df1,df2],ignore_index = True).drop_duplicates()
print(df)

 

#根据现有列生成新的列
import pandas as pd
from pandas import DataFrame

def getlevel(年龄):
    if 年龄 > 25:
        return "老"
    elif 年龄 > 15:
        return "中"
    else:
        return "青"

df = pd.read_csv("Result.csv") 
# df['level'] = df.apply(lambda x: getlevel(x['年龄']), axis=1)
df['level'] = df.apply(lambda x: getlevel(x.年龄), axis=1)
 
print(df)

 

#删除列
df.drop(axis = 0, index=[0], inplace=True)

     

#列改名,a,b变为A,B
df.rename(columns={"A": "a", "B": "c"},inplace=True)

 

 修改单元格,记忆公式:

单值修改:df.loc[行索引,列索引]
单行修改:df.loc[行索引]或df.iloc[行索引];
单列修改:df[列索引]、df.loc[:,列索引]或df.iloc[:,列索引]
按条件修改: df.loc[[筛选后的DataFrame].index,列索引]

mask(条件判断,条件成立的值)

where(条件判断,条件不成立的值)

#修改单元格:在指定列中找符合条件的单元格,对于这些单元格所在行,修改与指定列相交的单元格的值
import pandas as pd
from pandas import DataFrame

df = pd.read_csv("Result.csv")

df.loc[df["称呼"]=='爸爸',['称呼','年龄']]='father'
 
print(df)

   

#使用正则修改替换1
import pandas as pd
from pandas import DataFrame

df = pd.read_csv("Result.csv")

df['称呼']=df['称呼'].str.replace(
    pat='^(爸+)$',
    repl=lambda x: '0'*(4-len(x[0]))+x[0]+'ok',
    regex=True
    )
print(df)

 

#使用正则修改替换2
import pandas as pd

df = pd.read_csv("Result.csv")

df.replace(
    '^(爸+)$',
    r'\1神了',
    regex=True,
    inplace=True
    )
print(df)

  

 

#转置
df=df.T

  

#移动整行
import pandas as pd
from pandas import DataFrame

df = pd.read_csv("Result.csv")
df.iloc[0, :] = df.iloc[0, :].shift(-1)

   

#移动部分单元格
import pandas as pd
from pandas import DataFrame

df = pd.read_csv("Result.csv")
print(df)
df.iloc[0, 1:2] = df.iloc[0, 1:2].shift(-1)
print(df)

  

 

参考:https://www.cnblogs.com/testzcy/p/12077820.html

https://blog.csdn.net/m0_62011685/article/details/124827501

https://blog.csdn.net/m0_62011685/article/details/124716966

https://blog.csdn.net/weixin_42322206/article/details/124226550

https://www.cjavapy.com/article/774/#google_vignette

标签:常用,示例,df,pd,print,import,csv,pandas
From: https://www.cnblogs.com/pu369/p/17150852.html

相关文章

  • 委托示例代码
    1usingSystem;23namespaceConsoleApp14{5classProgram6{7staticvoidMain(string[]args)8{9ShengC......
  • 【JavaScript】28_数组的常用方法
    9、数组的方法push()向数组的末尾添加一个或多个元素,并返回新的长度pop()删除并返回数组的最后一个元素unshift()向数组的开头添加一个或多个元素,并返回新的长度shift()删......
  • docker 操作常用命令
    镜像#以tomcat为基础镜像创建一个容器,容器名为my-tomcat#拉取tomcat最新镜像,实际生产中,dockerpull这一步可以省略,dockerrun的时候会自己去拉取。dockerpulltomcat......
  • windows常用bat分享
    单运行jarjava-jarxxx.jar执行依赖包运行jarlib文件夹和jar同级java-jar-Dloader.path="lib/"xxx.jar设置编码运行jar设置控制台编码为utf-8chcp65001java......
  • pandas中的agg&transform方法
    pandas中的agg&transform方法1聚合函数agg1.1介绍agg方法是pandas中用于数据集汇总的函数,它可以将聚合行为应用于一组函数(字符串、函数或名称),这些函数将被应用于每一......
  • Python 常用内置函数 二
    enumerateenumerate函数用于将一个可遍历的数据对象组合为一个索引序列,同时列出数据和数据下标,一般用在for循环当中。enumerate(sequence,[start=0])sequence是一......
  • redis(3)关于key键的常用命令
    Redis键的常用命令keys*:查看当前库所有keyexistskey:判断某个key是否存在typekey:查看key的类型delkey:删除指定的keyunlinkkey:异步删除指定的key(仅将keys从keysp......
  • IMAP常用命令
    IMAP(InternetMessageAccessProtocol)常用命令合集连接到服务器openssls_client-connectimap.163.com:993-crlf登录aloginusernamepassword获取服务器功......
  • Ansible 常用模块及使用案例
    Ansible常用模块及使用案例第一个模块:commandansibleweb01-mcommand-a'可执行命令'第二个模块:Shell支持管道ansibleweb01-mcommand-a'可执行命令'第三个模......
  • windows下nginx常用命令
     #验证配置是否正确: nginx-t #查看nginx的版本号: nginx-V #启动nginx: startnginx #正常停止或关闭 nginx:nginx-squit #配置文件修改后重载命令......