首页 > 其他分享 >pandas常用方法

pandas常用方法

时间:2023-04-22 15:04:54浏览次数:27  
标签:常用 name df data column pd 方法 pandas

import pandas as pd
# 读取CSV文件
df = pd.read_csv('data.csv')
# 读取Excel文件
df = pd.read_excel('data.xlsx')
# 读取SQL数据
import sqlite3
conn = sqlite3.connect('data.sqlite')
df = pd.read_sql_query('SELECT * FROM table', conn)
# 读取JSON数据
df = pd.read_json('data.json')

import pandas as pd
# 从列表创建DataFrame
data = {'name': ['Tom', 'Jerry', 'Mickey'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)
# 从字典创建DataFrame
data = [['Tom', 25], ['Jerry', 30], ['Mickey', 35]]
df = pd.DataFrame(data, columns=['name', 'age'])
# 从CSV文件创建DataFrame
df = pd.read_csv('data.csv')

import pandas as pd
# 删除重复行
df.drop_duplicates(inplace=True)
# 删除缺失值
df.dropna(inplace=True)
# 填充缺失值
df.fillna(value=0, inplace=True)
# 替换值
df.replace('old_value', 'new_value', inplace=True)

import pandas as pd
# 按照某一列分组
grouped = df.groupby('column_name')
# 按照多列分组
grouped = df.groupby(['column_name1', 'column_name2'])
# 对分组后的数据进行聚合操作
grouped.agg({'column_name': 'sum'})

import pandas as pd
# 按照某一列合并
merged = pd.merge(df1, df2, on='column_name')
# 按照多列合并
merged = pd.merge(df1, df2, on=['column_name1', 'column_name2'])
# 连接两个DataFrame
merged = pd.concat([df1, df2], axis=0)

import pandas as pd
import matplotlib.pyplot as plt
# 绘制柱状图
df.plot(kind='bar')
# 绘制折线图
df.plot(kind='line')
# 绘制散点图
df.plot(kind='scatter', x='column_name1', y='column_name2')
# 绘制饼图
df['column_name'].value_counts().plot(kind='pie')

import pandas as pd
# 计算平均值
df['column_name'].mean()
# 计算中位数
df['column_name'].median()
# 计算标准差
df['column_name'].std()

import pandas as pd
# 导出CSV文件
df.to_csv('data.csv', index=False)
# 导出Excel文件
df.to_excel('data.xlsx', index=False)
# 导出SQL数据
import sqlite3
conn = sqlite3.connect('data.sqlite')
df.to_sql('table_name', conn, if_exists='replace', index=False)
# 导出JSON数据
df.to_json('data.json', orient='records')

标签:常用,name,df,data,column,pd,方法,pandas
From: https://www.cnblogs.com/full-stack-linux-new/p/17343076.html

相关文章

  • pandas高级用法
    importpandasaspd#创建多级索引index=pd.MultiIndex.from_arrays([['A','A','A','B','B','B'],[1,2,3,1,2,3]],names=['group','number'])#创建DataFramedata={'value1&......
  • Arrays方法
    Arrays方法Arrays里面包括了一系列静态方法,用于管理和操作数组toString方法Array.toString(arr);sort排序(自然排序和定制排序)int[]arr={1,2,4,1,5,1};Arrays.sort(arr);//默认是从大到小的//可以通过Compare接口来定制排序Arrays.sort(arr,newCompare(){@Ov......
  • 打破双亲委派模型方法
    自定义一个继承了ClassLoader的加载器,然后重写loadClass方法。若不想打破则重写findClass方法即可。我们比较熟悉的Tomcat服务器为了能够优先加载Web应用目录下的类,然后再加载其他目录下的类,就自定义了类加载器WebAppClassLoader来打破双亲委托机制。这也是Tomcat下Web......
  • openpyxl常用方法
    fromopenpyxlimportload_workbook#打开一个已存在的Excel文件wb=load_workbook(filename='example.xlsx')#创建一个新的Excel文件wb=Workbook()#选择第一个工作表ws=wb.active#通过工作表名称选择工作表ws=wb['Sheet1']#通过工作表索引选择工作表ws=wb.workshe......
  • Java中的String的intren方法详解
    intern方法会从字符串常量池中查询当前字符串是否存在,若不存在就会将当前字符串放入常量池Stringa=newString("hello").intern();Stringb="hello";System.out.println(a==b);//Stringa=newString("hello");a.intern();Stringb="hello";System.out.println(a==b)......
  • python-docx常用方法
    fromdocximportDocument#创建一个新文档doc=Document()#添加段落para=doc.add_paragraph('HelloWorld!')fromdocx.enum.styleimportWD_STYLE_TYPEfromdocx.enum.textimportWD_ALIGN_PARAGRAPH#添加标题title=doc.add_heading('DocumentTitle',leve......
  • SpringMVC 常用注解
    1、@Controller   @Controller 用于标记在一个类上,使用它标记的类就是一个SpringMVCController 对象。分发处理器将会扫描使用了该注解的类的方法,并检测该方法是否使用了@RequestMapping 注解。@Controller 只是定义了一个控制器类,而使用@RequestMapping 注解的方法才......
  • django常用命令
    Django常用命令如下:创建Django项目:django-adminstartprojectproject_name该命令会创建一个名为project_name的Django项目创建Django应用程序:pythonmanage.pystartappapp_name该命令会在Django项目中创建一个名为app_name的应用程序。启动Django服务器: pythonmanag......
  • tkinter中Scale滑杆获取值的三种方法
    importtkinterastkwin=tk.Tk()win.geometry('200x200')win.title('测试窗口')'''方法一:直接使用组件对象的get()方法获取程序调用该方法时,get()会返回当前滑杆的值'''#number_scale=tk.Scale(orient=tk.HORIZONTAL)#number_scale.pack(......
  • SQL2000修改sa密码时提示【错误2812:未能找到储存过程’sp_passwoed’】的解决方法
    1.在用SQL2000数据库经常会遇见忘记sa密码,需要修改sa密码,但是有时候修改sa密码时会提示  错误2812:未能找到储存过程’sp_passwoed’2.遇到这种情况的解决方法是:打开开始菜单,找到SQLServer的程序组,选择运行程序组中的“查询分析器”,打开 3.打开“查询分析器”后会有一个......