Pandas

导入

import numpy as np
import pandas as pd

载入数据

相对路径 df=pd.read_csv('' )

绝对路径 df=pd.read_csv(r'' )

逐块读取 chunker=pd.read_csv(‘./文件名’,chunksize=1000)
#每一千个行为一个数据模块 for i in chunker

将表头改为中文

df=pd.read_csv(‘文件名’,names=[ ]) #names中为倒序

改变索引

df=pd.read_csv(‘文件名’,index_col=’ ‘，header=0)

查看数据基本信息

df.info()

观察表格前n行数据

df.head(n)

观察表格后n行数据

df.tail(n)

判断数据是否为空

df.isnull()

保存数据为一个新文件

df.to_csv(‘文件名’)

查看表格数据的每列名称 df.columns(）
查看一列所有值 df[‘这列名称‘]或df.这列名称
删除列 del test 1[‘ ‘]
隐藏列 df.drop()
筛选 df[df[‘age’]<10]
显示a的数据中的第n行的b,c a.loc[[n],[‘b’,’c’]]
命名行表头 index=[ ]
命名列表头 columns=[ ]
让列索引降序排列 frame.sort_index(axis=1,ascending=False)
让两列数据同时降序排列 frame.sort_values(by=[‘a’,’c’],ascending=False)

两个dataframe数据相加：结果对应的行和列相加，没有对应的变成空值NaN
Count：样本数据大小
Mean：样本数据平均值
Std：样本数据标准差

标签：文件名,df,read,pd,csv,数据,Pandas
From： https://www.cnblogs.com/dzhangk/p/18316887

Pandas 和numpy 入门详细笔记
1.安装和导入1.1安装pipinstallpandaspipinstallnumpy1.2导入importpandasaspdimportnumpyasnp2.数据结构2.1Series（系列）定义：一维标签化数组，可以保存任何数据类型（整数、浮点数、字符串等）。创建Series：#从列表创建s=pd.Series([10,20,30,40]......
Pandas入门
Pandas入门1.读取和写入数据①read_csv():从CSV文件读取数据到DataFrame。 importpandasaspd读取文件名为"data.csv'的数据df=pd.read_csv('data.csv') ②read_excel():从Excel文件读取数据。假设有一个文件名为1data.xlsxdf=pd.read_excel('data.xlsx') ......
以块的形式处理大型 Spark DataFrame 的推荐方法是什么：“toPandas()”或“RDD.foreach
我正在使用PySpark处理大型数据集，并且需要以每个500条记录的块的形式处理数据。我正在考虑使用toPandas()将我的SparkDataFrames转换为PandasDataFrames以方便分块或坚持使用SparkRDD，并使用foreachPartition()手动处理分块。以下是我正在考虑的示例方......
在docker中找不到pandas
我对码头工人很陌生。我可以在我的机器上成功运行python文件，但是Docker无法识别pandas库。这是我的Docker文件：FROMpythonWORKDIR/appCOPY./appCMD["python3","fisherlog_corrected.py"]错误消息如下：Traceback(mostrecentcalllast):File"/ap......
pandas
1.pandas基础1.1Seriesimportpandasaspdimportnumpyasnp创建##1.创建Series对象sdata=pd.Series(np.arange(1,4),index=list('abc'))sdataa1b2c3dtype:int32访问##2.Series对象访问#默认数字索引print(sdata.iloc[0])#使用标签[a,......
Pandas数据分析与处理
Pandas主要有三种数据结构。1）Series，带标签的一维数组。2）Dataframe,带标签且大小可变的二维表格结构。3）Panel，带标签且大小可变的三维数组。本次主要总结的是pandas用于操作Dataframe的相关操作。一、导入扩展库numpy和pandas，按照Python社区的惯例，在导入扩展库numpy时会起一个......
在 pandas 中用 NaN 替换空白值（空白）
我想找到Pandas数据框中包含空格（任意数量）的所有值，并将这些值替换为NaN。有什么想法可以改进吗？基本上我想把这个：ABC2000-01-01-0.532681foo02000-01-021.490752bar12000-01-03-1.387326foo22000-01-040.8147......
如何将 geopandas 数据框与底图重叠？
我有一个shapefile，我将其读取为geopandas数据框importgeopandasasgpdgdf=gpd.read_file('myfile.shp')gdf.plot()其中gdf.crs<ProjectedCRS:ESRI:54009>Name:World_MollweideAxisInfo[cartesian]:-E[east]:Easting(metre)-......
Python Pandas：如何解析没有行结尾的 CSV
如何解析没有行结尾的CSV文件？示例数据sep=;Id;Date;1;1980-02-29;2;1980-03-10;3;;可以使用lineterminator参数指定行终止符来解析没有行尾的CSV文件。在这种情况下，你可以将lineterminator设置为一个空字符串('')。以下是使用......
如何在 termux 上安装 geopandas
我似乎无法理解我在termux上做错了什么我尝试了一切我跑了pipinstallgeopandas它似乎确实有效在termux上安装“geopandas”它总是卡住，我不知道为什么错误：CollectinggeopandasUsingcachedgeopandas-1.0.1-py3-none-any.whl.metadata(2.2kB)Req......

Pandas

Pandas

导入

载入数据

将表头改为中文

改变索引

查看数据基本信息

观察表格前n行数据

观察表格后n行数据

判断数据是否为空

保存数据为一个新文件

相关文章

赞助商

阅读排行