首页 > 其他分享 >Pandas

Pandas

时间:2024-07-22 21:11:43浏览次数:5  
标签:文件名 df read pd csv 数据 Pandas

Pandas

导入

import numpy as np
import pandas as pd

载入数据

相对路径 df=pd.read_csv('' )

绝对路径 df=pd.read_csv(r'' )

逐块读取 chunker=pd.read_csv(‘./文件名’,chunksize=1000)
#每一千个行为一个数据模块 for i in chunker

将表头改为中文

df=pd.read_csv(‘文件名’,names=[ ]) #names中为倒序

改变索引

df=pd.read_csv(‘文件名’,index_col=’ ‘,header=0)

查看数据基本信息

df.info()

观察表格前n行数据

df.head(n)

观察表格后n行数据

df.tail(n)

判断数据是否为空

df.isnull()

保存数据为一个新文件

df.to_csv(‘文件名’)

查看表格数据的每列名称 df.columns()
查看一列所有值 df[‘这列名称‘]或df.这列名称
删除列 del test 1[‘ ‘]
隐藏列 df.drop()
筛选 df[df[‘age’]<10]
显示a的数据中的第n行的b,c a.loc[[n],[‘b’,’c’]]
命名行表头 index=[ ]
命名列表头 columns=[ ]
让列索引降序排列 frame.sort_index(axis=1,ascending=False)
让两列数据同时降序排列 frame.sort_values(by=[‘a’,’c’],ascending=False)

两个dataframe数据相加:结果对应的行和列相加,没有对应的变成空值NaN
Count:样本数据大小
Mean:样本数据平均值
Std:样本数据标准差

标签:文件名,df,read,pd,csv,数据,Pandas
From: https://www.cnblogs.com/dzhangk/p/18316887

相关文章

  • Pandas 和numpy 入门详细笔记
    1.安装和导入1.1安装pipinstallpandaspipinstallnumpy1.2导入importpandasaspdimportnumpyasnp2.数据结构2.1Series(系列)定义:一维标签化数组,可以保存任何数据类型(整数、浮点数、字符串等)。创建Series:#从列表创建s=pd.Series([10,20,30,40]......
  • Pandas入门
    Pandas入门1.读取和写入数据①read_csv():从CSV文件读取数据到DataFrame。 importpandasaspd读取文件名为"data.csv'的数据df=pd.read_csv('data.csv') ②read_excel():从Excel文件读取数据。 假设有一个文件名为1data.xlsxdf=pd.read_excel('data.xlsx') ......
  • 以块的形式处理大型 Spark DataFrame 的推荐方法是什么:“toPandas()”或“RDD.foreach
    我正在使用PySpark处理大型数据集,并且需要以每个500条记录的块的形式处理数据。我正在考虑使用toPandas()将我的SparkDataFrames转换为PandasDataFrames以方便分块或坚持使用SparkRDD,并使用foreachPartition()手动处理分块。以下是我正在考虑的示例方......
  • 在docker中找不到pandas
    我对码头工人很陌生。我可以在我的机器上成功运行python文件,但是Docker无法识别pandas库。这是我的Docker文件:FROMpythonWORKDIR/appCOPY./appCMD["python3","fisherlog_corrected.py"]错误消息如下:Traceback(mostrecentcalllast):File"/ap......
  • pandas
    1.pandas基础1.1Seriesimportpandasaspdimportnumpyasnp创建##1.创建Series对象sdata=pd.Series(np.arange(1,4),index=list('abc'))sdataa1b2c3dtype:int32访问##2.Series对象访问#默认数字索引print(sdata.iloc[0])#使用标签[a,......
  • Pandas数据分析与处理
    Pandas主要有三种数据结构。1)Series,带标签的一维数组。2)Dataframe,带标签且大小可变的二维表格结构。3)Panel,带标签且大小可变的三维数组。本次主要总结的是pandas用于操作Dataframe的相关操作。一、导入扩展库numpy和pandas,按照Python社区的惯例,在导入扩展库numpy时会起一个......
  • 在 pandas 中用 NaN 替换空白值(空白)
    我想找到Pandas数据框中包含空格(任意数量)的所有值,并将这些值替换为NaN。有什么想法可以改进吗?基本上我想把这个:ABC2000-01-01-0.532681foo02000-01-021.490752bar12000-01-03-1.387326foo22000-01-040.8147......
  • 如何将 geopandas 数据框与底图重叠?
    我有一个shapefile,我将其读取为geopandas数据框importgeopandasasgpdgdf=gpd.read_file('myfile.shp')gdf.plot()其中gdf.crs<ProjectedCRS:ESRI:54009>Name:World_MollweideAxisInfo[cartesian]:-E[east]:Easting(metre)-......
  • Python Pandas:如何解析没有行结尾的 CSV
    如何解析没有行结尾的CSV文件?示例数据sep=;Id;Date;1;1980-02-29;2;1980-03-10;3;;可以使用lineterminator参数指定行终止符来解析没有行尾的CSV文件。在这种情况下,你可以将lineterminator设置为一个空字符串('')。以下是使用......
  • 如何在 termux 上安装 geopandas
    我似乎无法理解我在termux上做错了什么我尝试了一切我跑了pipinstallgeopandas它似乎确实有效在termux上安装“geopandas”它总是卡住,我不知道为什么错误:CollectinggeopandasUsingcachedgeopandas-1.0.1-py3-none-any.whl.metadata(2.2kB)Req......