首页 > 其他分享 >Pandas 百题大冲关-基础部分

Pandas 百题大冲关-基础部分

时间:2023-05-06 13:56:14浏览次数:32  
标签:百题 冲关 df Series DataFrame s4 pd df2 Pandas

1、查看版本信息:print(pd.__version__)

Series 基本操作

1、创建Series的3种方式,1)列表 2)ndarray 3)字典

2、修改 Series 索引:s1.index=['A','B','C','D','E']

3、Series 纵向拼接:s4 = s3.append(s1)

4、Series 按指定索引删除元素:s4=s4.drop('e')

5、Series 修改指定索引元素:s4['A']=3

6、Series 按指定索引查找元素:s4['a']

7、Series 切片操作(对s4的前 3 个数据访问):s4[:3]

Series 运算

Series 的加法运算是按照索引计算,如果索引不同则填充为 NaN(空值)。

1、s4.add(s3)加法

2、s4.sub(s3)减法

3、s4.mul(s3)乘法

4、s4.div(s3)除法

5、s4.median()中位数

6、s4.sum()求和

7、s4.max()最大值

8、s4.min()最小值

创建 DataFrame 数据类型

1、通过 NumPy 数组创建 DataFrame:

df1=pd.DataFrame(np.random.randn(6,4),index=pd.date_range('today',periods=6),columns=['A','B','C','D'])

date_range():主要用于生成一系列特定的时间,可以自己设定开始、结束、周期数、时间间隔、时区等等。

pd.date_range('today',periods=6)--代表的是从今天开始,生成6条信息;

 2、通过字典数组创建 DataFrame

df2=pd.DataFrame({'animal':['cat', 'cat', 'snake', 'dog', 'dog', 'cat', 'snake', 'cat', 'dog', 'dog'],
'priority': ['yes', 'yes', 'no', 'yes', 'no', 'no', 'no', 'yes', 'no', 'no']},      ----2列10行的数据
index=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'])

3、查看 DataFrame 的数据类型:df2.dtypes

DataFrame 基本操作

1、预览 DataFrame 的前 5 行数据:df2.head()

2、查看 DataFrame 的后2行数据:df2.tail(2)

3、查看DataFrame 的索引:df.index

4、查看DataFrame 的列名:df.columns

5、查看DataFrame 的数值:df.values

6、查看DataFrame 的统计数据:df.describe()

7、DataFrame 的转置操作:df.T

8、对 DataFrame 进行按列排序:df.sort_values(by='age')

9、对 DataFrame 进行切片:df[:3]

10、对 DataFrame 通过标签查询(单列):df['age']或者df2.age 

11、对 DataFrame 通过标签查询(多列):df2[['age', 'animal']] 

12、对 DataFrame 通过位置查询(多列):df2.iloc[1:3]和df2[1:3]结果一样

13、DataFrame副本copy:df3=df2.copy()

14、判断DataFrame元素是否为空:df3.isnull()

15、添加列数据:df3['NO.']=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

16、 根据 DataFrame 的下标值进行更改:df3.iat[1, 1] = 2

17、根据 DataFrame 的标签对数据进行修改:df3.loc['f', 'age'] = 1.5

18、对DataFrame求平均值(按列):df.mean()

19、对DataFrame求和(指定列):df3['visits'].sum()

字符串操作

1、将字符串转化为小写字母:string是一个字符串,string.str.lower()

2、将字符串转化为大写字母:string.str.upper()

DataFrame 缺失值操作

1、对缺失值进行填充:df4.fillna(value=2)

2、删除存在缺失值的行:df5.dropna(how='any')

3、DataFrame按指定列对齐(即共同列,合并行):pd.merge(left, right, on='key')

DataFrame 文件操作

1、CSV文件写入:df3.to_csv('animal.csv')

2、CSV文件读写:df_animal = pd.read_csv('animal.csv')

3、EXCEL写入操作:df3.to_excel('animal.xlsx', sheet_name='Sheet1')

 4、EXCEL读取操作:pd.read_excel('animal.xlsx', 'Sheet1', index_col=None, na_values=['NA'])

    ( index_col是指定某一列为索引,默认为None,即没有索引列,na_values为['NA'])

 

标签:百题,冲关,df,Series,DataFrame,s4,pd,df2,Pandas
From: https://www.cnblogs.com/anqierzp/p/17329190.html

相关文章

  • pandas
    TableofContents1  Set-up2  Intro3  PandasDataStructures-2Types3.1  Series3.2  DataFrame3.3  SeriesVSDataFrame4  Dropping5  Sort&Rank6  I/O6.1  CSV6.2  Excel6.3  SQLQuery/DatabaseTable7  Selection7.1  Getting7.2  Sel......
  • Python+Pandas批量合并大量excel文件
    requirments.txtet-xmlfile==1.1.0numpy==1.24.3openpyxl==3.1.2pandas==2.0.1python-dateutil==2.8.2pytz==2023.3six==1.16.0tzdata==2023.3main.pyimportosimportpandasaspddir_path=os.path.dirname(os.path.abspath(__file__))source_location=o......
  • Python教程:pandas读写txt文件——DataFrame和Series
    大家用pandas一般都是读写csv文件或者tsv文件,读写txt文件时一般就withopen了,其实pandas数据类型操作起来更加方便,还是建议全用pandas这一套。读txt文件代码如下,主要是设置正则表达式的分隔符(sep参数),和列名取消(header参数),以及不需要列索引(index_col)。1df=pd.read_csv("workl......
  • 5.4趣味百题 4.8
    一问题描述使用数组精确计算M/N(0<M<N<=100)的值。假如M/N是无限循环小数,则输出他的第一循环节和循环节的起止位置二设计思路1.运用一个一维数组来存放商的每一位来提高精度  每次存放完之后把余数*10再计算下一位。2.运用一个一维数组存放余数,如果当出现余数为0时则该数......
  • 【pandas基础】--数据读取
    数据读取是第一步,只有成功加载数据之后,后续的操作才有可能。pandas可以读取和导入各种数据格式的数据,如CSV,Excel,JSON,SQL,HTML等,不需要手动编写复杂的读取代码。1.各类数据源pandas提供了导入各类常用文件格式数据的接口,这里介绍3种最常用的加载数据的接口。1.1从CSV文件读......
  • python pandas 生成excle
    首先需要导包需要两个包分别是pandas和openpyxlpipinstall-i https://pypi.doubanio.com/simple/ --trusted-host pypi.doubanio.com pandaspipinstallopenpyxl 创建Python开始写入#使用pandas生成xlsx的excel文件importpandasaspdimportpandasaspddata=......
  • pandas drop、loc和iloc函数对数据框进行操作
    pandas.DataFrame.drop—从行或列中删除指定的标签参考:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html语法格式DataFrame.drop(labels=None, *, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise......
  • 关于如何使用pandas将不同的数据写入到同一个Excel的不同Sheet表中
    笔者在之前使用python将数据写入到Excel表格中,一般都只需要写入一张Sheet表中就可以了因最近一个小的需求,需要将不同的大列表数据写入到不同的Sheet表中这样,再使用之前的pandas.DataFrame(content_list),然后.to_excel("./xxxxx.xlsx")就不再好用了于是笔者又去看了一个pandas......
  • 关于pandas.ExcelWriter()对象在执行.save()时报错FutureWarning: save is not part o
    有时使用pandas将多份数据,写入到Excel中不同的Sheet,可能会用到pandas.ExcelWriter("xxxx.xlsx")对象这样在结束时,就会对对象进行.save()和close(),当然这也是从大部分网站上看到的使用方法但是笔者在实际使用过程中,按这个过程,遇到报错:FutureWarning:saveisnotpartofthepu......
  • Pandas
    Series结构Series结构,也称Series序列,是Pandas常用的数据结构之一,它是一种类似于一维数组的结构,由一组数据值(value)和一组标签组成,其中标签与数据值具有对应关系。标签不必是唯一的,但必须是可哈希类型(即不可变类型,如python中的整形、字符串、数值、浮点)。该对象既支持基于整数的索......