Pandas学习挑战第三关-数据结构DataFrame

时间：2023-08-08 22:08:33浏览次数：42

标签：NaN DataFrame print pd 第三关 myvar data Pandas

Pandas 数据结构 - DataFrame

DataFrame 是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔型值）。DataFrame 既有行索引也有列索引，它可以被看做由 Series 组成的字典（共同用一个索引）。

Pandas学习挑战第三关-数据结构DataFrame_数据

DataFrame 构造方法如下：

pandas.DataFrame( data, index, columns, dtype, copy)

data：一组数据（ndarray、Series、map、lists、dictionary等类型）； index：索引值，或行标签； column：列标签，默认从0开始； dtype：数据类型； copy：拷贝数据，默认为False

使用列表创建：

import pandas as pd
data=[['google',10],['baidu',20],['taobao',30]]#使用列表创建
myvar=pd.DataFrame(data,columns=['name','age'])
print(myvar)

     name  age
0  google   10
1   baidu   20
2  taobao   30

使用ndarray创建：

import pandas as pd
data={'name':['google','baidu','taobao'],'age':[10,12,20]}
myvar=pd.DataFrame(data)
print(myvar)

     name  age
0  google   10
1   baidu   12
2  taobao   20

使用字典创建：

data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data)
print(myvar)

    a    b    c    d    e
0  1.0  2.0  NaN  NaN  NaN
1  NaN  NaN  3.0  4.0  5.0

没有对应的值会自动记为NAN。 Pandas 可以使用 loc 属性返回指定行的数据，如果没有设置索引，第一行索引为 0，第二行索引为 1，以此类推：返回的就是一个Series数据

data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data)
print(myvar)
print('\n')
print(myvar.loc[1])

a    NaN
b    NaN
c    3.0
d    4.0
e    5.0
Name: 1, dtype: float64

Pandas 可以使用 loc 属性返回指定索引对应到某一行：

data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data,index=['x','y'])
print(myvar)
print('\n')
print(myvar.loc['x'])

    a    b    c    d    e
x  1.0  2.0  NaN  NaN  NaN
y  NaN  NaN  3.0  4.0  5.0


a    1.0
b    2.0
c    NaN
d    NaN
e    NaN
Name: x, dtype: float64

标签：NaN,DataFrame,print,pd,第三关,myvar,data,Pandas
From： https://blog.51cto.com/u_16200950/7012152

DataFrame 指定某列的格式
importpandasaspd#创建示例DataFramedata={'Name':['Alice','Bob','Charlie'],'Age':[25.0,30.0,35.0]#注意：这里的年龄列是浮点数类型}df=pd.DataFrame(data)#将'Age'列的数据类型设置为整数df['......
DataFrame 按行转json数据
importpandasaspd#创建示例DataFramedata={'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'Occupation':['Engineer','Teacher','Doctor']......
DataFrame排序，单列排序，多列排序
importpandasaspd#创建示例DataFramedata={'Name':['Alice','Bob','Charlie'],'Age':[30,25,35],'Salary':[50000,60000,45000]}df=pd.DataFrame(data)#按照'Age'......
DataFrame 保留前几列和后几列
importpandasaspddata={'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'Salary':[50000,60000,45000],'Location':['NY','CA',�......
DataFrame 存为带格式的excel文件
importpandasaspddata={'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'Salary':[50000,60000,45000],'Location':['NY','CA',�......
根据DataFrame A列的值筛选DataFrame B中的数据
importpandasaspd#创建示例DataFrameAdataA={'ID':[1,2,3,4],'Category':['A','B','A','C']}dfA=pd.DataFrame(dataA)#创建示例DataFrameBdataB={'ID':[1,2,3,4]......
DataFrame 计数value_counts 后转成df
importpandasaspd#创建示例DataFramedata={'Category':['A','B','A','C','A','B','C','A','B']}df=pd.DataFrame(data)#使用value_counts()方法对&......
merge连接两个DataFrame
importpandasaspd#创建左边的示例DataFramedata1={'ID':[1,2,3,4],'Name':['Alice','Bob','Charlie','John']}df1=pd.DataFrame(data1)df1.set_index('ID',inplace=True)......
concat 连接两个DataFrame
importpandasaspd#创建左边的示例DataFramedata1={'ID':[1,2,3],'Name':['Alice','Bob','Charlie']}df1=pd.DataFrame(data1)df1.set_index('ID',inplace=True)#设置'ID'列......
DataFrame 新增新列
importpandasaspd#创建示例DataFramedata={'A':[1,2,3],'B':['a','b','c']}df=pd.DataFrame(data)#增加新列'C'new_data=[10,20,30]df['C']=new_dataprint(df)......

Pandas学习挑战第三关-数据结构DataFrame

Pandas 数据结构 - DataFrame

相关文章

赞助商

阅读排行