Pandas 数据结构 - DataFrame
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
DataFrame 构造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
data:一组数据(ndarray、Series、map、lists、dictionary等类型); index:索引值,或行标签; column:列标签,默认从0开始; dtype:数据类型; copy:拷贝数据,默认为False
使用列表创建:
import pandas as pd
data=[['google',10],['baidu',20],['taobao',30]]#使用列表创建
myvar=pd.DataFrame(data,columns=['name','age'])
print(myvar)
name age
0 google 10
1 baidu 20
2 taobao 30
使用ndarray创建:
import pandas as pd
data={'name':['google','baidu','taobao'],'age':[10,12,20]}
myvar=pd.DataFrame(data)
print(myvar)
name age
0 google 10
1 baidu 12
2 taobao 20
使用字典创建:
data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data)
print(myvar)
a b c d e
0 1.0 2.0 NaN NaN NaN
1 NaN NaN 3.0 4.0 5.0
没有对应的值会自动记为NAN。 Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1,以此类推: 返回的就是一个Series数据
data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data)
print(myvar)
print('\n')
print(myvar.loc[1])
a NaN
b NaN
c 3.0
d 4.0
e 5.0
Name: 1, dtype: float64
Pandas 可以使用 loc 属性返回指定索引对应到某一行:
data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data,index=['x','y'])
print(myvar)
print('\n')
print(myvar.loc['x'])
a b c d e
x 1.0 2.0 NaN NaN NaN
y NaN NaN 3.0 4.0 5.0
a 1.0
b 2.0
c NaN
d NaN
e NaN
Name: x, dtype: float64
标签:NaN,DataFrame,print,pd,第三关,myvar,data,Pandas
From: https://blog.51cto.com/u_16200950/7012152