首页 > 其他分享 >Pandas学习挑战第三关-数据结构DataFrame

Pandas学习挑战第三关-数据结构DataFrame

时间:2023-08-08 22:08:33浏览次数:36  
标签:NaN DataFrame print pd 第三关 myvar data Pandas

Pandas 数据结构 - DataFrame

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

Pandas学习挑战第三关-数据结构DataFrame_数据

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

data:一组数据(ndarray、Series、map、lists、dictionary等类型); index:索引值,或行标签; column:列标签,默认从0开始; dtype:数据类型; copy:拷贝数据,默认为False

使用列表创建:

import pandas as pd
data=[['google',10],['baidu',20],['taobao',30]]#使用列表创建
myvar=pd.DataFrame(data,columns=['name','age'])
print(myvar)

     name  age
0  google   10
1   baidu   20
2  taobao   30

使用ndarray创建:

import pandas as pd
data={'name':['google','baidu','taobao'],'age':[10,12,20]}
myvar=pd.DataFrame(data)
print(myvar)

     name  age
0  google   10
1   baidu   12
2  taobao   20

使用字典创建

data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data)
print(myvar)

    a    b    c    d    e
0  1.0  2.0  NaN  NaN  NaN
1  NaN  NaN  3.0  4.0  5.0

没有对应的值会自动记为NAN。 Pandas 可以使用 loc 属性返回指定行的数据,如果没有设置索引,第一行索引为 0,第二行索引为 1,以此类推: 返回的就是一个Series数据

data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data)
print(myvar)
print('\n')
print(myvar.loc[1])

a    NaN
b    NaN
c    3.0
d    4.0
e    5.0
Name: 1, dtype: float64

Pandas 可以使用 loc 属性返回指定索引对应到某一行:

data=[{'a':1,'b':2},{'c':3,'d':4,'e':5}]
myvar=pd.DataFrame(data,index=['x','y'])
print(myvar)
print('\n')
print(myvar.loc['x'])

    a    b    c    d    e
x  1.0  2.0  NaN  NaN  NaN
y  NaN  NaN  3.0  4.0  5.0


a    1.0
b    2.0
c    NaN
d    NaN
e    NaN
Name: x, dtype: float64

标签:NaN,DataFrame,print,pd,第三关,myvar,data,Pandas
From: https://blog.51cto.com/u_16200950/7012152

相关文章

  • DataFrame 指定某列的格式
    importpandasaspd#创建示例DataFramedata={'Name':['Alice','Bob','Charlie'],'Age':[25.0,30.0,35.0]#注意:这里的年龄列是浮点数类型}df=pd.DataFrame(data)#将'Age'列的数据类型设置为整数df['......
  • DataFrame 按行转json数据
    importpandasaspd#创建示例DataFramedata={'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'Occupation':['Engineer','Teacher','Doctor']......
  • DataFrame排序,单列排序,多列排序
    importpandasaspd#创建示例DataFramedata={'Name':['Alice','Bob','Charlie'],'Age':[30,25,35],'Salary':[50000,60000,45000]}df=pd.DataFrame(data)#按照'Age'......
  • DataFrame 保留前几列和后几列
    importpandasaspddata={'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'Salary':[50000,60000,45000],'Location':['NY','CA',�......
  • DataFrame 存为带格式的excel文件
    importpandasaspddata={'Name':['Alice','Bob','Charlie'],'Age':[25,30,35],'Salary':[50000,60000,45000],'Location':['NY','CA',�......
  • 根据DataFrame A列的值筛选DataFrame B中的数据
    importpandasaspd#创建示例DataFrameAdataA={'ID':[1,2,3,4],'Category':['A','B','A','C']}dfA=pd.DataFrame(dataA)#创建示例DataFrameBdataB={'ID':[1,2,3,4]......
  • DataFrame 计数value_counts 后转成df
    importpandasaspd#创建示例DataFramedata={'Category':['A','B','A','C','A','B','C','A','B']}df=pd.DataFrame(data)#使用value_counts()方法对&......
  • merge连接两个DataFrame
    importpandasaspd#创建左边的示例DataFramedata1={'ID':[1,2,3,4],'Name':['Alice','Bob','Charlie','John']}df1=pd.DataFrame(data1)df1.set_index('ID',inplace=True)......
  • concat 连接两个DataFrame
    importpandasaspd#创建左边的示例DataFramedata1={'ID':[1,2,3],'Name':['Alice','Bob','Charlie']}df1=pd.DataFrame(data1)df1.set_index('ID',inplace=True)#设置'ID'列......
  • DataFrame 新增新列
    importpandasaspd#创建示例DataFramedata={'A':[1,2,3],'B':['a','b','c']}df=pd.DataFrame(data)#增加新列'C'new_data=[10,20,30]df['C']=new_dataprint(df)......