首页 > 其他分享 >Pandas-DataFrame

Pandas-DataFrame

时间:2024-12-30 15:44:35浏览次数:6  
标签:Name df Age ----------------- DataFrame print Pandas

一、Pandas-DataFrame特点

 

二、特征练习

# 从列表嵌套字典创建DataFrame
data = [{'a': 1, 'b': 2},{'a': 5, 'b': 10, 'c': 20}]
df = pd.DataFrame(data)
print(df)
print('-----------')

# 从字典创建DataFrame
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky'],'Age':[28,34,29,42]}
df = pd.DataFrame(data, index=['s1','s2','s3','s4'])
print(df)
print('-----------')

# 从字典创建DataFrame
data = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
        'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(data)
print(df)
print('-----------')

#从数组中读取数据
data=[['zhaosan',12],['lisi',15],['wangwu',19]]
df=pd.DataFrame(data,columns=['name','age'])
print(df)
print('-----------')

  

   a   b     c
0  1   2   NaN
1  5  10  20.0
-----------
     Name  Age
s1    Tom   28
s2   Jack   34
s3  Steve   29
s4  Ricky   42
-----------
   one  two
a  1.0    1
b  2.0    2
c  3.0    3
d  NaN    4
-----------
      name  age
0  zhaosan   12
1     lisi   15
2   wangwu   19
-----------

执行结果

  

data={
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [25, 30, 35, 40],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']
}

df=pd.DataFrame(data)

# 查看前两行数据
print(df.head(2))
print("-----------------")

# 查看 DataFrame 的基本信息
print(df.info())
print("-----------------")

# 获取描述统计信息
print(df.describe())
print("-----------------")

# 按年龄排序
df_sorted = df.sort_values(by='Age', ascending=False)
print(df_sorted)
print("-----------------")

# 选择指定列
print(df[['Name', 'Age']])
print("-----------------")

# 按索引选择行
print(df.iloc[1:3])  # 选择第二到第三行(按位置)
print("-----------------")

# 按标签选择行
print(df.loc[:2])  # 选择第二到第三行(按标签)
print("-----------------")

# 计算分组统计(按城市分组,计算平均年龄)
print(df.groupby('City')['Age'].mean())
print("-----------------")

# 处理缺失值(填充缺失值)
df.loc[2,'Age']=None
print(df)
print("-----------------")
df['Age'] = df['Age'].fillna(30)
print(df)
print("-----------------")

# 导出为 CSV 文件
df.to_csv('output.csv', index=False)

 

  执行结果:

    Name  Age         City
0  Alice   25     New York
1    Bob   30  Los Angeles
-----------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   Name    4 non-null      object
 1   Age     4 non-null      int64 
 2   City    4 non-null      object
dtypes: int64(1), object(2)
memory usage: 224.0+ bytes
None
-----------------
             Age
count   4.000000
mean   32.500000
std     6.454972
min    25.000000
25%    28.750000
50%    32.500000
75%    36.250000
max    40.000000
-----------------
      Name  Age         City
3    David   40      Houston
2  Charlie   35      Chicago
1      Bob   30  Los Angeles
0    Alice   25     New York
-----------------
      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35
3    David   40
-----------------
      Name  Age         City
1      Bob   30  Los Angeles
2  Charlie   35      Chicago
-----------------
      Name  Age         City
0    Alice   25     New York
1      Bob   30  Los Angeles
2  Charlie   35      Chicago
-----------------
City
Chicago        35.0
Houston        40.0
Los Angeles    30.0
New York       25.0
Name: Age, dtype: float64
-----------------
      Name   Age         City
0    Alice  25.0     New York
1      Bob  30.0  Los Angeles
2  Charlie   NaN      Chicago
3    David  40.0      Houston
-----------------
      Name   Age         City
0    Alice  25.0     New York
1      Bob  30.0  Los Angeles
2  Charlie  30.0      Chicago
3    David  40.0      Houston
-----------------

  

标签:Name,df,Age,-----------------,DataFrame,print,Pandas
From: https://www.cnblogs.com/xiaokuangnvhai/p/18641373

相关文章

  • pandas-Series
     一、Series特点 二、特点练习importpandasaspdimportnumpyasnp#pandas---Series#默认索引从0开始且数组类型数据data=np.array(['张三','李四','王五','赵六'])s=pd.Series(data)print(s)#自定义索引s=pd.Series(data,index=['100','......
  • Python里的pandas库append 方法的替代实现方法
    使用 concat 函数concat 函数可以将多个 DataFrame 连接在一起,通过这种方式可以实现类似 append 的功能。importpandasaspd#创建示例DataFramedf=pd.DataFrame({'col1':[1,2],'col2':[3,4]})#创建要添加的新行,以DataFrame形式new_row=pd.DataF......
  • 5-pandas常用操作2
    前言一、df.max()计算每列最大值二、df.apply()1.可以传函数代码如下(示例):#lambda匿名函数自定义f=lambdax:x.max()-x.min()#x参数冒号后是返回值df.apply(f)#默认axis=0,所以这里是按列求最大值-最小值2.可以直接写内置函数代码如下(示例):df......
  • 【Pandas】pandas Series infer_objects
    Pandas2.2SeriesConversion方法描述Series.astype用于将Series对象的数据类型转换为指定类型的方法Series.convert_dtypes用于将Series对象的数据类型智能地转换为最佳可能的数据类型的方法Series.infer_objects用于尝试推断Series中对象(object)数据类型列的最佳数据......
  • 【Pandas】pandas Series convert_dtypes
    Pandas2.2SeriesConversion方法描述Series.astype用于将Series对象的数据类型转换为指定类型的方法Series.convert_dtypes用于将Series对象的数据类型智能地转换为最佳可能的数据类型的方法pandas.Series.convert_dtypespandas.Series.convert_dtypes方法是Pandas......
  • pandas常用方法
    删:df2.dropna()df2.dropna(subset=['消费','姓名'])数据填充:df.fillna(0)填充0df.fillna({'客单价':666,'支付金额':df['支付金额'].min()})df.drop_duplicates()//去重删除所有行df.drop_duplicates(subset='流量级别')//从下往上删df.dr......
  • dataframe的遍历
    for_,rowintrain_df.iterrows():print(j)breakid00007cff95d7f7974642a785aca248b0f26e60d3312fac...promptviešpoSlovensky?response_aÁno,hovorímposlovensky.Akovámmôžempom......
  • DataFrame的基本操作
    在Python中,使用pandas库操作DataFrame是非常常见的,pandas提供了丰富的函数和方法来处理表格数据。下面是一些常见的DataFrame操作示例:1.创建DataFrameimportpandasaspd#从字典创建DataFramedata={'Name':['Alice','Bob','Charlie','David'],�......
  • Python数据分析_Pandas_数据分析入门_3
    文章目录今日内容大纲介绍1.DataFrame-保存数据到文件2.DataFrame-读取文件数据3.DataFrame-数据分析入门4.DataFrame-分组聚合计算5.Pandas-基本绘图6.Pandas-常用排序方法7.Pandas案例-链家数据分析7.Pandas案例-链家数据分析_GIF_demo了解数据df1.info()df1.describ......
  • Pandas 知识点全攻略:数据处理与分析的必备指南
    一、Pandas简介定义Pandas是一个开源的、用于数据处理和分析的Python库。它建立在NumPy之上,提供了高效的数据结构和数据分析工具,使得在Python中处理和分析结构化数据变得更加容易。它主要有两个核心数据结构:Series和DataFrame。Series是一种类似于一维数组的数据结构,它可以......