续上文啦~
EXCEL表的操作
上一篇文章讲了怎么读取和操作txt和csv文档,但其实我们生活中还有一个常用的文本格式那就是excel文件,特别是在对大量数据进行处理的时候。excel文件的用处和广泛。
其实在python中有很多库可以处理excel文件,但是本文主要介绍使用最实用最广泛的库pandas库来进行excel数据的处理。
pandas
pandas库中常用的两种数据结构是Series和DataFrame。
- Series:Series是一维标记数组,可以存储任意类型的数据。它由两个数组组成,一个用于存储数据值,另一个用于存储数据的标签(索引)。可以通过索引访问和操作Series中的数据。
- DataFrame:DataFrame是一个二维标记数据结构,类似于表格或电子表格。它由行索引和列索引组成,每列可以包含不同类型的数据。DataFrame可以看作是多个Series对象的集合,每个Series对象代表一列数据。可以通过列名和行索引访问和操作DataFrame中的数据,也可以进行数据的增删改查以及数据的合并、重塑等操作。
上图右图是Series的结构
上图是一个dataframe的结构
在上面的展示中我们可以将series的结构简单理解为dataframe的一列(这一列的数据类型必须相同),而dataframe是大体可以理解为一个表格的样子。
excel表格的读取
import pandas as pd
file_path=r'D:\file\newexcel.excl\'
#读取Excel表格
df = pd.read_excel(file_path)
#打印表格内容
print(df)
这样就可以通过调用pandas库来实现表格数据的读取
表格数据的增删改
在python中用dataframe来存储表格数据,在本例中我们不进行文件的读取,直接创建一个现成的dataframe实例,帮助读者更好的实现实操性。
df=pd.DataFrame({'name':['张三','李四','王五'], 'age': [12,13,16], 'height': [155,154,167]})
增加新列
# 添加新列
df['home'] = ['广东', '广西', '湖南']
print(df)
增加新行
#添加新行
#创建新行
new_row = {'name': '周六', 'age': '18','height':187}
#将新行添加到DataFrame中
df = df.append(new_row, ignore_index=True)
print("添加新行后的DataFrame:")
print(df)
删除列
# 删除年龄列
df = df.drop('name', axis=1)
print(df)
删除行
#删除索引为0和2的行
df = df.drop([0, 2])
print(df)
修改数据
# 修改第一行第一个元素为'陈六'
df.loc[0, '姓名'] = '陈六'
print(df)
这里简要说明一下loc()函数,第一个参数值为行数的索引值,第二个参数值为列的键值。
excel表格的筛选
选择特定列
# 选择Name列数据
names = df['name']
print(names)
选择特定行
frist_row = df.col(0)
print(frist_row)
筛选数据
# 过滤年龄大于25的行
filtered_data = df[df['name'] > 13]
print(filtered_data)
#输出结果:
name age height
2 王五 16 167
~~!!!!!!!!!!!!!!分割线!!!!!!!!!!!!!!!!!!!!!!!1
好啦~这个系列的文章就更新完啦,建议大家多看几遍列表和循环的操作,还有就是平时有不懂的地方可以把文章收藏好,要不到时候找不到了哦!