Python pandas库操作 excel

时间：2023-06-07 13:55:19浏览次数：45

标签：False Python drop excel df duplicates pandas

Python pandas库操作 excel

特别提示：

pandas 库是基于numpy库的软件库，因此安装Pandas 之前需要先安装numpy库。默认的pandas不能直接读写excel文件，需要安装读、写库即xlrd、xlwt才可以实现xls后缀的excel文件的读写，要想正常读写xlsx后缀的excel文件，还需要安装openpyxl库。

数据读取

import pandas as pd
 
file = r'D:/xxx/demo1.xlsx'
df = pd.read_excel(file)
print(df)

# read_excel()方法将Excel文件读取到pandas DataFrame中

数据处理

获取列数据

df['column_name']

获取多列

多列中，df[] 括号里边是一个列表

df[['columns_name1','columns_name2']]

获取行数据

其中，Line_number是行号，column_name是列名，可缺省，列名缺省获取整行

df.loc[Line_number, ['column_name']]

整体数据排序

df.sort_values(by='columns_name',ascending = False)

数据去重

Panda DataFrame 对象提供了一个数据去重的函数 drop_duplicates()，即从数据帧中删除重复项

df.drop_duplicates()

# keep='first'保留第一次出现
df.drop_duplicates(keep='first')

# subset='列名'去重指定列
df.drop_duplicates(subset='棒号属性')

# inplace=False 删除重复项后返回副本
df.drop_duplicates(inplace=False)

# inplace=True 直接在原数据上删除重复项
df.drop_duplicates(inplace=True)

保存到excel

to_excel()

import pandas as pd  # 导入模块
 
data = { '姓名': ['赵', '钱', '孙'], '年龄': [21, 22, 13], '性别': ['男', '女', '男']}
df = pd.DataFrame(data)
df.to_excel(r'D:\xxx\demo2.xlsx',index=False)

缺省值填充 fillna()

单元格为空显示为NaN 为避免替换为空字符串

df = pd.read_excel(file)
df.fillna('', inplace=True)

或在read_excel()传参keep_default_na=False

df = pd.read_excel(file, keep_default_na=False)

作者：陈超

标签：False,Python,drop,excel,df,duplicates,pandas
From： https://www.cnblogs.com/DTCLOUD/p/17463095.html

实验六 turtle绘图与python库应用编程体验
'''task1_1.py'''fromturtleimport*defmove(x,y):penup()goto(x,y)pendown()defdraw(n,size=100):foriinrange(n):fd(size)left(360/n)defmain():pensize(2)pencolor('red&#......
【Python自学】环境搭建
一、pycharm安装二、python安装打开http://www.python.org（这个是python官网）下载配置环境。点击上方downloads下载对应版本安装后通过【win+r】调出【运行】弹窗，输入“cmd”之后打开【命令提示符】，输入python只要出现“>>>”证明你安装成功了。当你看到“>>>”的时候......
【pandas基础】--数据统计
在进行统计分析时，pandas提供了多种工具来帮助我们理解数据。pandas提供了多个聚合函数，其中包括均值、标准差、最大值、最小值等等。此外，pandas还可以进行基于列的统计分析，例如通过groupby()函数对数据进行聚合，并计算每组的统计分析结果。除了基本的统计分析之外，pandas还可以进......
【2023微博评论爬虫】用python爬上千条微博评论，突破15页限制！
您好，我是@马哥python说，一枚10年程序猿。一、爬取目标前些天我分享过一篇微博的爬虫：马哥python说：【python爬虫案例】爬取微博任意搜索关键词的结果，以“唐山打人”为例但我的学习群中的小伙伴频繁讨论微博评论的爬取，所以，我们再分享这篇微博评论的爬虫。注意区分这两个爬虫：上次......
python反射、装饰和生成器
1.反射反射允许使用变量的值（而不是变量的名）对成员进行访问反射的功能：设置属性读取属性删除属性判断属性classA:class_name="A"age=18defshow_me(self):print(class_name)attr_name="test_case_name"setattr(A,attr_name,"sex")#设置属......
Python-PyQt5安装与简单使用
一、安装1、安装PyQt5和PyQt5-toolspipinstallPyQt5-ihttps://pypi.douban.com/simplepipinstallPyQt5-tools-ihttps://pypi.douban.com/simple 安装结果查看 2、配置环境变量在系统变量Path中添加pyqt5-tools目录的绝对路径 3、安装qtdesigner......
Python如何使用函数进行字符串大小写转换?
在Python语言中，为了方便开发者对字符串中的字母进行大小写转换，为大家提供了3种函数，它们分别是title()、lower()和upper()，那么该如何使用这些函数呢?以下是详细的内容：1、title()方法title()方法用于将字符串中每个单词的首字母转为大写，其他字母全部转为小写，转换完成......
python3 获取上个月、前几月、当前月的时间
#!/usr/bin/envpython#-*-coding:utf-8-*-importcalendarfromdatetimeimportdatetimefromdateutil.relativedeltaimportrelativedelta#获取当前月defget_cur_month():returndatetime.now().strftime("%Y-%m")#获取前几个月defget_last_month(......
python超类
1.超类什么是超类：super方法调用的一系列类什么时候用到超类？如果子类需要复用父类的代码（属性，方法）时，需要通过超类实现classA:class_name="A"#类的属性def__init__(self,name,age):self.name=name#实例属性self.age=age#实例属性defsh......
python面向对象
1.类1.1引入类面向对象：所谓面向对象，就是在编程的时候尽可能的去模拟真实的现实世界，按照现实世界中的逻辑去处理问题，分析问题中参与其中的有哪些实体，这些实体应该有什么属性和方法。我们如何通过调用这些实体中的属性和方法去解决问题类：用来描述具有相同的属性和方法的对象的集......

Python pandas库操作 excel

Python pandas库操作 excel

数据读取

数据处理

获取列数据

获取多列

获取行数据

整体数据排序

数据去重

保存到excel

缺省值填充 fillna()

相关文章

赞助商

阅读排行