数据预处理

数据预处理

时间：2022-09-01 23:35:30浏览次数：75

标签：df demo 缺失 isnull print 数据预处理 def

data.xlsx 数据如下

1 # -*- coding: utf-8 -*-
 2 # 我们必须进行数据预处理 它直接关系到分析结果的准确性 处理缺失值 数据重复值
 3 # 检查缺失值  检测缺失值最简单的方法就是调用info()方法 通过观察每一列的非空值 即可判断出哪些列存在缺失值
 4 # any() 一个序列中有一个True，则返回True。否则返回False
 5 import pandas as pd
 6 
 7 df = pd.read_excel('file/data.xlsx')
 8 
 9 
10 # 还有一种检测是否存在缺失值的方法 既isnull()方法搭配any()方法
11 def isnull_demo():
12     print(df)
13     print(df.isnull())
14 
15 
16 # isnull() 对于缺失值 返回True；对于非缺失值，返回False
17 def isnull_demo_any():
18     print(df.isnull().any())
19 
20 
21 # 检测重复数据 duplicated()方法 作用：可以检测重复值
22 def duplicated_demo():
23     print(df.duplicated())
24     print(df.duplicated().any())
25 
26 
27 # 缺失值处理 在python中 通常使用NaN表示缺失值  可以用pandas模块中的fillna()方法来填充数据
28 # 可以用dropna()方法来删除缺失值
29 def fillna_demo():
30     df1 = df.fillna({'数学': 0})
31     df2 = df.dropna()
32     print(df1)
33     print(df2)
34 
35 
36 # drop_duplicates()方法来删除重复数据
37 def drop_duplicates_demo():
38     df1 = df.fillna({'数学': 0})
39     df2 = df.drop_duplicates()
40     print(df1)
41     print(df2)
42 
43 
44 # 数据替换 replace()方法 实现数据替换 例如replace(A, B) 表示将A替换为B
45 def replace_demo():
46     df['数学'] = df['数学'].replace(0, 150)
47     print(df)
48 
49 
50 # isnull_demo()
51 # isnull_demo_any()
52 # duplicated_demo()
53 # fillna_demo()
54 # drop_duplicates_demo()
55 replace_demo()

标签：df,demo,缺失,isnull,print,数据,预处理,def
From： https://www.cnblogs.com/zhaoyiguang/p/16648225.html

Oracle数据库expdp用法
copy自：Oracle数据库expdp用法以及注意事项一、导出注意事项检查数据库版本（用于决定导出时生成为哪个版本的dmp头文件）selectversionfromv$instance;也可以用sqlplus......
最新小红书数据小红书爬虫小红书接口 xhs 小红书算法小红书api
最新版小红书APP接口，需要交流的朋友联系，少量勿扰，谢谢！只取APP公开数据，不做违法事情，如有侵犯贵公司，请联系删除！博主详情笔记详情博主笔记列表笔记评论关键词搜索等等接......
Grafana安装配置和简单图标实现（使用MySQL数据源）
grafana介绍Grafana是一个开源的度量分析与可视化套件，纯JavaScript开发的前端工具，通过访问库（如InfluxDB），展示自定义报表、显示图表等。它的UI十分灵活，有丰富的插件和模板，功......
数据库学习笔记（本数据库学习笔记以SQL sever 2019 为例进行学习） 20220831 第四节课
两层映像两层映像E-CMapping:ExternalSchema-ConceptualSchemaMapping----将外模式映射为概念模式，从而支持实现数据概念视图向外部视图的转换----便于用户观察和......
06.通过意图传递数据
4、向下一个活动传递数据之前我们只是简单地使用Intent来启动一个活动，其实Intent还可以在启动活动的时候传递数据的。在启动活动时传递数据的思路很简单，Intent中提供了一......
c++常量引用容易踩的坑，修改数据不同步
正常情况下被引用的对象改变，常量引用的值也跟着改变。i和j是同一个对象，所以是同步的：inti=42;constint&j=i;i=43;cout<<j<<endl;cout<<i<<endl;//......
pytest数据驱动应用-excel测试用例数据读取封装
接口测试数据存放excel、json、yaml、数据库实例：注册功能参数变量名类型说明是否必填手机号mobile_phoneint新用户的手机号是密码pwdstring8-1......
python带你采集桌游、剧本杀游戏店数据信息~
前言嗨喽~大家好呀，这里是魔王呐!又是学习的一天，让我们开始叭~环境使用:Python3.8Pycharm模块使用:requests>>>pipinstallrequestsrecsv如......
基于ANUSPLIN的气象数据插值
这篇文章是对ANUSPLIN这个插值工具进行简单的介绍，项目demo可以参考：https://github.com/leeyang1991/ANUSPLIN这个项目已经把从数据转换到脚本运行等一系列工作都用python......
mysql 储存过程如何使用递归循环来实现sql数据恢复
CREATEPROCEDURE`relation_update`(inePIDvarchar(100),indeptidint)BEGINDECLAREtuivarchar(100);declarectint;declareiint;DECLAREcur1CURSORFORselect......

相关文章

赞助商

阅读排行