Pandas中的dropna方法

时间：2023-02-18 17:14:10浏览次数：40

标签：1.0 NA NaN dropna data 6.5 3.0 方法 Pandas

在默认情况下，只要该行含有缺失值，dropna便会删除所有包含了缺失值的行，如下所示：

data = pd.DataFrame([[1., 6.5, 3.], [1., NA, NA], [NA, NA, NA], [NA, 6.5, 3.]])
cleaned = data.dropna()
print('data\n', data, '\n')
print('cleaned\n',cleaned)  # 默认删除包含缺失值的行

data
    0    1    2
0  1.0  6.5  3.0
1  1.0  NaN  NaN
2  NaN  NaN  NaN
3  NaN  6.5  3.0 

cleaned
    0    1    2
0  1.0  6.5  3.0

只有当传入参数how='all'时，才会删除所有值均为NA的行，如下所示：

data.dropna(how='all')

    0	1	2
0	1.0	6.5	3.0
1	1.0	NaN	NaN
3	NaN	6.5	3.0

如果要用同样的方式删除列，则传入参数axis=1，如下：

data[4] = None
data

	0	1	2	4
0	1.0	6.5	3.0	None
1	1.0	NaN	NaN	None
2	NaN	NaN	NaN	None
3	NaN	6.5	3.0	None

data.dropna(axis=1, how='all')

	0	1	2
0	1.0	6.5	3.0
1	1.0	NaN	NaN
2	NaN	NaN	NaN
3	NaN	6.5	3.0

过滤DataFrame的行的相关方法往往涉及时间序列数据。假如只想保留非缺失值的个数大于给定值的行，则可以用thresh参数来表示：

df = pd.DataFrame(np.random.randn(7, 3))
df.iloc[:4, 1] = NA
df.iloc[:2, 2] = NA
df

	0	        1	        2
0	0.717847	NaN	        NaN
1	-0.396387	NaN	        NaN
2	-0.524619	NaN	        -0.049880
3	2.068640	NaN	        0.923055
4	-0.601196	1.150763	-1.174955
5	0.277729	-1.089988	1.425802
6	0.739074	1.028694	-1.105094

df.dropna()

	0	        1	        2
4	-0.601196	1.150763	-1.174955
5	0.277729	-1.089988	1.425802
6	0.739074	1.028694	-1.105094

df.dropna(thresh=2)

	0	        1	        2
2	-0.524619	NaN	        -0.049880
3	2.068640	NaN	        0.923055
4	-0.601196	1.150763	-1.174955
5	0.277729	-1.089988	1.425802
6	0.739074	1.028694	-1.105094

标签：1.0,NA,NaN,dropna,data,6.5,3.0,方法,Pandas
From： https://www.cnblogs.com/ToryRegulus/p/17133053.html

win系统提示请插入多卷集的最后一张磁盘解决方法
整个人嘛了，今天插上U盘，跟tmd中了病毒一样，屏幕疯狂弹出窗口，提示请插入多卷集的最后一张磁盘！点确定之后他继续弹出，点取消它也继续弹出，关掉一个又弹出来一个，妈的，我......
数据类型及常用方法
引入我们学习变量是为了让计算机能够像人一样去记忆事物的某种状态，而变量的值就是用来存储事物状态的，很明显事物的状态分成不同种类的（比如人的年龄，身高，职位，工资等等），所以变......
Windows下面查看python安装路径的快捷方法
在Windows（Win10-Win11）下面，查看python的安装路径，比较快捷的方法是：打开CMD窗口，运行wherepython便可以查看python安装路径，不同机器不一样：C:\Users\WinUser01\AppData\Loca......
Java基础知识点（方法）
1.方法是程序中最小的执行单元。2.作用：能够提高代码的复用性，提高代码的可维护性（好处）重复代码、具有独立功能的代码可以抽取到方法中。3.方法的定义：把一些代码打包在一起。方......
Quartus II 8.0在实际上板时无法连接USB-Blaster的解决方法
最新修改日期：2023/02/18软件：QuartusII8.0电脑系统：Win10/Win11电路板连接方式：USB-Blaster线实际上板时会提示没有USB-Blaster接上，安装驱动也不行。究其原因，是JTAGs......
Jenkins Pipeline Basic Steps插件之readFile和writeFile方法
前言本篇继续学习PipelineBasicSteps插件的两个方法–readFile(读取文件)和writeFile(写入文件)readFile参数file：工作区中的文件路径encoding：读取文件时使用的编码。如果......
MyBatis-plus 无法获取自增 id 的处理方法（从DB字段设计层面解决问题）
产生情景：①DB层面：login表字段设置：login_id，nickname，password，user_iduser表字段设置：user_id，realname，sex②代码层面：严格遵循格式设......
WEB开发中的页面跳转方法总结
页面跳转可能是由于用户单击链接、按钮等触发的，也可能是系统自动产生的。页面自动跳转在WEB开发中经常用到，而且根据需求可以采用不同的跳转方式，比如提示操作信息后延时跳转......
获取图片颜色方法或者图片区域像素点颜色初稿
......
PHP截取指定2个字符之间字符串的方法
<?phpfunctiongetNeedBetween($kw1,$mark1,$mark2){$kw=$kw1;$kw='123′.$kw.'123′;$st=stripos($kw,$mark1);$ed=stripos($kw,$mark2);if(($st==false||$ed==false)||$......

Pandas中的dropna方法

相关文章

赞助商

阅读排行