首页 > 其他分享 >pandas的常用功能(时常更新)

pandas的常用功能(时常更新)

时间:2023-02-13 10:23:10浏览次数:42  
标签:00 01 series 30S 更新 2000 时常 Freq pandas

经常需要对数据进行清洗,所以总结一些好用的命令

1、将参数转变为数字型数据(例如:字符串形式的‘123’,转变成数字型的123)

pd.to_numeric(data,errors='ignore')

errors有三个值:
raise--无效解析引发异常(默认)
corece--将无效解析设置为NAN
ignore--无效的解析返回原数据

这个功能也可以将bigdecimal的数据转变成float数据

2、重采样

 resample()(pandas对象都会有这个方法)

>>> index = pd.date_range('1/1/2000', periods=9, freq='T')
>>> series = pd.Series(range(9), index=index)
>>> series
2000-01-01 00:00:00  0
2000-01-01 00:01:00  1
2000-01-01 00:02:00  2
2000-01-01 00:03:00  3
2000-01-01 00:04:00  4
2000-01-01 00:05:00  5
2000-01-01 00:06:00  6
2000-01-01 00:07:00  7
2000-01-01 00:08:00  8
Freq: T, dtype: int64
降低采样频率为三分钟 
>>> series.resample('3T').sum() 2000-01-01 00:00:00 3 2000-01-01 00:03:00 12 2000-01-01 00:06:00 21 Freq: 3T, dtype: int64
降低采样频率为三分钟,但是每个标签使用right来代替left。请注意,bucket中值的用作标签。
>>> series.resample('3T', label='right').sum()
2000-01-01 00:03:00   3
2000-01-01 00:06:00  12
2000-01-01 00:09:00  21
Freq: 3T, dtype: int64
降低采样频率为三分钟,但是关闭right区间。 
>>> series.resample('3T', label='right', closed='right').sum()
2000-01-01 00:00:00   0
2000-01-01 00:03:00   6
2000-01-01 00:06:00  15
2000-01-01 00:09:00  15
Freq: 3T, dtype: int64
增加采样频率到30秒
>>> series.resample('30S').asfreq()[0:5] #select first 5 rows
2000-01-01 00:00:00   0
2000-01-01 00:00:30  NaN
2000-01-01 00:01:00   1
2000-01-01 00:01:30  NaN
2000-01-01 00:02:00   2
Freq: 30S, dtype: float64
增加采样频率到30S,使用pad方法填充nan值。
>>> series.resample('30S').pad()[0:5]
2000-01-01 00:00:00  0
2000-01-01 00:00:30  0
2000-01-01 00:01:00  1
2000-01-01 00:01:30  1
2000-01-01 00:02:00  2
Freq: 30S, dtype: int64
增加采样频率到30S,使用bfill方法填充nan值。 
>>> series.resample('30S').bfill()[0:5]
2000-01-01 00:00:00  0
2000-01-01 00:00:30  1
2000-01-01 00:01:00  1
2000-01-01 00:01:30  2
2000-01-01 00:02:00  2
Freq: 30S, dtype: int64

3、

标签:00,01,series,30S,更新,2000,时常,Freq,pandas
From: https://www.cnblogs.com/lixiaobin123/p/15745101.html

相关文章

  • 高级前端二面vue面试题(持续更新中)
    action与mutation的区别mutation是同步更新,$watch严格模式下会报错action是异步操作,可以获取数据后调用mutation提交最终数据MVVM的优缺点?优点:分离......
  • linux 下 dynv6 更新 ddns 域名对应ip
    基本原理:1.通过某些网站提供的api返回公网ip2.与本地文件记录的上次ip对照,如果相同,结束;如果不同使用 dynv6提供的api进行更新3.将上述逻辑写成脚本,利用......
  • Laravel — P45:控制器编辑/更新 (CMP)
    在我们完整地结束这个项目之前,我们还有几篇文章要讲。之后我们将继续讨论更高级的主题。在本文中,我们将解决如何编辑记录。我们需要显示一个表单,其中已经为特定记录填充了所......
  • Efinity更新版本可能遇到的问题
    今天用新版本2022.2打开2022.1版本的工程进行编译,结果出现以下错误。    Efinity用新版本的软件打开老工程时,可能会出现编译不能通过的情况,并且打不开interface......
  • Docker consul的容器服务更新与发现
    一、Consul概述(1)什么是服务注册与发现服务注册与发现是微服务架构中不可或缺的重要组件。起初服务都是单节点的,不保障高可用性,也不考虑服务的压力承载,服务之间调用单纯的......
  • WPF简单自动更新(升级)程序+服务端
    工作逻辑是用户启动主程序,主程序启动更新程序,更新程序立刻检查是否有已经下载好的更新包,如果有则立刻关闭主程序进行更新,如果没有则访问服务器查询更新包,并在后台静默下载,......
  • Arthas,热更新线上代码神器
    大家好,我是小悟前言日常开发过程中,可能会遇到小问题,本地代码改完后,总得重新打包部署,线上代码才会生效,这样太麻烦了,这个时候就可以考虑使用Arthas(阿尔萨斯)工具来热更新线上代......
  • 公告栏(长期更新和关注)
    关于我在我值得被大家认识之前,不会告诉大家我是谁。关于更新更新频率不定。如果希望我更新可以催我,但是不保证有效果。如果有重要的事情我没看到,可以到这篇下面评论。谢......
  • Go 1.20更新了那些内容
    PGO的引入Go1.20发布了配置文件引导优化(PGO)的预览版,使编译器能够根据运行时配置文件信息,执行应用程序和工作负载的特定性优化。提供要构建的配置文件,使编译器能够将应用......
  • sqlalchemy+pandas:错误 'OptionEngine' object has no attribute 'execute','str&
    场景:使用 sqlalchemy+pandas1.  'OptionEngine'objecthasnoattribute'execute'importpandasaspdfromsqlalchemyimportcreate_engine,textengine=c......