首页 > 其他分享 >Pandas库学习笔记(2)

Pandas库学习笔记(2)

时间:2024-02-03 15:01:17浏览次数:28  
标签:Series 数据类型 DataFrame 学习 笔记 数据结构 数据 Pandas

Pandas 数据结构

Pandas 有三种常用的数据结构

  • Series
  • DataFrame
  • Panel

这些数据结构建立在Numpy数组之上,这意味着它们运行速度都非常快。

Python、Numpy和Pandas对比

Python
  • list:Python自带数据类型,主要用一维,功能简单,效率低
  • Dict:Python自带数据类型,多维键值对,效率低
Numpy
  • ndarray:Numpy基础数据类型,单一数据类型
  • 关注数据结构/运算/维度(数据间关系)
Pandas
  • Series:1维,类似带索引的1维ndarray
  • DataFrame:2维,表格型数据类型,类似带行/列索引的2维ndarray 关注数据与索引的关系(数据实际应用)

从实用性、功能强弱和和可操作性比较:list < ndarray < Series/DataFrame

数据规整和分析工作中,ndarry数组作为必要补充,大部分数据尽量使用Pandas数据类型

考虑这些数据结构的最佳方法是高维数据结构是其低维数据结构的容器。例如,DataFrame是Series的容器,Panel是DataFrame的容器。

数据结构 维度 说明
Series 1 用于存储一个序列的一维数据
Data Frames 2 DataFrame作为更复杂的数据结构,则用于存储多维数据
Panel 3 通用的3D标签,大小可变的数组。

建立和处理二维数组是一项繁琐的工作,在编写函数时,要由用户来考虑数据集的方向。但是使用Pandas数据结构可以减少用户的精力。
例如,对于表格数据(DataFrame),在语义上考虑索引(行)和列比在轴0和轴1上更有帮助。

变异性

所有Pandas数据结构都是值可变的(可以更改),除了Series以外,其他大小都是可变的。系列是大小不变的。

注 -DataFrame被广泛使用,是最重要的数据结构之一。Panel面板使用少得多。

Series

Series是具有均匀数据的一维数组状结构。例如,以下系列是整数10、23、56的集合...

10 23 56 17 52 61 73 90 26 72

Series是具有均匀数据的一维数组状结构。例如,以下系列是整数10、23、56的集合...

 关键点

  • 同类数据
  • 大小不变
  • 数据可变值

Data Frames

DataFrame是具有异构数据的二维数组。例如,

Name Age Gender Rating
Steve 32 Male 3.45
Lia 28 Female 4.6
Vin 45 Male 3.9
Katie 38 Female 2.78

上表代表组织的销售团队的数据及其总体绩效等级,数据以行和列表示,每列代表一个属性,每行代表一个人。

列的数据类型

Column Type
Name String
Age Integer
Gender String
Rating Float
关键点
  • 异构数据
  • 大小不变
  • 数据可变

 

Panel

Panel是具有异构数据的三维数据结构。很难用图形表示面板。但是面板可以说明为DataFrame的容器。

关键点
  • 异构数据
  • 大小可变
  • 数据可变

 

 

标签:Series,数据类型,DataFrame,学习,笔记,数据结构,数据,Pandas
From: https://www.cnblogs.com/WG11/p/18004781

相关文章

  • 云原生学习第2天笔记
    云原生定义云原生(CloudNative)是指基于云环境、可扩展、可靠的应用程序,它利用容器、微服务、自动化部署、弹性伸缩等特性,使应用程序能够快速、可靠地运行在云环境中。云原生优势云原生应用程序具有以下优势:快速部署:通过容器化技术,实现应用程序的快速打包和部署,减少部署时间。可扩展......
  • 2024年2月笔记:Redis7.2.4版本在Mac电脑的Docker里安装Redis集群
    本文环境:Mac电脑,Brew和Docker都已安装好,Redis版本:7.2.4第1步,验证Docker和Brewdocker--version  //查看docker版本,此处忽略安装Docker步骤brew--version   //查看版本号第2步,创建Redis集群网络dockernetworkcreateredis-cluster-net   //创建一个名......
  • 国产深度学习框架 OneFlow 是否靠谱?
    OneFlow框架的设计目标是实现:一个使用多机多卡就像使用单机单卡一样容易的深度学习框架。相关:如何评价最近一流科技开源的深度学习框架OneFlow?王慧文收购国产AI框架OneFlow,为中国版ChatGPT疯狂抢人抢基建......
  • 袁老师大师课笔记
    浏览器是如何工作的?浏览器是一个复杂的软件,其主要功能是获取并展示互联网上的信息。以下是浏览器的基本工作流程:用户输入URL:用户在浏览器的地址栏中输入一个网址,也就是URL(UniformResourceLocator,统一资源定位符)。DNS查询:浏览器通过DNS(DomainNameSystem,域名系统)查询将输入......
  • 番茄工作法学习总结
    番茄工作法学习总结今天阅读了《番茄工作法图解》电子书,再结合前两周我对番茄工作法的应用,以此,我总结一下自己对番茄工作法的认识。首先看一下我画的一张简图:番茄工作法的由来:番茄工作法(ThePomodoroTechnique)由ByFrancescoCirillo弗朗切斯科●奇立罗著,大学一年级的一次......
  • (坚持每天写算法)算法学习与复习part1基础算法1-13——位运算
    最近确实有在写算法,在写dp,之前学的时候不全,被计数,树型等dp折磨了一下。位运算是将重点放在数字的位上,通常作为辅助行动,比如状态dp,有的时候是为了节省时空复杂度而使用的。这是今天的题目: 位运算应用的情况除了上面讲的,还有单纯的位问题,上面的题目就是一个例......
  • 狂神说Java Web学习笔记_JSP
    什么是JSPJSP(JavaServerPages):Java服务器端页面,和Servlet一样,用于动态web技术!写JSP就像在写HTML。它们之间不同的是,JSP页面里可以嵌入Java代码,提供动态数据。JSP原理IDEA使用tomcat服务器,会在tomcat中产生一个work目录;C:\Users\winner\AppData\Local\JetBrains\IntelliJId......
  • 2.3学习进度
    常用api用法   agg:groupdata对象的api,作用是在里面可以写多个聚合   alias:column对象的api,可以针对一个列进行改名   withcolumnrenamed:dataframe的api,可以对df中的列进行改名,一次改一个列,改多个列,可以链式调用7.sparksql数据清洗api   去重方法:dropduplication......
  • 动态规划做题笔记
    目录线性动态规划[NOIP1999提高组]导弹拦截尼克的任务双子序列最大和Flowers区间动态规划石子合并线性动态规划[NOIP1999提高组]导弹拦截第一问求最长不上升子序列,第二问可以考虑贪心,从左到右依次枚举每个导弹。假设现在有若干个导弹拦截系统可以拦截它,那么我们肯定选择......
  • 狂神说Java Web学习笔记_Cookie&Session
    Cookie,Session保存会话的两种技术,Cookie(客户端技术),Session(服务端技术)Cookie服务器端设置token,从客户端获取tokenCookie[]cookies=req.getCookies();//从客户端获取cookiecookie.getName();//获取cookie名字cookie.getValue();//获取cookie值Cookiecookie=newCoo......