首页 > 其他分享 >【1.0】Pandos初识

【1.0】Pandos初识

时间:2023-09-24 17:03:32浏览次数:60  
标签:数据分析 1.0 Python DataFrame 初识 Pandos 数据结构 安装 Pandas

【一】Pandas是什么

  • Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析“三剑客之一”的盛名(NumPy、Matplotlib、Pandas)。
  • Pandas 已经成为 Python 数据分析的必备高级工具,它的目标是成为强大、灵活、可以支持任何编程语言的数据分析工具。
  • Pandas 这个名字来源于面板数据(Panel Data)与数据分析(data analysis)这两个名词的组合。
  • 在经济学中,Panel Data 是一个关于多维数据集的术语。
  • Pandas 最初被应用于金融量化交易领域,现在它的应用领域更加广泛,涵盖了农业、工业、交通等许多行业。
  • Pandas 最初由 Wes McKinney(韦斯·麦金尼)于 2008 年开发,并于 2009 年实现开源。
  • 目前,Pandas 由 PyData 团队进行日常的开发和维护工作。
  • 在 2020 年 12 月,PyData 团队公布了最新的 Pandas 1.20 版本 。
  • 在 Pandas 没有出现之前,Python 在数据分析任务中主要承担着数据采集和数据预处理的工作,但是这对数据分析的支持十分有限,并不能突出 Python 简单、易上手的特点。
  • Pandas 的出现使得 Python 做数据分析的能力得到了大幅度提升,它主要实现了数据分析的五个重要环节:
    • 加载数据
    • 整理数据
    • 操作数据
    • 构建数据模型
    • 分析数据

【二】Pandas主要特点

  • 它提供了一个简单、高效、带有默认标签(也可以自定义标签)的 DataFrame 对象。
  • 能够快速得从不同格式的文件中加载数据(比如 Excel、CSV 、SQL文件),然后将其转换为可处理的对象;
  • 能够按数据的行、列标签进行分组,并对分组后的对象执行聚合和转换操作;
  • 能够很方便地实现数据归一化操作和缺失值处理;
  • 能够很方便地对 DataFrame 的数据列进行增加、修改或者删除的操作;
  • 能够处理不同格式的数据集,比如矩阵数据、异构数据表、时间序列等;
  • 提供了多种处理数据集的方式,比如构建子集、切片、过滤、分组以及重新排序等。

【三】Pandas主要优势

  • 与其它语言的数据分析包相比,Pandas 具有以下优势:
  • Pandas 的 DataFrame 和 Series 构建了适用于数据分析的存储结构;
  • Pandas 简洁的 API 能够让你专注于代码的核心层面;
  • Pandas 实现了与其他库的集成,比如 Scipy、scikit-learn 和 Matplotlib;
  • Pandas 官方网站(点击访问)提供了完善资料支持,及其良好的社区环境。

【四】Pandas内置数据结构

  • 我们知道,构建和处理二维、多维数组是一项繁琐的任务。
  • Pandas 为解决这一问题, 在 ndarray 数组(NumPy 中的数组)的基础上构建出了两种不同的数据结构,分别是 Series(一维数据结构)DataFrame(二维数据结构):
    • Series 是带标签的一维数组,这里的标签可以理解为索引,但这个索引并不局限于整数,它也可以是字符类型,比如 a、b、c 等;
    • DataFrame 是一种表格型数据结构,它既有行标签,又有列标签。
数据结构 维度 说明
Series 1 该结构能够存储各种数据类型,比如字符数、整数、浮点数、Python 对象等,Series 用 name 和 index 属性来描述 数据值。Series 是一维数据结构,因此其维数不可以改变。
DataFrame 2 DataFrame 是一种二维表格型数据的结构,既有行索引,也有列索引。行索引是 index,列索引是 columns。 在创建该结构时,可以指定相应的索引值。

【五】Pandas库下载和安装

  • Python 官方标准发行版并没有自带 Pandas 库,因此需要另行安装。

  • 除了标准发行版外,还有一些第三方机构发布的 Python 免费发行版, 它们在官方版本的基础上开发而来,并有针对性的提前安装了一些 Python 模块,从而满足某些特定领域的需求,比如专门适应于科学计算领域的 Anaconda,它就提前安装了多款适用于科学计算的软件包。

  • 对于第三方发行版而言,它们已经自带 Pandas 库,所以无须另行安装。

  • 下面介绍了常用的免费发行版:

【六】不同操作系统安装 Pandas 的方法

【1】Windows系统安装

  • 使用 pip 包管理器安装 Pandas,是最简单的一种安装方式。
  • 在 CMD 命令提示符界面行执行以下命令:
pip install pandas

【2】Linux系统安装

  • 对于不同的版本的 Linux 系统,您可以采用它们各自的包管理器来安装 Pandas。

(1)Ubuntu用户

  • Pandas 通常需要与其他软件包一起使用,因此可采用以下命令,一次性安装所有包:
sudo apt-get install numpy scipy matplotlib pandas

(2)Fedora用户

  • 对于 Fedora 用户而言,可采用以下命令安装:
sudo yum install numpy scipy matplotlib pandas

【3】MacOSX系统安装

  • 对于 Mac 用户而言,同样可以直接使用 pip 包管理器来安装,命令如下:
pip install pandas

标签:数据分析,1.0,Python,DataFrame,初识,Pandos,数据结构,安装,Pandas
From: https://www.cnblogs.com/dream-ze/p/17726186.html

相关文章

  • Android Failed to resolve: com.github.PhilJay:MPAndroidChart:v3.1.0
    2022.3.1版本修改settings.gradledependencyResolutionManagement{repositoriesMode.set(RepositoriesMode.FAIL_ON_PROJECT_REPOS)repositories{maven{url"https://jitpack.io"}//Addthisrepositoryjcenter()//orotherrep......
  • 问题:Opencv(3.1.0/3.4)找不到 /opencv2/gpu/gpu.hpp 问题
    解决:Opencv(3.1.0/3.4/4.1.0)找不到/opencv2/gpu/gpu.hpp问题环境:系统:Win10环境:Opencv3.4.0/4.1.0显卡:1080ti问题Windows下使用opencv3.4.0/4.1.0调用包含GPU模块函数getCudaEnabledDeviceCount()的示例时提示找不到/opencv2/gpu/gpu.hpp。解决方式替换代码中引用的”......
  • 初识结构体
    前言......
  • 南方cass软件下载-南方cass7.0/9.0/11.0中文版 各个版本下载
    南方CASS9.1是款非常专业的cad图形设计软件,它是在cad的基础上二次开发的,cass必须配合cad软件才能够使用,功能非常强大,界面简洁明晰、操作方便快捷。南方CASS9.0能完美的兼容AutoCAD2000、AutoCAD2004、AutoCAD2005、AutoCAD2006以及AutoCAD2010等等的加载,全新的属性面板,更精准的查......
  • 初识Java
    前言Java语言是一种广泛使用的面向对象编程语言,它具有简单、面向对象、分布式、解释执行、健壮安全等特点。Java语言可以在不同的平台上编写一次,然后在其他平台上运行。在这篇文章中,我们将对Java编程进行初步探讨。摘要Java是一种跨平台的编程语言,可以在不同的操作系统上运行。......
  • Linux学习笔记与个人理解(第一章初识Linux)
     1.云计算的简介1.1云计算的定义云计算是一种基于互联网的计算模式,通过网络提供可按需访问的共享计算资源和服务,包括计算能力、存储空间和应用程序等。1.2云计算的特点弹性伸缩:根据需求动态调整计算资源的规模,实现快速扩展或缩减。资源共享:多个用户共享云计算平......
  • hbase初识
    一、HBase是一个分布式的、面向列的开源数据库。一个结构化数据的分布式存储系统”。HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而......
  • 控制台游戏1.0
    `includeincludeincludeusingnamespacestd;classGame{public:Game(){this->energy=this->energy2=0;this->HP=this->HP2=100;this->round=1;}voidstart(){cout<<"Welcometomagicfight!"<<endl;st......
  • gitbook初识
    前言需求是内部想部署一个帮助文档功能,参考页面。第一印象跟chm搞混了,chm是文件形式的帮助文档,可以传输,即使达成了chm编辑和发布最终也是以html或其它web页面的形式展示和维护。度娘搜索到一个同类项目列表连接地址。如博主介绍同类项目很多,没有精力全部试一遍,其中gitgook有......
  • 【JavaScript保姆级教程】输出函数和初识变量
    @TOC前言JavaScript是一种强大的脚本语言,广泛应用于网页开发和应用程序编写。本文将全面介绍JavaScript中输出内容的方法,包括使用document.write()函数、调试工具如console.log()和对话框函数如alert(),以及变量的声明和赋值。此外,我们还将探索输入提示框prompt()函数的使用方法。深......