pandas是一个python包,它提供了快速、灵活、易用的数据结构,旨在处理“关系”或“带标签”数据既直观又高效,它是一个极强的数据分析工具。
官网:https://pandas.pydata.org/docs/
1 数据结构
Pandas主要提供了两种核心的数据结构:Series和DataFrame。
Series:
Series是一种一维的数组型对象,它包含值序列和数据标签。
每个Series对象实际上由两个数组组成:
值数组:存储数据,可以是任何NumPy数据类型。
索引数组:存储值数组中每个数据点的标签。
示例
import pandas as pd data = pd.Series([1, 3, 5, 7, 9])
DataFrame:
DataFrame是一个二维的表格型数据结构,非常类似于Excel表格或SQL数据库中的表。
它可以被看作是由多个Series组成的字典,每个Series作为DataFrame的一列。
DataFrame有两个索引:
行索引:沿着行的方向,可以通过index属性访问。
列索引:沿着列的方向,可以通过columns属性访问。
示例
data = { 'Country': ['Belgium', 'India', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasília'], 'Population': [11190846, 1303171035, 207847528] } df = pd.DataFrame(data)
标签:Series,DataFrame,索引,介绍,数组,数据结构,pandas From: https://www.cnblogs.com/zhenjingcool/p/18020686