pandas库中series数据结构的常用方法

时间：2023-01-02 16:25:15浏览次数：39

标签：Series 1.2 series s1 库中 dtype pandas

文章初衷

series，又称序列。是pandas库中的一种常用数据结构。为了提高工作效率，笔者总结了该数据结构的一些常用使用方法，尽量使读者只需看本篇文章即可无障碍掌握这个叫series的数据结构的用法。

案例引入包

import numpy as np
import pandas as pd

pandas.core.series.Series的代码组成

pd.Series(data,index,dtype,name)

data：数据可以为list()、np.array()、dict()。

index：索引，其长度必须与数据长度相同。

dtype：数据类型。

name：pandas.Series这个数据结构的名称。

pandas.core.series.Series的常用创建方式

方式1

s1 = pd.Series([1.2, 3.2, 1.2, 2.4, 3.3])

0    1.2
1    3.2
2    1.2
3    2.0
4    4.0
5    3.3
dtype: float64

方式2

s2 = pd.Series([1.2, 3.2, 1.2, 2.4, 3.3], index=['a', 'b', 'c', 'd', 'e'], name='series2')

a    1.2
b    3.2
c    1.2
d    2.4
e    3.3
Name: series2, dtype: float64

方式3

s3 = pd.Series(np.array([1.2, 3.2, 1.2, 2.4, 3.3]), index=['a', 'b', 'c', 'd', 'e'])

a    1.2
b    3.2
c    1.2
d    2.4
e    3.3
dtype: float64

方式4

s4 = pd.Series({'北京': 12, '大连': 23, '四川': 22})

北京    12
大连    23
四川    22
dtype: int64

方式...

pandas.core.series.Series结构中获取全部值

s1.values

返回的是一个numpy array

array([1.2, 3.2, 1.2, 2.4, 3.3])

pandas.core.series.Series结构中获取全部索引

返回类型：pandas.core.indexes.range.RangeIndex
左闭右开

s1.index

RangeIndex(start=0, stop=5, step=1)

返回类型：list()

s1.index.tolist()

[0, 1, 2, 3, 4]

返回类型：pandas.core.indexes.base.Index

s4.index

Index(['北京', '大连', '四川'], dtype='object')

返回类型：list()

s4.index.tolist()

['北京', '大连', '四川']

pandas.core.series.Series结构中各种信息的获取

获取数据类型

s1.dtype

dtype('float64')

获取维度

s1.ndim

获取形状

s1.shape

(5,)

获取元素个数

s1.size

获取总结信息

s1.info

<bound method Series.info of 0    1.2
1    3.2
2    1.2
3    2.4
4    3.3
dtype: float64>

s1.info()

<class 'pandas.core.series.Series'>
RangeIndex: 5 entries, 0 to 4
Series name: None
Non-Null Count  Dtype  
--------------  -----  
5 non-null      float64
dtypes: float64(1)
memory usage: 168.0 bytes

pandas.core.series.Series结构的切片

对于index为排序数字的，左闭右开。

s1[0:3]

0    1.2
1    3.2
2    1.2
dtype: float64

对于index为非排序数字的，左闭右闭。

s4['北京':'大连']

北京    12
大连    23
dtype: int64

标签：Series,1.2,series,s1,库中,dtype,pandas
From： https://www.cnblogs.com/cloucodeforfun/p/17019836.html

数据分析之Pandas分组操作总结
Datawhale干货作者：耿远昊，Datawhale成员Pandas做分析数据，可以分为索引、分组、变形及合并四种操作。之前介绍过索引操作，现在接着对Pandas中的分组操作进行介绍：主......
学习用Pandas处理分类数据！
Datawhale干货作者：耿远昊，Datawhale成员，华东师范大学分类数据(categoricaldata)是按照现象的某种属性对其进行分类或分组而得到的反映事物类型的数据，又称定类数据。直白......
Pandas 空值数据的索引位置行号
前言Pandas中的空值是非常多的，这体现了数据搜集的一个不可避免的方面。由于某些不可抗力的原因，例如用户授权，数据源数据格式的不同，会造成许多空值零散的遍布在数据中的各个......
QLineSeries和 QBarSeries的用法
#include<QtWidgets/QApplication>#include<QtWidgets/QMainWindow>#include<QtCharts/QChartView>#include<QtCharts/QBarSeries>#include<QtCharts/QBarSet>#include......
3.1 series介绍
pandas简介pandas是一个强大的Python数据分析的工具包，是基于NmPy构建的。pandas的主要功能具备对其功能的数据结构Dataframe,Series集成时间序列功能提供丰富的数......
pandas - 入门
pandas所包含的数据结构和数据处理工具的设计是的在Python中进行数据清洗和分析非常快捷。panads经常是和其他数值计算工具，比如NumPy和SciPy，以及数据可视化工具比如m......
python manage.py loaddata dumpdata 用于导出和导入数据库中的数据
1.数据导出python manage.py dumpdata pythonmanage.pydumpdata[appname]>appname_data.json 指定appnamde导出指定app的数据(比如appname为cmdb)......
三个条件至少满足两个的 pandas
背景女孩子相亲提出三个条件只要男孩复合两个以上才能见面数据张三：'帅气','阳光','活泼','酷炫李四：'帅气','阳光','活泼'王五：'帅气','阳光','猥琐','......
Pandas处理大数据的性能优化技巧
Pandas是Python中最著名的数据分析工具。在处理数据集时，每个人都会使用到它。但是随着数据大小的增加，执行某些操作的某些方法会比其他方法花费更长的时间。所以了解和使用......
用Java开发出网站，在其中输入中文，但是保存到MySQL数据库中却是？？？？
前言：前两部分是从mysql和eclipse的角度去解决，在解决的过程中学到了之前没设计到的查看和修改数据库或数据表的字符集的知识。后一部分是掌握了前两步后，进行的新一轮解决问题......