一、pandas简介

pandas是基于NumPy构建的一个强大的Python数据分析的工具包。

主要功能：

具备对其功能的数据结构：DataFrame、Series
集成时间序列功能
提供丰富的数学运算和操作
灵活处理缺失数据

安装方法

pip install pandas

二、pandas.Series

Series是一种类似于一维数组的对象，由一组数据和一组与之相关的数据索引组成。
Series比较像列表 (数组)和字典的结合体

2.1 Series创建方式

import pandas as pd

# 当传入值为列表时，数据索引从0开始自增
sr = pd.Series(["张三", "李四", "王五"])
print(sr)

# 当传入值为字典时，数据索引为key
sr = pd.Series({'a': "张三", 'b': "李四"})
print(sr)

执行结果

2.2 Series特性

算数运算: sr*2、sr1+sr2。pandas在运算时，会按索引进行对齐然后计算。如果存在不同的索引，则结果的索引是两个操作数索引的并集。
字典方式取值: sr[0], sr[[1,2,4]]
切片取值: sr[0:2]
比较运算取值: sr[sr>0]

import pandas as pd

# 当传入值为列表时，标签索引从0开始自增
sr = pd.Series(["张三", "李四", "王五", 5])
sr1 = pd.Series({0: "三", "b": "四", "c": "五"})


# 支持算数运算
print("==== 基础运算 ====")
print(sr * 2)
# 两个sr运算时，只有索引值相同的数据才会进行计算，不相同部分结果为NaN
print(sr + sr1)


# 取值
print("==== 传入单个数据索引取值，返回值类型为提取值的类型 ====")
print(sr.get(1))
print(sr1["b"])

print("==== 传入列表类型的数据索引取值，返回的类型仍为Series ====")
print(sr.get([0, 2]))
print(sr1[['b', 'c']])

print("==== 切片取值,返回的类型仍为Series ====")
print(sr1[:2])

print("==== 比较运算取值 ====")
print(sr["张三" == sr])
sr3 = pd.Series(range(10))
print(sr3[sr3 > 6])

2.3 常用方法

2.3.1 values和index

index:获取数据索引列表

values：获取数据列表

import pandas as pd

# 当传入值为列表时，标签索引从0开始自增
sr = pd.Series(["张三", "李四", "王五"])

# 获取索引列表
print(sr.index)
print(sr.index[-1])

# 获取数据列表
print(sr.values)

执行结果

2.3.2 loc和iloc

loc：通过数据索引值获取值

iloc：通过数据下标获取值

import pandas as pd

sr = pd.Series({"a": "一", "b": "二", "c": "三", "d": "四"})

# loc：通过数据索引值获取值
print(sr.loc[["b", "d"]]

# iloc：通过数据下标获取值
print(sr.iloc[1:])

执行结果

2.4 缺失数据（NaN）处理

去除NaN：dropna()
填充NaN：fillna(填充值)

import pandas as pd

sr1 = pd.Series([1, 3, 4])
sr2 = pd.Series([5, 5, 6, 7, 8])

sr = sr1 + sr2
print(sr)

# 去除NaN：dropna()
print(sr.dropna())

# 填充NaN：fillna(v)
print(sr.fillna(0))

DataFrame

DataFrame是一种表格型的数据结构，是一组有序的Series列。
DataFrame可以看做是由Series组成的字典。

标签：数据分析,Python,Series,索引,pd,sr,print,pandas
From： https://www.cnblogs.com/testlearn/p/16859452.html

【视频】CNN（卷积神经网络）模型以及R语言实现回归数据分析|附代码数据
全文链接：http://tecdat.cn/?p=18149无人驾驶汽车最早可以追溯到1989年。神经网络已经存在很长时间了，那么近年来引发人工智能和深度学习热潮的原因是什么呢？（点击文末“阅读......
Python中利用长短期记忆模型LSTM进行时间序列预测分析 - 预测电力负荷数据|附代码数据
原文链接：http://tecdat.cn/?p=6663此示例中，神经网络用于使用2011年4月至2013年2月期间的数据预测公民办公室的电力消耗（点击文末“阅读原文”获取完整代码数据）。每日数......
利用Python的turtle库来画爱心
注明：本文转载原文链接： python下载turtle库,在windows终端输入pipinstallturtle下载好之后，就可以利用这个库来画一个简单的爱心这里附上代码fr......
python头注释
写在python脚本第一行的用#号开头表示的信息就是头注释（不是必须的）#coding:utf-8头注释的作用头注释并不是为代码而服务，更多是被系统或解释器所调用1.我的python解释器......
python 导出到excel ，打开excel有错误
python导出到excel，打开excel有错误，错误的提示为：发现“***”中的部分内容问题，是否让我们尽量尝试修复？如果您信任此工作簿的源，请单击“是”。解决办法为：#writer.save()wri......
python之configparser解析ini文件
login.ini文件内容如下[data1]username=zhangpassword=123456address=sichuan[data2]username=lipassword=654321address=guangdong通过configparser解析importconfigparse......
从C#到Python手把手教你用Python实现内存扫描获取指定字符串
......
学习python第六天
python迭代器迭代器是一种对象包含值的可计数数字在py中，迭代器是实现迭代器协议的对象，它包含方法_iter_()和_next_()要把对象/类创建为迭代器，必须为对......
数据分析--学习笔记01
python数据分析python数据分析工具包Numpy,SciPy.org,matplotlib,lean,pandas,k学习方法：重视理论--》勤于查阅--》身体力行--》联系实际数据获取手段数据仓库将所......
盘点一个Pandas写入csv文件的小问题
大家好，我是皮皮。一、前言前几天在Python铂金交流群【红色基因代代传】问了一个、Pandas处理的问题，提问截图如下：原始数据如下图所示：下面是他自己写的代码：withopen("r......

Python_pandas_数据分析

一、pandas简介

二、pandas.Series

2.1 Series创建方式

2.2 Series特性

2.3 常用方法

2.3.1 values和index

2.3.2 loc和iloc

2.4 缺失数据（NaN）处理

DataFrame

相关文章

赞助商

阅读排行