首页 > 其他分享 >软件测试|数据分析神器pandas教程(二)

软件测试|数据分析神器pandas教程(二)

时间:2023-06-11 18:45:06浏览次数:38  
标签:数据分析 city district mydata Series pd pandas 软件测试

在这里插入图片描述

前言

上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。

数据结构-Series

Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 由索引(index)和列组成,函数如下:

pandas.Series( data, index, dtype, name, copy)

参数说明:

  • data:一组数据(ndarray 类型)
  • index:数据索引标签,如果不指定,默认从 0 开始
  • dtype:数据类型,默认会自己判断
  • name:设置名称
  • copy:拷贝数据,默认为 False

创建一个简单的 Series 实例:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)

print(mydata)
----------------------
输出内容如下:
0    4
1    5
2    6
dtype: int64

从上可知,如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据代码如下:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)


print(mydata[1])
----------------------------
输出结果如下:
5

我们也可以指定索引值,这样就可以按照索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata)

---------------------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

同样,我们也可以根据指定的索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata["city"])

-----------------------
输出结果如下:
Ganzhou

类似字典方法,通过键值对对象创建Series,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place)

print(mydata)
---------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

从输出结果可以得知,字典的键成为了索引,如果我们需要字典中的一部分数据,只需要指定需要数据的索引即可,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'])

print(mydata)

----------------------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
dtype: object

我们同样可以设置 Series 名称参数,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'], name="my hometown")

print(mydata)
--------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
Name: my hometown, dtype: object

总结

本文主要介绍了pandas的Series数据结构,这个数据结构较为简单,后续我们将介绍dataframe数据结构。

标签:数据分析,city,district,mydata,Series,pd,pandas,软件测试
From: https://www.cnblogs.com/hogwarts/p/17473369.html

相关文章

  • 软件测试|web自动化测试神器playwright教程(十五)
    前言我们在日常工作中,会经常遇到弹出警告框的问题,弹框无法绕过,必须处理才可以执行后续的测试,所以弹框处理也是我们必须掌握的一个知识。弹框通常分为3种,分别为alert,confirm,promot。alert弹框:只有信息和确定按键confirm弹框:在alert弹窗基础上增加了取消按钮prompt弹框:在confirm的基......
  • 软件测试|web自动化测试神器playwright教程(十六)
    前言在我们的日常工作中,经常会遇到文件下载的事件,如下图:我们可以看到在下载文件时会弹出一个Windows对话框,我们知道,selenium只能操作web页面,无法操作Windows对话框,使用selenium时,我们可以借助autoit等工具实现该功能。playwright则可以不借助其他工具实现文件的下载。文件下载playw......
  • pandas读取excel表格内容后重新生成表格时因为序号再次生成,出现:Unnamed: 0
    出现的问题如下图:在读取数据的函数中增加:index_col=0,即可。......
  • 【技术积累】Python中的Pandas库【三】
    什么是SeriesSeries是一种带有标签的一维数组,可以容纳各种类型的数据(例如整数,浮点数和字符串)。每个Series对象都有一个索引,它可以用来引用每个元素。Series对象的主要特征是可以进行矢量化操作(即一次对整个序列进行操作),因此非常适合处理数值数据。什么是DataFrame?DataFrame是一......
  • 对NBA球员巴特勒进行大数据分析
    (一)选题背景:NBA 作为世界上水平最高的篮球联赛,吸引了无数的球迷。每一场NBA 比赛都会产生大量的数据信息,如果能够有效地运用这些数据,便可以充分发挥出其潜在价值。在每年赛季开始之前,大量的媒体专家都会对本赛季NBA 常规赛的情况进行预测,这其中球队战绩和明星球员的个人数据是......
  • python爬虫——深圳市租房信息数据分析
    一、选题背景因为深圳经济非常不错,想必想要去深圳工作的人也不少。衣食住行是生活的基本需求。衣和食好解决,不喜欢的衣服可以买新的,不好吃的食物可以换一家吃。可是在住宿上,买房和租房的置换成本都相对较高,因此房源选择尤为慎重。作为目前买不起房的人自然是以租房为主,但是租房我......
  • python数据分析—葡萄酒质量预测
    一:选题背景随着葡萄酒越来越受欢迎,人们对于如何评价和预测葡萄酒质量的需求也越来越高。红酒质量的预测是其中的一个热门话题。传统的红酒质量评价是由专业品酒师根据对葡萄酒的视觉、嗅觉、味觉等感官特征进行评估,然后得出质量评分。但这种评价方式非常耗时费力且昂贵,并且与个人......
  • Python+pandas实现时间序列数据扩展案例一则
    感谢山东科技大学李超老师提供应用背景。在分析时序数据的有些场合下,可能每个月只能拿到一个数据,然而实际处理时,需要把这个数据扩展到该月的每天,且每天的数据相同。演示代码:某次运行结果:......
  • 【pandas基础】--目录(完结)
    pandas基础内容的目录:概述pandas主要功能和应用场景的介绍。数据读取数据读取是第一步,只有成功加载数据之后,后续的操作才有可能。pandas可以读取和导入各种数据格式的数据,如CSV,Excel,JSON,SQL,HTML等,不需要手动编写复杂的读取代码。核心数据结构pandas最大的优势......
  • Python+pandas使用交叉表分析超市营业额数据
    交叉表是一种特殊的透视表,往往用来统计频次,也可以使用参数aggfunc指定聚合函数实现其他功能。扩展库pandas提供了crosstab()函数用来生成交叉表,返回新的DataFrame,其语法为:crosstab(index,columns,values=None,rownames=None,colnames=None,aggfunc=None,margins=False,dropn......