首页 > 其他分享 >软件测试|数据分析神器pandas教程(一)

软件测试|数据分析神器pandas教程(一)

时间:2023-06-11 18:45:34浏览次数:61  
标签:数据分析 dataset 德甲 pd Bayern pandas 软件测试

在这里插入图片描述

前言

Python是非常适合用于数据分析的,除了Python代码简单以外,Python还有非常多的第三方库,对于数据分析有很大帮助,今天我们就介绍一下Python进行数据分析的神器——pandas。

安装

从2019年1月1号开始,新发布的pandas将只支持Python3版本,所以我们的教程也以python3.7为例进行演示。

安装pandas和安装其他第三方库类似,只需要一条简单的命令即可,命令如下:

pip install pandas

注:日常使用中,pandas通常和numpy结合使用,所以我们还需要同时安装好numpy模块。

验证安装是否成功,我们可以运行一个简单脚本验证是否安装成功,代码如下:

import pandas

print(pandas.__version__)

-------------------------------
输出结果如下:
1.3.5

简单示例

下面是我们的一个简单的示例,代码如下:

import pandas as pd

dataset = {
  'player': ["Bayern", "Muller", "Germany"],
  'game': ['德甲', '欧冠', '欧洲杯']
}

mydata = pd.DataFrame(dataset)

print(mydata)

-----------------------
输出结果如下:
    player game
0   Bayern   德甲
1   Muller   欧冠
2  Germany  欧洲杯

当然,我们可以在dataset中继续添加其他内容,读取的内容也会按照一样的顺序出现,代码如下:

import pandas as pd

dataset = {
  'team': ["Bayern", "Dortmond", "Germany"],
  'game': ['德甲', '欧冠', '德国杯'],
  'palyer': ['穆西亚拉', '格雷茨卡', '基米希'],
  'enemy': ['man city', 'chelsea', 'paris']
}

mydata = pd.DataFrame(dataset)

print(mydata)

----------------------
输出结果如下:
       team game palyer     enemy
0    Bayern   德甲   穆西亚拉  man city
1  Dortmond   欧冠   格雷茨卡   chelsea
2   Germany  德国杯    基米希     paris

注:日常工作中,我们通常在导入时将pandas导入为pd

总结

本文主要介绍了pandas的安装还有一个简单示例,我们需要注意新版本pandas不再支持Python2.x版本,后续我们将介绍pandas的数据结构。

标签:数据分析,dataset,德甲,pd,Bayern,pandas,软件测试
From: https://www.cnblogs.com/hogwarts/p/17473366.html

相关文章

  • 软件测试|数据分析神器pandas教程(二)
    前言上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。数据结构-SeriesPandasSeries类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。Series由索引(index)和列组成,函数如下:pandas.Series(data,index,dtyp......
  • 软件测试|web自动化测试神器playwright教程(十五)
    前言我们在日常工作中,会经常遇到弹出警告框的问题,弹框无法绕过,必须处理才可以执行后续的测试,所以弹框处理也是我们必须掌握的一个知识。弹框通常分为3种,分别为alert,confirm,promot。alert弹框:只有信息和确定按键confirm弹框:在alert弹窗基础上增加了取消按钮prompt弹框:在confirm的基......
  • 软件测试|web自动化测试神器playwright教程(十六)
    前言在我们的日常工作中,经常会遇到文件下载的事件,如下图:我们可以看到在下载文件时会弹出一个Windows对话框,我们知道,selenium只能操作web页面,无法操作Windows对话框,使用selenium时,我们可以借助autoit等工具实现该功能。playwright则可以不借助其他工具实现文件的下载。文件下载playw......
  • pandas读取excel表格内容后重新生成表格时因为序号再次生成,出现:Unnamed: 0
    出现的问题如下图:在读取数据的函数中增加:index_col=0,即可。......
  • 【技术积累】Python中的Pandas库【三】
    什么是SeriesSeries是一种带有标签的一维数组,可以容纳各种类型的数据(例如整数,浮点数和字符串)。每个Series对象都有一个索引,它可以用来引用每个元素。Series对象的主要特征是可以进行矢量化操作(即一次对整个序列进行操作),因此非常适合处理数值数据。什么是DataFrame?DataFrame是一......
  • 对NBA球员巴特勒进行大数据分析
    (一)选题背景:NBA 作为世界上水平最高的篮球联赛,吸引了无数的球迷。每一场NBA 比赛都会产生大量的数据信息,如果能够有效地运用这些数据,便可以充分发挥出其潜在价值。在每年赛季开始之前,大量的媒体专家都会对本赛季NBA 常规赛的情况进行预测,这其中球队战绩和明星球员的个人数据是......
  • python爬虫——深圳市租房信息数据分析
    一、选题背景因为深圳经济非常不错,想必想要去深圳工作的人也不少。衣食住行是生活的基本需求。衣和食好解决,不喜欢的衣服可以买新的,不好吃的食物可以换一家吃。可是在住宿上,买房和租房的置换成本都相对较高,因此房源选择尤为慎重。作为目前买不起房的人自然是以租房为主,但是租房我......
  • python数据分析—葡萄酒质量预测
    一:选题背景随着葡萄酒越来越受欢迎,人们对于如何评价和预测葡萄酒质量的需求也越来越高。红酒质量的预测是其中的一个热门话题。传统的红酒质量评价是由专业品酒师根据对葡萄酒的视觉、嗅觉、味觉等感官特征进行评估,然后得出质量评分。但这种评价方式非常耗时费力且昂贵,并且与个人......
  • Python+pandas实现时间序列数据扩展案例一则
    感谢山东科技大学李超老师提供应用背景。在分析时序数据的有些场合下,可能每个月只能拿到一个数据,然而实际处理时,需要把这个数据扩展到该月的每天,且每天的数据相同。演示代码:某次运行结果:......
  • 【pandas基础】--目录(完结)
    pandas基础内容的目录:概述pandas主要功能和应用场景的介绍。数据读取数据读取是第一步,只有成功加载数据之后,后续的操作才有可能。pandas可以读取和导入各种数据格式的数据,如CSV,Excel,JSON,SQL,HTML等,不需要手动编写复杂的读取代码。核心数据结构pandas最大的优势......