首页 > 编程语言 >Python实战—巴尔的摩公务员的待遇怎么样?

Python实战—巴尔的摩公务员的待遇怎么样?

时间:2022-11-10 10:06:50浏览次数:43  
标签:实战 salary Python count GrossPay sort AnnualSalary 年薪 巴尔的摩



Python实战—巴尔的摩公务员的待遇怎么样?_数据集

本节以美国城市巴尔的摩2016年公务员的工资数据集为例,数据来源于网络,通过数据分组统计,并且可视化,分析其工资情况。


数据来源

Python实战—巴尔的摩公务员的待遇怎么样?_数据_02



import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline #该数据为美国政府公开的公职人员的薪资数据
salary=pd.read_csv(open('D:\python数据分析\数据\Baltimore_City_Employee_Salaries_FY2016.csv'))
salary.head()

Python实战—巴尔的摩公务员的待遇怎么样?_数据_03

其中数据集字段Name、JobTitle、AgencyID、Agency、HireDate、AnnualSalary、GrossPay分别代表的含义为姓名、职位名称、工号、单位、入职日期、年薪、总薪资。


问题探索

Python实战—巴尔的摩公务员的待遇怎么样?_数据_02



  • 年薪的分布情况
  • 公务人员入职日期情况
  • 年薪最高的职务
  • 人数最高的职务


数据清洗

Python实战—巴尔的摩公务员的待遇怎么样?_数据_02



salary.shape

(13818, 7)

本例含有13818条数据,7列。

salary.isnull().sum()

Python实战—巴尔的摩公务员的待遇怎么样?_数据_06

查看缺失值,GrossPay列有272个缺失值。

salary = salary.dropna()
salary.isnull().sum()

Python实战—巴尔的摩公务员的待遇怎么样?_数据集_07

删除缺失值后的结果。

salary['AnnualSalary'] = salary['AnnualSalary'].str.strip('$')
salary['GrossPay'] = salary['GrossPay'].str.strip('$')
salary[['AnnualSalary','GrossPay']].head()

Python实战—巴尔的摩公务员的待遇怎么样?_数据集_08

字符串处理,去掉“$”符号,转换为浮点类型。

salary['GrossPay'].dtype
dtype('O')
salary['AnnualSalary'] = salary['AnnualSalary'].astype(float)
salary['GrossPay'] = salary['GrossPay'].astype(float)
salary['GrossPay'].dtype
dtype('float64')

转换数据类型为浮点类型。

salary['month'] = salary['HireDate'].str.split('/').str[0]
salary[['HireDate','month']].head()

Python实战—巴尔的摩公务员的待遇怎么样?_数据_09

对于入职日期,新增一列,存放入职月份,把日期数据当作字符串来处理。


数据探索

Python实战—巴尔的摩公务员的待遇怎么样?_数据_02



salary['AnnualSalary'].hist(bins=20)

Python实战—巴尔的摩公务员的待遇怎么样?_数据集_11

做出年薪工资的直方图可以发现,年薪基本呈正态分布,但向左略有倾斜,说明高工资的职务还是较少的。

month_count = salary['month'].value_counts()
month_count #对入职的月份计数

Python实战—巴尔的摩公务员的待遇怎么样?_数据_12

month_count.plot(kind='barh')

Python实战—巴尔的摩公务员的待遇怎么样?_数据集_13

对于入职的月份计数后做柱状图,发现入职的高峰期为9月、8月、6月。

agg_salary = salary.groupby('JobTitle')['AnnualSalary'].agg(['mean','count'])
agg_salary #聚合运算,计算各职位的年薪平均值和职位个数

Python实战—巴尔的摩公务员的待遇怎么样?_数据集_14

sort_salary = agg_salary.sort_values(by='mean',ascending=False)[:5]
sort_salary

Python实战—巴尔的摩公务员的待遇怎么样?_柱状图_15

对年薪平均值降序排列,并取前5。

sort_salary['mean'].plot(kind='bar')

Python实战—巴尔的摩公务员的待遇怎么样?_柱状图_16

做出柱状图可以发现,STATE'S ATTORNEY(州检查官)的年薪最高。

sort_count = agg_salary.sort_values(by='count',ascending=False)[:5]
sort_count

Python实战—巴尔的摩公务员的待遇怎么样?_数据_17

对职位计数降序排列,并取前5。

sort_salary['count'].plot(kind='bar')

Python实战—巴尔的摩公务员的待遇怎么样?_数据_18

做出柱状图可以发现,警察的职位人数远多于其他职位。


Python实战—巴尔的摩公务员的待遇怎么样?_数据_19

标签:实战,salary,Python,count,GrossPay,sort,AnnualSalary,年薪,巴尔的摩
From: https://blog.51cto.com/u_15828536/5839650

相关文章

  • Python数据分析,批量合并表格
    日常在处理数据时,数据表格常常以固定的格式,这些表格都具有相同的列名,通过对数据表进行整合,可以极大的提高我们的工作效率。本节使用两种方法对于表格批量处理,一种是常规的菜......
  • Python自然语言处理,词云图生成
    自然语言处理本节介绍如何使用Python中的库,生成词云图,涉及自然语言处理的相关问题,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之......
  • Python也能绘制奥运五环
    啊~~~五环,你比四环多一环啊~~~五环,你比六环少一环每当想起小岳岳的歌声,总是充满欢快的气氛,本节给大家介绍如何使用Python绘制奥运五环,这里借助Python中的turtle库,turtle英译为海龟......
  • 基于TensorFlow和Python的机器学习(笔记3)
    基于TensorFlow和Python的机器学习(笔记3)          embedding的原理是使用矩阵乘法来进行降维,从而达到节约存储空间的目的。word2vector工作流程图......
  • 太全面了!RF接口自动化框架项目实战
    每天进步一点点,关注我们哦,每天分享测试技术文章本文章出自【码同学软件测试】码同学公众号:自动化软件测试,领取资料可加:magetest码同学抖音号:小码哥聊软件测试以码同学V......
  • Python下使用argparse模块的脚本参数配置
    python的一个用于命令行参数解析的模块,其专业解释已经有很多了,可以去详查,不做赘述,仅谈谈自己的一些理解。为什么要用argparse模块来为代码导入参数或者文件路径呢?如果是一......
  • Python 批量导出mysql数据库表结构(转)
    https://blog.csdn.net/weixin_44309131/article/details/124119037?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2~aggregatepage~first_rank_ecpm_v......
  • 新的学习历程-python2 print
    1print('helloworld!')2print('hello','world!')#逗号自动添加默认的分隔符:空格3print('hello'+'world!')#加号表示字符拼接4print('hello','world',sep='***')......
  • 【Python爬虫案例】用python爬哔哩哔哩搜索结果
    一、爬取目标大家好,我是@马哥python说,一名10年程序猿。今天分享一期爬虫的案例,用python爬哔哩哔哩的搜索结果,也就是这个页面:爬取字段,包含:页码,视频标题,视频作者,......
  • Python: convert int to mode string
     def_convert_mode(mode:int):ifnot0<=mode<=0o777:raiseRuntimeErrorres=''forvinrange(0,9):ifmode>>v&1:......