Python实战—自行车租赁数据分析

时间：2022-10-14 15:35:55浏览次数：88

标签：数据分析实战 plot Python count datetime 字段 bike 租赁

Python实战—自行车租赁数据分析_字段

本节选取自行车的租赁数据，利用numpy、pandas、matplotlib三个库，数据清洗后，做数据分析，研究时间段与自行车租赁的关系。

数据来源

Python实战—自行车租赁数据分析_字段_02

本节以自行车的租赁数据为例，数据来源于网络，利用时间序列分析的方法，通过可视化技术，分析自行车租赁随时间及天气变化的分布情况，其中datetime、season、holiday、workingday、weather、temp、atemp 、humidity、windspeed、casual 、registered、count字段分别代表租赁时间、季节、是否为假期、是否为工作日、天气数字越大，天气越差、temp atemp气温、湿度、风速、普通用户、注册用户、租赁自行车数量。

import numpy asimport pandas asimport matplotlib.pyplot as%matplotlib inline
bike = pd.read_csv(open(r'D:\python数据分析\数据\bike.csv'))bike.head()

Python实战—自行车租赁数据分析_数据_03

问题探索

Python实战—自行车租赁数据分析_字段_02

研究时间段与自行车租赁的关系情况。

数据清洗

Python实战—自行车租赁数据分析_字段_02

bike.isnull().sum()

Python实战—自行车租赁数据分析_字段_06

查看缺失值，无缺失值。

bike.dtypes

Python实战—自行车租赁数据分析_时间段_07

查看数据类型，datetime字段不是时间数据类型。

bike['datetime'] = pd.to_datetime(bike['datetime'])bike.dtypes

Python实战—自行车租赁数据分析_数据_08

将to_datetime函数转换为datetime类数据。

bike = bike.set_index('datetime') #将datetime字段设置为DataFrame的索引，成为时间序列数据bike.head()

Python实战—自行车租赁数据分析_时间段_09

bike.index #索引

Python实战—自行车租赁数据分析_字段_10

bike.tail()

Python实战—自行车租赁数据分析_时间段_11

数据探索

Python实战—自行车租赁数据分析_字段_02

y_bike = bike.groupby(lambda x: x.year).mean() # 降采样年份数据y_bike['count']

Python实战—自行车租赁数据分析_字段_13

y_bike['count'].plot(kind='bar') # 绘制柱状图

Python实战—自行车租赁数据分析_数据_14

2012年的租赁数据多于2011年数据。

m_bike = bike.resample('M', kind='period').mean() # 重采样到月份，类型为时期类型
m_bike.head()

Python实战—自行车租赁数据分析_字段_15

fig, axes = plt.subplots(2, 1)    #两行一列m_bike['2011']['count'].plot(ax=axes[0],sharex=True)  #贡献X轴m_bike['2012']['count'].plot(ax=axes[1])

Python实战—自行车租赁数据分析_数据_16

2011年和2012年的趋势大致相同，前几个月逐渐增加，到5、6月份到达峰值，再到9月份后逐渐减少。

bike['day'] = bike.index.daybike['hour'] = bike.index.hour # 单独存储日和时的数据
bike.head()

Python实战—自行车租赁数据分析_字段_17

d_bike = bike.groupby('day')['count'].mean() #对day字段分组统计
d_bike

Python实战—自行车租赁数据分析_字段_18

d_bike.plot() # 自行车每日租赁数分布

Python实战—自行车租赁数据分析_数据_19

h_bike = bike.groupby('hour')['count'].mean() #对hour字段分组统计
h_bike

Python实战—自行车租赁数据分析_数据_20

h_bike.plot() # 自行车每小时租赁数分布

Python实战—自行车租赁数据分析_数据_21

图中有明显的两个峰值，都是上下班时间段，并且晚上的峰值更高。

work_bike = bike.groupby('workingday')['count'].mean()
work_bike  #对workingday字段分组统计

Python实战—自行车租赁数据分析_字段_22

work_bike.plot(kind='bar')

Python实战—自行车租赁数据分析_字段_23

天气越差，自行车租赁数越少。

weather_bike = bike.groupby('weather')['count'].mean()
weather_bike #对weather字段分组统计

Python实战—自行车租赁数据分析_数据_24

weather_bike.plot(kind='bar')

Python实战—自行车租赁数据分析_时间段_25

天气越差，自行车租赁数越少，但在极端天气情况下却略有上升。

Python实战—自行车租赁数据分析_数据_27

标签：数据分析,实战,plot,Python,count,datetime,字段,bike,租赁
From： https://blog.51cto.com/u_15828536/5757010

数据分析面试题集锦(二)
大家好，今天整理了数据分析面试题集锦(二)，经常会被问到，“数据分析需要学习什么技能？”，“针对实际的业务场景，如何使用数据分析工具去分析？”基于此作者总结数据分析面试常用的问......
Excel数据分析函数必备，超全总结
为什么要学习Excel？首先，Excel是一个好用的工具，并不会因为你会Python而成为数据分析师，而是能用任何工具解决实际的业务问题，其次，Excel因为其简单易用，而受到人们的青睐。一般学......
数据分析面试题集锦(一)
大家好，今天整理了数据分析面试题集锦(一)，经常会被问到，“数据分析需要学习什么技能？”，“针对实际的业务场景，如何使用数据分析工具去分析？”基于此作者总结数据分析面试常用的问......
SPSS数据分析，试卷信度的检验与分析
试卷是考试运行的重要载体，其质量的高低不仅直接影响着考试的可靠度和准确度，往往还直接或间接地影响到学生的学习态度和学习行为。试卷信度是教育测量及评价中一个重要概念，人......
python实现批量下载配图王的美女图片
importrequestsimportrefrombs4importBeautifulSoupimportrandom#生成随机数#foriinrange(5):#print(random.randrange(100000000))headers={......
【python】准点跑路人必备小程序~ 不信你用不到
前言嗨喽，大家好呀~这里是爱看美女的茜茜呐又到了学Python时刻~有时候下班~忙着跑路，忘记关电脑，逮到了会被老板扣工资！！怎么办？python带你制做一个小程序，到点自动关机~再......
EXCEL数据分析，动态仪表盘制作
我们通常见到的仪表盘图类似汽车内的里程表，常用于反应目标达成率或者是目标的完成情况，从直观上了解数据内容，展现目标的达成和变化情况。本节使用收入目标值的数据，使用EXCEL......
MATLAB实战—最优Copula函数的选择
Copula函数模型本文讲解Copula函数在实际生活中的应用，Copula函数描述的是变量间的相关性，实际上是一类将联合分布函数与它们各自的边缘分布函数连接在一起的函数，因此也有人将......
数据分析入门必读书籍
1数据分析的定义数据分析是用恰当的统计分析方法对收集来的大量数据进行分析，然后加以处理和加工，以开发数据的功能、挖掘数据的价值，主要目的是为了清洗出有用的信息并形成结......
帕累托图形在数据分析中的应用
1二八法则二八法则是由意大利经济学家巴莱多发现的，他认为，任何一组事物中，最重要的只占其中20%，其余的80%虽然是多数，但是是次要的，由帕累托法则可以得出，80%的问题是由20%的原因......

Python实战—自行车租赁数据分析

相关文章

赞助商

阅读排行