首页 > 其他分享 >爱数科案例 | 共享单车使用量影响因素可视化分析

爱数科案例 | 共享单车使用量影响因素可视化分析

时间:2022-10-17 14:04:25浏览次数:51  
标签:单车 直方图 使用量 可视化 租车 共享 爱数科 数量



近些年,“共享单车”模式迅速地在全球各大城市中流行起来,但随着资本的逐步退潮,共享单车企业需寻求新的盈利模式,首要任务便是探究共享单车使用量的影响因素。本案例利用首尔自行车共享需求数据集对单车使用量的影响因素进行可视化分析。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据集

1. 读取数据

首先,读取数据集首尔自行车共享需求数据集 ,数据集包含在首尔自行车共享系统中每小时出租的公共自行车的数量,以及相应的天气数据和假日信息,包含14个属性,8760条数据。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据集_02


首先,读取数据集首尔自行车共享需求数据集 ,数据集包含在首尔自行车共享系统中每小时

字段含义说明:
​​​Date​​​:日期。
​​​Rented Bike Count​​​ :租用自行车计数 - 每小时租用自行车数。
​​​Hour​​​:小时 - 一天中的小时。
​​​Temperature​​​:温度 - 摄氏温度。
​​​Humidity(%) ​​​:湿度。
​​​Wind speed (m\/s)​​​ :风速。
​​​Visibility (10m)​​​:能见度。
​​​Dew point temperature​​​:露点温度 - 摄氏度。
​​​Solar Radiation (MJ\/m2)​​​:太阳辐射。
​​​Rainfall(mm)​​​ :降雨量。
​​​Snowfall (cm)​​​:降雪量。
​​​Seasons​​​:季节。
​​​Holiday​​​:假期。
​​​Functioning Day​​:功能日 - NoFunc(非功能时间),Fun(功能时间)。


2. 字段基本统计信息

查看数据集中每个字段的基本统计信息。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据_03


数据集共有8760条数据,根据字段基本统计信息可以看到该数据集不存在缺失值,有​​Date​​、​​Seasons​​ 、​​Holiday​​、​​Functioning Day​​四个字段为字符型数据,其余均为数值型数据。


3. 单车使用量分布直方图

利用直方图组件查看单车使用量分布直方图,分箱数量默认为10。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据_04

​可以看到,每小时租车数量在0~355.6这个区间最多。

4. 温度分布直方图

利用直方图组件查看温度分布直方图,分箱数量默认为10。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据_05

租车时的温度多集中在-0.64~27.96摄氏度这个区间内。


5. 湿度分布直方图

利用直方图组件查看湿度分布直方图,分箱数量默认为10。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据集_06

租车时的湿度多集中在29.4%~88.2%这个区间内。

6. 风速分布直方图

利用直方图组件查看风速分布直方图,分箱数量默认为10。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据_07

风速达到2.22m/s时,租车数量开始明显减少。

7. 温度与单车使用量散点图

利用散点图探索温度与单车使用量之间的关系。

爱数科案例 | 共享单车使用量影响因素可视化分析_直方图_08


从整体上看,随着温度的升高,租车数量有增加的趋势。


8. 湿度与单车使用量散点图

利用散点图探索湿度与单车使用量之间的关系。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据_09

随着湿度的上升或下降,单车租用数量没有明显的变化趋势。

9. 风速与单车使用量散点图

利用散点图探索风速与单车使用量之间的关系。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据集_10

在风速达到5m/s之前,随着风速的增加,租车数量有着先增加后减少的趋势,但是当风速达到5m/s后,租车数量急剧减少。

10. 假期分布情况 

利用柱状图查看假期分布情况。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据集_11

非节假日的时候共享单车的使用量明显高于节假日,可初步判断共享单车的适用人群多为工作者。  

11. 季节分布情况 

利用柱状图查看季节分布情况。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据集_12

由图可以得知共享单车的使用总量几乎不受季节的影响。  

12. 假期与单车使用量箱线图 

利用箱线图探究假期与单车使用量的关系。特征列选择Rented Bike Count,分组列选择Holiday。

爱数科案例 | 共享单车使用量影响因素可视化分析_数据集_13

由图可知,无假期的时候的使用量趋于500左右,而假期的使用量趋于250左右。  

13. 季节与单车使用量箱线图 

利用箱线图探究季节与单车使用量的关系。特征列选择Rented Bike Count,分组列选择Seasons。

爱数科案例 | 共享单车使用量影响因素可视化分析_直方图_14

冬季的时候共享单车使用量大多在200左右,而夏季则达到900左右,春季和秋季单车使用数量分别为580和760左右。  

14. 功能日分布饼状图 

利用饼状图查看功能日的占比情况

爱数科案例 | 共享单车使用量影响因素可视化分析_直方图_15

饼状图显示在所有的数据当中,功能日占据了绝大多数,而非功能日只占据了一小部分。  

15. 数据分组聚合 

由于每一个时段对应着非常多的租车数量,如果想要查看时段与租车数量之间的关系,使用原数据绘制折线图的话,不能够很好的展现时段与租车数量之间的关系,我们可以用每一个时段租车数量的平均值来代替这一时段租车数量的平均水平,这里利用数据分组聚合组件计算出每一个时段租车数量的平均值。分组列选择​​Hour​​​,聚合列选择​​Rented Bike Count_mean​​​,聚合函数选择​​平均值​​。

爱数科案例 | 共享单车使用量影响因素可视化分析_直方图_16

节点报告展示了数据分组聚合之后的结果,字段Hour是由0开始按照顺序依次排列的,可以直接绘制折现图。Rented Bike Count_mean就是每一个时段的平均租车数量。  

16. 时段与租车数量折线图 

利用分组聚合之后的数据绘制时段与租车数量的折线图。x轴选择​​Hour​​​,y轴选择​​Rented Bike Count_mean​​。

爱数科案例 | 共享单车使用量影响因素可视化分析_直方图_17

根据折线图,可以看到一天当中,存在着两个峰值,分别是早上的8点和下午的6点,这是由于上班的早高峰和下班的晚高峰,并且下午6点的峰值要高于早上8点的峰值。


爱数科(iDataScience)平台是一款数据科学科研和教学一体化平台,集成数十行业数千数据集、科研案例模板。帮助科研人员快速使用大数据和人工智能技术开展研究。支持高校开展大数据通识课程教学。帮助非专业人员进行数据分析和生成数据分析报告。登录网址 www.idatascience.cn



标签:单车,直方图,使用量,可视化,租车,共享,爱数科,数量
From: https://blog.51cto.com/u_15622928/5762623

相关文章

  • 爱数科案例 | 数据预处理——字符串分割
    下载数据集请登录爱数科(www.idatascience.cn)本案例主要用于熟悉数据预处理中字符串分割组件的操作和运用。1. FordGoBike共享单车数据集首先,读取数据集FordGoBike共享......
  • 视频回放+PDF课件 | 博雅数智学堂通识课第5期:迪士尼电影票房可视化分析
    2022年06月21日晚八点,博雅数智学堂“数据科学通识实验”第5期成功举办。本次课程采用腾讯会议、视频号、知乎和B站同步直播,使用爱数科平台进行在线实验。100余所院校700余名......
  • 关于共享单车的情景剧
    关于共享单车的情景剧:旁白:2022年的某一天,正是个阴雨绵绵的日子。公交车起点站附近,工作人员打着伞,忙着将一排排共享单车排放整齐。公交车:(轻声笑道)又是打哪来的一位新人?瞧着......
  • 数据统计与可视化课程总结
    大数定理与蒙特卡洛大数定律的客观背景大量随机试验中事件发生的频率稳定于某一常数测量值的算术平均值具有稳定性比如:大量抛掷硬币字母使用频率正面出现频率......
  • 爬取旅游景点评论数据,并可视化
    对于数据分析师来说,数据获取通常有两种方式,一种是直接从系统本地获取数据,另一种是爬取网页上的数据,爬虫从网页爬取数据需要几步?总结下来,Python爬取网页数据需要发起请求、获......
  • R实战—相关矩阵可视化
    近几天毕业生相继离校了你们走了,我好继承华水的食堂在这里,祝毕业生一路顺风愿此去前程似锦再相逢依旧如故今天讲相关分析,并将得出的相关矩阵可视化。dvdf相关关系是一种非确......
  • PowerBI连接数据库,并可视化
    本节选取MySQL软件自带的数据文件,world数据库中含有city表,以该表的数据为例,使用PowerBI软件,连接数据库,数据清洗后,使用筛选器实现动态筛选效果,我们知道PowerBI软件具有良好的......
  • 比Excel好用100倍!半小时开发酷炫可视化大屏,这款工具太牛了
    前几天遇到一个朋友,也是做数据分析的,不管是多杂乱的数据,他也能从中分析出个所以然来。但他做的可视化图表,可以说就像是上个年代的东西,实在是不太美观。他也很苦恼,问我有没有......
  • 数据可视化 | 2022年9个最佳数据地图可视化工具推荐
    数据地图可视化是用来反映和分析数据的,直观地表达数据间的关系。那么,有哪些可以制作数据可视化地图的工具呢?小编推荐了9款比较热门好用的数据地图可视化软件平台,大家一起来......
  • 共享单车
    makefile编译    gdb调试编译时 g++ -g文件名-o 生成的可执行文件名gdb 文件名 就在gdb模式下调试 b 两次tab键 会把涉及到b的函数全部列......