原文链接:http://tecdat.cn/?p=7553
最近我们被客户要求撰写关于出租车的研究报告,包括一些图形和统计输出。
通过解析原始数据 ,得到模式如下所示
数据
每次骑行都有非常具体的上/下车位置以及开始/结束时间的详细信息。 下面显示了一个示例 :
我们留下了158,320,608个出租车行程的数据集,分为32,654个不同的起点/终点。
点击标题查阅往期内容
左右滑动查看更多
01
02
03
04
自1987年以来,位于东79街和约克大街的出租车站一直将上东区的居民带到华尔街。
我在数据中发现了沿着这条路线的252,210次记录。出租车平均需要20.35分钟才能以22.11 mph的速度行驶。当然,凌晨4点出租车的行驶速度更快,但是大多数人直到凌晨6点或凌晨7点才开始上下班:
一年中,最忙的出租车沿该路线行驶234次(只有7辆出租车沿该路线行驶100次):
尽管前十名最常见的出租车司机的平均速度可以预测,但他们的速度并没有比大多数人快(这可能是因为他们经常每天长时间开车)。
SELECT
pickup_street1, pickup_street2, dropoff_street1, dropoff_street2,
trips_medallion, trips_pickup_datetime, trips_dropoff_datetime,
ROUND(trips_avg_mph,4) AS avg_mpg,
ROUND(trips_trip_duration_hours,4) AS num_hours
FROM
[taxi_strava.joined_geohash_geonames]
WHERE
trips_geohashed_dropoff = 'dr5ru2'
AND trips_geohashed_pickup = 'dr5rvj'
点击文末 “阅读原文”
获取全文完整代码数据资料。
本文选自《基于出租车GPS轨迹数据的研究:出租车行程的数据分析》。
点击标题查阅往期内容
基于出租车GPS轨迹数据的研究:出租车行程的数据分析
用数据告诉你出租车资源配置是否合理
把握出租车行驶的数据脉搏 :出租车轨迹数据给你答案!
基于出租车GPS轨迹数据的研究:出租车行程的数据分析
用数据告诉你出租车资源配置是否合理
共享单车大数据报告
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
消费者共享汽车使用情况调查
新能源车主数据图鉴
python研究汽车传感器数据统计可视化分析
R语言ggmap空间可视化机动车交通事故地图
R语言ggmap空间可视化机动车碰撞–街道地图热力图