七月在线公开课笔记(二十六)
人工智能—机器学习公开课(七月在线出品) - P18:世界杯数据分析案例 - 七月在线-julyedu - BV1W5411n7fg
然后我们来做个分析吧,所以大家喜欢做一些比赛的分析,对吧?然后大家最关注的当然是决赛半决赛啊,可能也多多分析一下,分析到4分之1决赛对吧?好,所以然刚才已经抓了一些数据下来。我留了一个小任务。
我抓下来的那个数据呢是son格式的。然后用方式下来。大家可以去整理一下,你可以把里头的even词把even那一个项那个key对应的value拿出来做一个data frame做一个CSV文件。
这个你们自己去做好吧,我没有把这一行就它其实就是一行命令就可以做完的事情,我没有把它放在我的ipad当中,所以你们你们先自己去试。如果有问题的话再问我好吧。
所以这个地方大家会在这个连人夹里头会看到有一个CSV啊,我这数据有点大,我没有放在da大家代码我希望大家自己去跑一下那个抓取的过程,然后自己去把比如说德国和阿根廷比赛的这个比赛数据存一个SV原本是一个。
格式这个事情是不太难做的,其实还比较简单。所以对这个工作留给大家自己去练练手吧,好吧,至少把这个我们这个。给了这个东西跑一遍OK所以这个地方的话依旧要用到一些库嘛。我们想对世界杯的决赛去做一个分析。
注意啊,我现在做的事情真的是数据分析啊,这是data analysis呃,比较分析师们会做的一些事情的一个小小小的一个例子,你可以看得到。所2014年世界杯的一个决赛的分析啊。
这大概是我们需要做一些预处理。所以你要把相应的数据准备好了,你要把要的包import,所以importPD。是方便用in nonineSNP。
okK方便用把m plot live拉拉进来这个PLT啊拍pl。呃,这个地方有个文件有一个文件。如果你有兴趣的话,大家自己去看一下这个文件在spriet写了一个东西,封装了一个东西。
这个东西呢会对各种各样的场景。实际上啊你看啊这个地方有这么多的事件evens词,你去看它里头有typepe,它是有type name的,是是对应这些编号是有对应的类型的。比如说这是一个传球。
它会编号成一。比如说这是一个这个。okK这这这东西啊,这是一个犯规。你你这些都这些的话,大家简单的理解成你在一场足球比赛当中可能有很多很多的场景,你会传球,你会断球,你会有犯规。
你会有这个角球等等coner啊等等。有这么多种类型啊,有一个进球,我看看在哪进球啊,第一101是带着球跑,然后is a ball。OK然后。那还有一些。啊,好吧好吧,这有一些编码的问题,可能是。
oklost control of the ball失求了等等啊,就是我们我写的这样一个脚本,会把刚才的ID对应成具体的事件。能明白吧?这我是有个d有个字典,好吧,然后我需要去把这些事件画出来。
所以写了一个函数叫joaw event。这个函数完全是一个画图的一个函啊,一个一个画图的一个函数,所以我会去jo一个even。一会大家会看到我会掉这个东西啊,具体的具体这里面的这个详细的细节呢。
我不会给大家一行一行说,但我会告诉大家这个事情,它就是在把这样一个事件画出来。比如说传球,我会把这个我会用一个箭头指明从哪个位置传到了哪个位置。然后因为这是一个足球场里头的比赛。
所以我们需要确定这个箭头到底是在足球场的什么样的一个位置。所以大家会在这里看到很多的XYDXDY它表示说离我的左侧球场到底有多远,离我的。上面那一侧啊,上边界到底有多远等等啊。
然后这个地方你会看到有不同的颜色,有不同类型的箭头,我只是为了区分这些evenmens,为了区分不同的一些事件,到底是传球还是射门还是射没射进,好吧。然后可以看到这里面有array。
可以看到这里面有scatter闪点啊,等等等等啊。这里头有所以jo events大家有概念啊,joeven具体的细节下去看jo events,你看啊它的底色是黑色,一会儿你会看箭头,你可以去看箭头。
它的基本的那些箭头颜色是黑色,然后会有进球的红色的箭头等等啊。jo events,大家有个基本的概念,这个东西是用来画发生的那个事情,事箭,传球断球丢了球进球等等OK。带球跑等等。
然后就有个jopach,这个的话是把足球场画出来,我需要去画一个高级一点的足球场,不是刚才那个一片绿色。所以这个地方大家可以看到我会画一些。禁区。然后会有中场。
然后会有一些中场这个这个ecclipse这个这个椭圆这个啊中场这个场场地里头的一些对标记啊,所以所以这是一个自己封装的,这个不是一个库啊,不要不要下去以后问我说这个库,老师我在哪里装。
这是我们自己封装的一个小的。一个工具用来画图的。好吧,因为你做分析,做分析,你需要给人更直观的一个。印象,而不要说我我我给你一堆的数字,很枯燥的数数字,你最好能把这个东西做成一个可视化可很好的一个东西。
OK所以好,我们回来啊,我们看看这个分析。好了,开始做分析吧。所以把数据读进来吧。这个数据我刚才已经说过了,大家自己去用这个jason的那个格式去生成一下。好吧。
所以germanwe、阿genina、这个德国和germany,德国和阿根廷的一个比赛。把数据读进来,用UTF81个编码。然后我们会设定一些标准的一些数据。比如说这个球场。
球场应该是X应该横的是是多长啊,Y应该是多长size。然后这有个boxhate box y我这个宽度和高度。大家这个box大家能理解大家知道足球里和box指的是什么吗?
大家知道在球场的两侧会有一些有一些禁区,对吧?叫penity box。OK指的是这样一个东西啊,所以一会儿我们要对对进区我们一会儿需需要画的啊。O所以有同学知道啊。
所以这个地方有y box start box and ok ok进区的对,所以是近区从什么地方开始,从什么地方到什么地方结束结束,对吧?然后你会啊做一些这些东西我就不说了啊。
因为你得把足球大小变更到哦要把它画出来,但是我要保证这个比例,能明白吧?所以我把我把它这些数据做一个sca做一个幅度的一个变换O。
标签:二十六,这个,一个,模型,笔记,公开课,那么,我们,就是 From: https://www.cnblogs.com/apachecn/p/18498006