大概了解了一点大数据比赛,数据比赛新手大概是将大量数据清洗,然后进行数据特征分析,建立模块,可视化等,因为python功能比较强大,所以我觉得还是得加强python的基础以及相关库的学习,spark是大数据分析引擎,是基于内存计算的大数据并行计算框架,所以打算基础了解,逐步进行对spark的学习。
我的寒假计划如下:
1.学习python基础和pandas、numpy、matplotlib库 至少50个小时(听课+练习)
2.spark入门,了解一下理论知识 大约40个小时
3.数据结构(听课+练习)至少50个小时
标签:创新,python,实践,50,寒假,听课,spark,数据 From: https://www.cnblogs.com/iqqq/p/17004575.html