Datawhale学习
开源贡献:Datawhale团队
本次组队学习为数据挖掘专题学习,旨在理论结合实践,帮助学习者掌握数据挖掘相关知识,提升在实际场景中的数据分析、特征工程、建模调参和模型融合等技能。同时在天池开放了「数据挖掘-金融风控」学习赛,一起在实践中成长。
报名方式:
在后台回复关键词组队学习可获得报名二维码,附督促金后进群。
学习内容都已开源,也可以先自学,文末下载完整学习教程
关于开源
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。
开源内容:
截止今日,Datawhale已经开源20多门学习内容,涉及编程、数据挖掘、cv、nlp和推荐系统五大模块,感谢每一个开源贡献者的参与。
开源地址:
https://github.com/datawhalechina/team-learning
组队学习:关于组队学习,顾名思义,就是一群志同道合的小伙伴聚集一起,一起学习,一起讨论,一起组队打boss,一起克服拖延症。其实没有老师,没有教学,有的是一群热爱学习和渴望改变的小伙伴,交流学习,互促共进。
事不宜迟,来看看这次的具体内容吧。
开源学习
基本信息
1. 贡献成员:王贺、杨冰楠、陶旭东、吴争光、苏鹏、王程伟、担扬杰、成森、陈长沙、刘雯静
2. 学习周期:两周
3. 学习形式:理论学习 + 比赛实践
4. 人群定位:有一定的数据分析与python编程的基础。
5. 先修内容:Python编程语言
6. 难度系数:中
任务安排
一、任务理解 (2天)
1. 理解任务数据和目标,清楚评分体系。
2. 完成报名和数据下载,理解任务的解题思路。
二、 数据探索 (3天)
1. EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。
2. 当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。
3. 引导数据科学从业者进行数据分析处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。
4. 完成对于数据的探索性分析,并对于数据进行一些图标或文字总结并打卡。
三、 特征工程 (3天)
1. 对于特征进行进一步分析,并对于数据进行处理。
2. 完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。
四、 建模调参 (3天)
1. 了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程。
2. 完成相应学习打卡任务。
五、 模型融合 (3天)
1. 对于多种调参完成的模型进行模型融合。
2. 完成对于多种模型的融合,提交融合结果并打卡。
参与学习
学习规则:
1. 需交督促金3块:1块学习,1块分享,1块成长;
2. 需要有一个或B站等可以记录学习的公开帐号;
3. 根据任务安排学习,完成后写学习笔记blog;
4. 支持打卡形式多元化,B站、直播等形式均可。
5. 任务截止前在群内打卡,遇到问题一起交流讨论;
6. 未按时打卡的同学视为自动放弃,流出学习群。
学习教程:
在后台回复关键词金融风控可下载完整学习教程。
“为沉迷学习点赞↓
标签:Datawhale,学习,组队,开源,打卡,数据,九月 From: https://blog.51cto.com/u_15699042/6963402