Datawhale学习
开源贡献:Datawhale团队
漫漫夏日,不如一起聚众学习
暑假特辑开源教程如下:
(1) 机器学习:吃瓜教程
(2) 深度学习:李宏毅机器学习
(3) 精品入门课:动手学数据分析
(4) 精品入门课:集成学习
(5) Java编程语言
(6) 青少年编程(Turtle)
(7) OCR竞赛实践
关于开源
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。
开源内容
截止今日,Datawhale已经近开源30多门学习内容,涉及编程、数据挖掘、cv、nlp、强化学习和推荐系统六大模块,这来自每一个开源贡献者的参与。
开源地址
https://github.com/datawhalechina/team-learning
什么是组队学习?
顾名思义,就是一群志同道合的小伙伴,一起学习讨论,一起克服拖延症,一起组队打boss。没有老师,没有教学,有的是一群热爱学习和渴望改变的人,交流学习,互促共进。或许你可以从这些文章进一步了解:《闻韶:我的组队学习经历》、《罗如意:从学习者到加入组织》、《黄元帅:组队学习的大航海模型》
开源学习
1 /机器学习:吃瓜教程
开源贡献:谢文睿、秦州、郑锴岚
内容说明:周志华老师的“西瓜书”是机器学习经典入门教材,值得反复阅读,配合“南瓜书”从本科数学基础的视角进行讲解,一起打好基础!
任务路线:以《机器学习》西瓜书为主线,配合南瓜书攻克疑难点。
学习周期:20天
定位人群:有本科数学基础(高等数学、线性代数、概率论与数理统计)的同学
⚠️ 特别提示:吃瓜教程学习形式为直播+社群答疑,旨在促进更多人动手学习
任务预览
Task02:概览西瓜书、南瓜书第3章(6天)
- 《机器学习》第3章
- 涉及的线性回归等数学难点
2 /深度学习:李宏毅机器学习
开源贡献:王茂霖、陈安东、刘峥嵘、李玲、丁一超
内容说明:辅助大家更好学习李宏毅老师机器学习视频,并加入相关补充资料,相信你会对机器学习有更加深刻的理解。
任务路线:李宏毅视频+解读辅助
学习周期:14天
定位人群:深度学习初学者,有微积分,线性代数基础
⚠️ 特别提示:本教程为深度学习教程
任务预览
Task:深度学习介绍
- 整体介绍深度学习的发展,现状和分类
- 了解深度学习的基础知识
3 /动手学数据分析
开源贡献:陈安东、金娟娟、杨佳达、老表、李玲、张文涛、高立业、叶前坤、伊雪、刘天硕
内容说明:以项目为主线,通过边学,边做以及边被引导的方式,既掌握知识点又能掌握数据分析的大致思路和流程。
任务路线:了解数据分析中基本库的操作;熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。
学习周期:11天
定位人群:懂一些python,希望入门数据分析的学习者。
任务预览
Task01:数据加载及探索性数据分析(2天)
- 了解数据加载以及数据观察
- 掌握pandas基础
- 完成探索性数据分析
4 /集成学习
开源贡献:李祖贤、薛传雨、赵可、杨毅远、陈琰钰、李响、黄玉琳、管柯琴
内容说明:详细介绍了机器学习领域中最经典的算法并给出了相应的数学推导和代码,对于每个算法都进行了细致的分析以及必要的代码的演示,便于学习者深刻理解本质。在案例的代码中也给出了详细的代码注释。
任务路线:掌握基本的回归模型、偏差与方差理论、回归模型的评估及超参数调优等
学习周期:21天
定位人群:具备本科数学基础,会使用常见的数据分析工具,既想系统学习sklearn工具库解决机器学习问题,又想系统学习机器学习算法理论的数学推导的学习者。
⚠️ 特别提示:本期集成学习不分上中下,感兴趣的伙伴即可参与
任务预览
Task02:回归问题(2天)
- 数据科学永恒不变的主题也许就是调参吧,正确的调参姿势也是建立在正确评估模型的基础上的。因此我们要从偏差与方差理论中得到启发,从数学理论和代码上掌握回归模型的评估及超参数调优
5 /Java编程语言
开源贡献:赖桂彬,梁家晖,陈玉林,潘梓琪,周思阳
内容说明:Java独特的面向对象的抽象类编程特点,广泛应用于应用开发。同时Java在大数据开发上优势很大,是大数据的基础,本教程旨在帮助小伙伴熟练掌握Java技术
任务路线:层层递进。学习Java背景和基本知识,掌握Java面向对象编程基础,再到掌握面向对象的核心技术
学习周期:16天
定位人群:Java初学者
任务预览
Task04:面向对象编程基础(3天)
- 类与方法
- 继承与多态
6 /青少年编程(Turtle)
开源贡献:王思齐、马燕鹏、王皓月、杨煜、舒敏、赵可
内容说明:通过绘制图形的小例子,由浅入深带着小朋友们熟悉编程中Turtle的使用。
任务路线:从基础的软件安装,到绘制图形,完成最终挑战
学习周期:14天
定位人群:对编程有兴趣的小朋友
任务预览
Task07:乾坤大挪移——坐标(1天)
- 学习示例
- 参与挑战
7 / OCR竞赛实践
开源贡献:刘羽中,韩宇
内容说明:学习如何实践一场通用场景的OCR竞赛。
任务路线:熟悉环境,跟随Baseline学习,改进策略学习
学习周期:10天
定位人群:对OCR竞赛有兴趣的伙伴
任务预览
Task02:Baseline学习实践(4天)
- 跟随Baseline,了解一般竞赛思路
参与学习
快速通道
1. 吃瓜教程——西瓜书+南瓜书
开源内容:https://github.com/datawhalechina/pumpkin-book
2. 李宏毅机器学习
开源内容:https://github.com/datawhalechina/leeml-notes
3. 动手学数据分析
开源内容:https://github.com/datawhalechina/hands-on-data-analysis
4. 集成学习
开源内容:https://github.com/datawhalechina/ensemble-learning
5. Java编程语言
开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Java
6. 青少年编程(Turtle)
开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Turtle
7. OCR竞赛实践
开源内容:https://gitee.com/coggle/tianchi-intel-PaddleOCR
实践地址:https://tianchi.aliyun.com/competition/entrance/531902/introduction
学习规则
为了我们更好的学习效果,请关注以下规则:
1. 需交督促金3块(1块学习,1块分享,1块成长),按时完成所有任务返还;
2. 需要有Github或博客等公共账号,记录学习笔记打卡;
3. 未按时打卡的同学会被抱出群