Datawhale学习
开源贡献:Datawhale团队
新学期新开始。本月组队学习,包含了机器学习、数据科学、深度学习、数理基础、青少年编程5个模块,共11个学习内容。
华北电力大学 BPS大数据与哲学社会科学研究会 将联合Datawhale展开线下学习,在华电的同学还可以线下参与。
关于开源
Datawhale作为开源组织,更多是希望营造互促的学习氛围和纯粹的学习环境,所有学习内容和学习规划都将开源在Datawhale Github上,方便大家有监督和无监督学习,从而帮助到更多学习者成长。
开源内容
截止今日,Datawhale已经开源50多门学习内容,涉及编程、数据科学、cv、nlp、强化学习和推荐系统6大模块,这源自每一个开源贡献者的参与。
开源地址
https://github.com/datawhalechina/team-learning
什么是组队学习?
顾名思义,就是一群志同道合的小伙伴,一起学习讨论,一起克服拖延症,一起组队打boss。没有老师,没有教学,有的是一群热爱学习和渴望改变的人,交流学习,互促共进。或许你可以从这些文章进一步了解:《闻韶:我的组队学习经历》、《罗如意:从学习者到加入组织》、《黄元帅:组队学习的大航海模型》。
开源学习
机器学习
1 /吃瓜教程—西瓜书+南瓜书
开源贡献:谢文睿、秦州、刘琳
内容说明:周志华老师的“西瓜书”是机器学习经典入门教材,值得反复阅读,配合“南瓜书”从本科数学基础的视角进行讲解,一起打好基础!
任务路线:以《机器学习》西瓜书为主线,配合南瓜书攻克疑难点。
学习周期:18天
定位人群:有本科数学基础(高等数学、线性代数、概率论与数理统计)的同学
学习名额:180人
任务预览
Task02:概览西瓜书、南瓜书第3章(6天)
- 《机器学习》第3章
- 涉及的线性回归等数学难点
2 /李宏毅机器学习(含深度学习)
开源贡献:王茂霖、陈安东、刘峥嵘、李玲、王洲烽
内容说明:辅助大家更好学习李宏毅老师机器学习视频,并加入相关补充资料,相信你会对机器学习有更加深刻的理解。
任务路线:李宏毅视频+解读辅助
学习周期:14天
定位人群:深度学习初学者,有微积分,线性代数基础
学习名额:100人
任务预览
Task4:深度学习介绍和反向传播机制(2天)
- 了解深度学习的基础知识
- 熟悉反向传播机制
3 /集成学习(上)
开源贡献:李祖贤、薛传雨、六一、杨毅远、陈琰钰、刘思含
内容说明:详细介绍了机器学习领域中最经典的算法并给出了相应的数学推导和代码,对于每个算法都进行了细致的分析以及必要的代码的演示,便于学习者深刻理解本质。在案例的代码中也给出了详细的代码注释。
任务路线:掌握基本的回归模型、偏差与方差理论、回归模型的评估及超参数调优等
学习周期:20天
定位人群:具备本科数学基础,会使用常见的数据分析工具,既想系统学习sklearn工具库解决机器学习问题,又想系统学习机器学习算法理论的数学推导的学习者。
学习名额:100人
⚠️ 特别提示:本期集成学习分上下专题,感兴趣的伙伴即可参与
任务预览
Task02:回归问题(3天)
- 数据科学永恒不变的主题也许就是调参吧,从偏差与方差理论中得到启发,从数学理论和代码上掌握回归模型的评估及超参数调优
数据科学
4 / SQL编程语言
开源贡献:王复振、杨煜、闫钟峰、杨梦迪、苏鹏、红星、张晋、于翔鹏、姜诗扬、丁丹
内容说明:Follow me,从 0 到 1 掌握 SQL,决胜秋招。
任务路线:完成SQL使用环境搭建,了解关系型数据库的基本特点,熟悉SQL增删改查基本操作,进一步掌握视图、子查询、函数、窗口函数等高阶用法,最后试一试秋招秘籍,检验下自己学习的效果。
组队学习周期:15天
定位人群:0基础学员,希望掌握SQL基础查询的同学
学习名额:100人
任务预览
Task04 集合运算(3天)
- 表的加减法
- 连结(JOIN)
5 / 数据可视化
开源贡献:杨剑砺、杨煜、耿远昊、李运佳、居凤霞、范佳慧、伊雪、肖桐、李晴晴、蔡婧旎
内容说明:系统梳理了python最重要的数据可视化包的方方面面,并且配有部分练习题供学习者核查自己的学习效果。
任务路线:本次课程内容的设计几乎完全基于官方文档的结构,通过画笔、布局、图例和样式来系统学习Python数据可视化。
组队学习周期:14天
定位人群:有基本的python基础,希望通过系统学习matplotlib提升可视化技能的人
学习名额:100人
任务预览
Task02:艺术画笔见乾坤(5天)
作为整个matplotlib宇宙中最重要的一个环节,重点介绍了matplotlib绘图的核心API,以及使用matplotlib绘制基本元素的方法
6 / 动手学数据分析
开源贡献:陈安东、金娟娟、杨佳达、老表、李玲、张文涛、高立业、李婉桦、叶前坤、18:46、吴卓辰
内容说明:以项目为主线,通过边学,边做以及边被引导的方式,既掌握知识点又能掌握数据分析的大致思路和流程。
任务路线:了解数据分析中基本库的操作;熟悉数据分析的操作流程,建立数据分析思维,入门数据建模。
组队学习周期:11天
定位人群:懂一些python,希望入门数据分析的学习者。
学习名额:100人
任务预览
Task01:数据加载及探索性数据分析(2天)
- 了解数据加载以及数据观察
- 掌握pandas基础
- 完成探索性数据分析
深度学习
7 / 基于transformers的自然语言处理(NLP)入门
开源贡献:多多、erenup、张帆、张贤、李泺秋、蔡杰、hlzhang、张红旭,袁一涵、童鸣
内容说明:希望结合形象生动的原理讲解和多个动手实践项目,帮助初学者快速入门深度学习时代的NLP
任务路线:系统学习attention、transformer、BERT、GPT,并基于其解决NLP的7个经典任务。
组队学习周期:19天
定位人群:NLP初学者,Transformer初学者
学习名额:100人
任务预览
Task03:学习BERT(2天)
- 3.1-如何实现一个BERT
- 3.2-如何应用一个BERT
- 3.3-篇章小测
8 / 自然语言处理之情感分析
开源贡献:芙蕖、戴治旭、陈海顺、初晓宇、汪超
内容说明:情感分析入门教程,共同学习,一起完善!
任务路线:从情感分析Baseline入手,学习多种分析方法,最后使用Transformers进行分析
学习周期:19天
定位人群:具备《高等数学》、《线性代数》、《概率论与数理统计》基础,了解机器学习常用模型、自然语言处理的理论知识,能够调用相应模型库解决的学习者。
学习名额:100人
⚠️ 特别提示:情感分析学习形式为直播+社群答疑,旨在促进更多人动手学习
任务预览
Task02:Upgraded情感分析(3天)
9 /计算机视觉 · 图像处理
开源贡献:王程伟、任乔牧、张强、李芝翔、杜蕊
内容说明:使用OpenCV学习和梳理图像处理算法
任务路线:学习OpenCV框架,自己动手实现边缘检测等算法
学习周期:12天
定位人群:具备一定编程基础,了解OpenCV,有学习和梳理图像处理算法的需求
学习名额:100人
任务预览
Task04:图像滤波(2天)
- 理论:掌握各类图像滤波远离
- 练习:利用OpenCV实现
数理基础
10 /机器学习数学基础【第二期】
开源贡献:李祖贤、张智涵
内容说明:本课程主要针对希望系统学习大学数学,或者是想为深造机器学习补充数学基础的的同学,考研的同学也可一起来学,前提是必须要跟上节奏,不能掉队。
任务路线:从8月份贯穿到12月份带着同学们一起复习高等数学、线性代数、概率论与数理统计的知识点,以及一起进行刷题练习。
学习周期:8月至12月共5期,9月份内容为多元函数微分学—多元函数积分学、三重积分与曲线曲面积分
定位人群:补充数学基础的同学
学习名额:100人
⚠️ 特别提示:本课程跟随组队学习进度开展,可在当月组队学习开始时加入正在进行的学习内容
任务预览
Task05:数学一与数学二专题(2天)
青少年编程
11 /Scratch 二级
开源贡献:王思齐、马燕鹏
内容说明:抽取电子学会青少年编程能力等级测试图形化二级的真题来组成试卷,在做题目的过程中掌握图形化编程的基本知识。
任务路线:由于测试题目为往年电子学会Scratch二级考试的真题,所以通过做题来掌握Scratch二级考试的知识点,为通过考试做准备。
学习周期:15天
定位人群:对图形化编程感兴趣的小朋友(小学3年级及以上)
学习名额:100人
任务预览
Task04:测试四(3天)
- 判断题、选择题测试
- 编程题测试
参与学习
快速通道
⭐ 为难度系数
1. 吃瓜教程——西瓜书+南瓜书⭐⭐
开源内容:https://github.com/datawhalechina/pumpkin-book
2. 李宏毅机器学习⭐⭐
开源内容github:https://github.com/datawhalechina/leeml-notes
开源内容 gitee :https://gitee.com/datawhalechina/leeml-notes
3. 集成学习⭐⭐⭐
开源内容:https://github.com/datawhalechina/ensemble-learning
开源内容:https://gitee.com/datawhalechina/ensemble-learning
4. SQL编程语言⭐
开源内容:https://github.com/datawhalechina/wonderful-sql
5. Matplotlib数据可视化⭐
开源内容:https://github.com/datawhalechina/fantastic-matplotlib
6. 动手学数据分析 ⭐⭐
开源内容:https://github.com/datawhalechina/hands-on-data-analysis
7. 基于transformers的自然语言处理入门 ⭐⭐
开源内容:https://github.com/datawhalechina/Learn-NLP-with-Transformers
8. 自然语言处理之情感分析⭐⭐⭐
开源内容:https://github.com/datawhalechina/team-learning-nlp/tree/master/EmotionalAnalysis
9. 计算机视觉 · 图像处理⭐⭐⭐
开源内容:https://github.com/datawhalechina/team-learning-cv/tree/master/ImageProcessingFundamentals
10. 机器学习数学基础⭐⭐
开源内容:https://github.com/datawhalechina/team-learning-data-mining/tree/master/Mathematics
11. Scratch 二级⭐
开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/Scratch
学习规则
为了我们更好的学习效果,请关注以下规则:
1. 需交督促金3块(1块学习,1块分享,1块成长),按时完成所有任务返还;
2. 需要有Github或博客等公共账号,记录学习笔记;
3. 未按时打卡的同学会被抱出群
学习锦鲤
如果你参与过Datawhale学习/贡献,或者关注Datawhale超过两个月时间
标签:github,datawhalechina,学习,组队,开源,https,com,九月 From: https://blog.51cto.com/u_15699042/7188291