首页 > 其他分享 >Datawhale数据分析教程来了!

Datawhale数据分析教程来了!

时间:2023-08-04 21:36:50浏览次数:34  
标签:数据分析 贡献者 教程 Datawhale 学习 开源

 Datawhale开源 

贡献者:陈安东、金娟娟、杨佳达、老表


开源初心

当我入门数据分析时,用的是鼎鼎大名的《python for data analysis》,书中对技术操作讲解细致,但遗憾的是,对于数据分析的逻辑介绍就少了很多。我和很多学习者会觉得敲了一堆代码却并不知道有什么用。毕竟理论学习和生活中的实际运用有不小的鸿沟。如何抹平这个鸿沟,就需要自己的尝试以及学习实战的资料。

Datawhale数据分析教程来了!_数据

有没有这样一个开源教程,以项目为主线,知识点孕育其中,通过边学、边做、边引导来得到更好的学习效果? 调查了一圈,发现现有关于数据分析的项目好像没有可以完全符合这样标准的(失望.jpg)。

没有就自己来做!Datawhale的小伙伴一拍即合,来做一门自己想要的数据分析开源课程,期待让所有使用了这个教程的伙伴可以更好的开启自己的数据分析之路,既能掌握pandas等的知识点,又能掌握数据分析的大致思路和流程!

现在,这门课程已经更新到了1.3版本,优化了学习流程并有更好的答案讲解,后期还会逐步推出配套教材(特别感谢马老师的认可,推荐自己学生使用这个教材)。今后还是希望从基础的数据分析操作和数据分析流程讲起,在每个模块都引入实战的例子,并会不断加入新的内容(比如数据挖掘算法等)。这是个开源项目,会不断迭代,大家共同参与,一起努力。

关于项目的名字——动手学数据分析(Hands-on data analysis)。数据分析是从一堆数字中看到真相的过程。学会操作数据只是数据分析的一半功力,剩下的另一半要用我们的大脑,多多思考,多多总结,更要多动手,实打实的的敲代码。所以也希望在学习这门课时,多去推理,多去问问为什么;多多练习,确保理论实践结合起来,在课程结束的时候一定会有大收获。

开源地址:https://github.com/datawhalechina/hands-on-data-analysis

学习思路

教程内容

教程现分为三个单元,大致可以分为:数据基础操作,数据清洗与重构,建模和评估。

  1. 数据基础操作:我们将得到一个要分析的数据,要学习如何加载数据,查看数据,然后学习Pandas的一些基础操作,最后尝试探索性的数据分析。
  2. 数据清洗与重构:当我们可以比较熟练的操作数据并认识这个数据之后,我们需要将原始数据变为一个可用好用的数据,为之后放入模型做准备
  3. 建模和评估:我们根据任务需求不同,要考虑建立什么模型,我们将使用流行的sklearn库,建立模型。评估我们模型的好坏,对模型做优化。

Datawhale数据分析教程来了!_数据分析_02

通关方法

教程的代码都是jupyter形式,每部分教程都分为课程+答案两部分。学习期间,在课程代码中,完成所有的学习,自己查找资料,自己完成里面的代码操作,思考部分以及心得。之后可以和小伙伴讨论,分享资料和心得。关于答案部分,大家可以参考,但是由于数据分析本身是开放的,所以答案也是开放式的,更多希望大家可以有自己理解和答案。如果需要参考,答案部分提供了参考。

Datawhale数据分析教程来了!_数据分析_03

课程:按要求敲出自己的代码

Datawhale数据分析教程来了!_数据_04

参考答案

学习反馈

作为一个没基础的小白学习者,这期动手学数据分析我学得很舒服,教程也比较简单和清楚,整体学下来感觉是很流畅的。每个task我都会把教程看两遍。第一遍只看教程,按着教程思路顺下来,看完以后再啃利用Python进行数据分析这本书,边看边做笔记(顺便把csdn写了)作业的拓展性这里必须给我加分,然后第二遍看教程就是完全不看答案把作业和思考做完。基本上学完还是很有成就感的,而且真的有学到很多东西。这个课程作为一个数据分析的入门课程,真的巨赞!

——华北电力大学,吴丹飞

首先这个学习文档做得很好,很有引导性,也是我看下来项目中比较好的一种学习方式——主动学习,不懂就搜索、问。作为有Python数据分析基础的学员很有复习、提高、巩固的功能。项目相对来说没有那么的贴切生活。建模那一块我之前有接触过,但是我搞不懂就没什么可建议的了.

——李晴晴

帮助还不小,因为后面做项目感觉还在不断用这些技巧,非常有用。我觉得可以加点数据分析的分析思路过程。(作者:这是重点更新的部分)

——V1.0 版组队学习参与者

成为贡献者

如果你也想和我们一起成为数据分析开源教程的贡献者,无论是内容的补充完善,还是发现教程的错误,请毫不犹豫地去GitHub提Issues反馈!

记得说明提问内容属于哪一个部分,然后提交你希望补充内容或者勘误信息,我们通常会在24小时以内给您回复,超过24小时未回复的话可以邮件联系[email protected]




Datawhale数据分析教程来了!_数据_05

核心贡献者陈安东

Datawhale成员,中央民族大学 | Queen Marry University of London

Datawhale数据分析教程来了!_建模_06

贡献者金娟娟

Datawhale成员,浙江大学硕士

Datawhale数据分析教程来了!_数据分析_07

贡献者杨佳达

Datawhale成员,数据挖掘工程师

Datawhale数据分析教程来了!_数据分析_08

贡献者老表

Datawhale成员,公号简说Python


教程开源学习贡献者

红空星:组织成员,数据分析师

李空玲:组织成员,算法工程师

高立业:组织成员,太原理工硕士

张文涛:组织成员,中山大学博士

Datawhale数据分析教程来了!_数据_09

标签:数据分析,贡献者,教程,Datawhale,学习,开源
From: https://blog.51cto.com/u_15699042/6968524

相关文章

  • 《小规模机器学习中的正样本-未标注样本学习》方法教程转载汇总
     《小规模机器学习中的正样本-未标注样本学习》方法教程转载汇总tinyMLTalksPhoenix-1.PositiveUnlabeledLearningforTinyMLPULearningTutorial-2.PULearningdefinitionsPULearningTutorial-3.AssumptionstoenablePULearning......
  • Apache Superset 1.2.0教程 (三)—— 图表功能详解
    通过之前章节的学习,我们已经成功地安装了superset,并且连接mysql数据库,可视化了王者英雄的数据。使用的是最简单Table类型的图表,但是superset还支持非常多的图表类型。本文我们将对各种图表类型进行逐一的演示,文章较长,建议收藏后阅读。图表分类Superset提供了大量的图表来帮助我们进......
  • 一小时搭建实时数据分析平台
    实时数据分析门槛较高,我们如何用极少的开发工作就完成实时数据平台的搭建,做出炫酷的图表呢?如何快速的搭建实时数据分析平台,首先我们需要实时数据的接入端,我们选择高扩展性、容错性、速度极快的消息系统Kafka,而实时数据仓库,由于Druid提供了非常方便快捷配置方式,如果不想编写负责的F......
  • 无涯教程-Perl - unless 语句函数
    Perl的除非unless语句由一个布尔表达式和一个或多个语句组成。unless-语法Perl编程语言中的exclude语句的语法是-unless(boolean_expression){#statement(s)willexecuteifthegivenconditionisfalse}如果布尔表达式的输出为false,则将执行exclude语句中的代......
  • 最详细的ubuntu 安装 docker教程
    Docker是一种流行的容器化平台,它能够简化应用程序的部署和管理。本文将介绍在Ubuntu操作系统上安装Docker的步骤,以便我们可以开始使用Docker来构建和运行容器化应用程序。系统版本本文以Ubuntu20.05系统为例安装docker,Ubuntu官方下载地址。检查卸载老版本dockerubuntu下自带了docke......
  • Django-4.2博客开发教程:初识模板(九)
    一、模板简介为了更好的维护和展示页面数据,使用直接返回数据显然是呆板的,不够美观,不够灵活,所以要使用模板。模板一般都放到项目根目录下的templates文件夹里。模板包含一些基础的HTML代码和一些特殊的语法,通过特殊的语法将数据动态的插入HTML页面中。特殊的语法中有一些变量......
  • 动力节点Spring Boot3项目版实战教程,学练一体,轻松掌握
    Spring Boot 3是一个非常令人期待的版本,将进一步扩大Spring Boot框架在应用程序开发领域的影响力,并带来更加出色的开发体验。Spring Boot 3的推出,带来个更多的新特性和功能,也为开发人员提供更高效、更优秀的开发体验和应用性能,值得我们深入学习。动力节点最新升级版SpringBoot......
  • 无涯教程-Perl - if...elsif...else语句函数
    if语句后可以跟可选的elsif...else语句,这对于使用单个if...elsif语句测试各种条件非常有用。if...elsif...else-语法Perl编程语言中的if...elsif...else语句的语法是-if(boolean_expression1){#Executeswhenthebooleanexpression1istrue}elsif(......
  • 深入浅出,五次课程,带您进入数据分析的世界
    导读:程序员4大出路:业务专家,全栈开发,技术专家,技术管理。最近,了解了下“数据分析”,觉得也可以作为参考。有兴趣的朋友们,可以看下本篇文章和对应的视频。 近些年,对于分布在各个行业的企业来说,「数据」已经逐渐开始扮演越来越重要的角色,成为企业长远发展不可忽视的力量。在数据分析大......
  • 数据分析之Pandas缺失数据处理
     Datawhale干货 作者:耿远昊,Datawhale成员,华东师范大学Pandas是一个强大的分析结构化数据的工具集,它的使用基础是Numpy(提供高性能的矩阵运算),用于数据挖掘和数据分析,同时也提供数据清洗功能。在往期文章中,已经详细讲解了Pandas做分析数据的四种基本操作:索引、分组、变形及合并。现......