首页 > 其他分享 >如何成为一名数据工程师:完整的路线图

如何成为一名数据工程师:完整的路线图

时间:2022-09-05 01:44:21浏览次数:88  
标签:工程师 数据仓库 推荐 路线图 Youtube 完整 课程 2022 数据

如何成为一名数据工程师:完整的路线图

关于如何学习数据工程的完整路线图。

Photo by 这是工程RAEng on 不飞溅

什么是数据工程?

数据工程是设计和构建用于大规模收集、存储和分析数据的系统的实践。组织可以收集大量数据,但为了确保数据在到达数据科学家和分析师时处于高度可用的状态,他们需要合适的人员和合适的技术,数据工程师在这里采取行动。这些是您在处理数据时可能执行的一些常见任务

  1. 获取符合业务需求的数据集
  2. 开发算法以将数据转换为有用的、可操作的信息
  3. 构建、测试和维护数据库管道架构
  4. 与管理层合作以了解公司目标
  5. 创建新的数据验证方法和数据分析工具
  6. 确保遵守数据治理和安全策略

必须学习的大量工具和主题不应让初学者感到负担过重。有各种学习阶段,因此作为新手,您应该只专注于掌握要领。随着时间和经验的积累,您会感到轻松自在,并准备好进入高级主题。

基础知识

  1. **数据库概念:
    ** 关系数据库、约束、键、触发器、规范化
    课程推荐: 关系数据库设计
  2. **Python 编程
    ** 基本语法、处理文件、连接到数据库、构建基本 API、处理结构化(数据库和表)和非结构化(XML、JSON 等)数据。
    课程推荐:
    一个。 Youtube 上的 Python 课程
    湾。 2022 年完成 Python 训练营,从零到 Python 中的英雄
  3. **SQL
    ** 基本数据提取、连接表、键、约束、窗口函数、聚合函数等。
    课程推荐:
    一个。 Youtube 上的 SQL 课程
    湾。 完整的 SQL 训练营 2022:从零到英雄
  4. **数据仓库和数据建模
    ** 基本数据仓库概念、数据仓库数据建模、星雪花模式、事实和维度表等。
    课程推荐:
    一个。 Youtube 上的数据仓库课程
    湾。 数据仓库——终极指南
  5. **云基础知识
    ** 云中的弹性、可扩展性、存储和计算、云中的数据堆栈。
    课程推荐:
    一个。 Youtube 上的云基础课程
    湾。 终极 AWS 认证解决方案架构师助理 2022
  6. **Hadoop 生态系统和 Spark
    ** Hadoop、MapReduce、为什么要引入 spark、Spark 基础知识。
    课程推荐:
    一个。 Youtube 上的 PySpark 课程
    湾。 Youtube 上的 Hadoop 课程
    C。 使用 Apache Spark 和 Python 驯服大数据——动手吧!

高级主题

  1. **工作流管理和调度程序
    ** 这是现代数据堆栈中非常重要的组件。在 AirFlow(最受欢迎和市场领导者)或其他任何东西(Luigi,Prefect)之间进行选择
    课程推荐:
    一个。 Youtube 上的气流课程
    湾。 Apache Airflow 的完整实践介绍
  2. **数据流
    ** 数据流通过数以千计的数据源近乎实时地将数据连续发送到目的地
    课程推荐:
    一个。 Youtube 上的 Apache Kafka 课程
    湾。 Apache Kafka 系列 — 为初学者学习 Apache Kafka v3
  3. **云数据仓库
    ** 红移、雪花、BigQuery
    课程推荐:
    一个。 Youtube 上的 AWS Redshift 课程
    湾。 终极 AWS 认证解决方案架构师助理 SAA-C03
    C。 雪花——完整的大师班(2022 年版)
  4. **数据湖
    ** 课程推荐:
    一个。 Youtube 上的 Azure 数据湖课程
    湾。 Youtube 上的 AWS 数据湖课程
    C。 在 AWS 和 Azure 上使用 Databricks 进行数据工程

好有

  1. **仪表板工具
    ** Power BI、Tableau 或 Looker
    课程推荐:
    一个。 Youtube 上的 Power BI 课程
    湾。 适用于商业智能的 Microsoft Power BI Desktop
    C。 Youtube 上的 Tableau 课程
    d。 Tableau 2022 AZ:数据科学实践 Tableau 培训
    e. Youtube 上的 Looker 课程
    F。 Looker 和 LookML——初学者的完整课程
  2. **码头工人
    ** Docker 有助于避免与基础设施相关的复杂性。这有助于独立且轻松地设置数据环境。
    课程推荐:
    一个。 Youtube 上的 Docker 课程
    湾。 Docker & Kubernetes:实用指南【2022版】

结论

对于我们作为数据工程师的日常工作来说,这些能力中的每一个可能都不是必需的。然而,根据功能,您可能经常需要其中的一项或多项。
掌握其中的大部分内容需要一些时间。每天都在学习新事物。复合学习将保证您随着时间的推移而提高。没有捷径可走,因此不要相信那些说您可以在几周或几个月内成为数据工程师的人。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/14412/34590501

标签:工程师,数据仓库,推荐,路线图,Youtube,完整,课程,2022,数据
From: https://www.cnblogs.com/amboke/p/16656707.html

相关文章

  • linux driver --- platform框架应用完整实例
    平台设备文件button_device.c#include<linux/module.h>#include<linux/init.h>#include<linux/platform_device.h>staticvoidbutton_release(structdevice*d......
  • 数据工程师角色的定义,恕我直言。
    数据工程师角色的定义,恕我直言。首先,我知道对于在数据工程领域工作的人来说,标题听起来过于雄心勃勃。对我来说,似乎每家公司对数据工程师的角色都有不同的理解。一些人将其......
  • 使我成为更好的软件工程师的 7 个以上习惯
    使我成为更好的软件工程师的7个以上习惯7个以上的习惯让我在谷歌、一家初创公司找到了一份工作,并让我成为了联合创始人1.阅读编程书籍阅读有关编程语言、项目架构、......
  • Redis完整篇
    Redis1.Nosql概述1.1.为什么使用Nosql1、单机Mysql时代90年代,一个网站的访问量一般不会太大,单个数据库完全够用。随着用户增多,网站出现以下问题数据量增加到一定......
  • WordPress美女图集COS写真整站自适应网站源码带完整数据
    这是自己做的网站,因为自己要做别的业务,没有时间打理,而且放着也是放着,不如拿来分享给大家,这个资源非常火爆,用来引流还是很轻松的。 网站从服务器备份了下来,所以有完整......
  • VSCode创建Vue项目完整教程
    VSCode创建Vue项目完整教程文章目录一、配置环境1.安装VSCode2.安装node.js3.安装配置脚手架vue-cli二、创建vue项目1.命令方式创建2.重新初始化依赖3.启动项目......
  • Python极客项目编程 中文PDF完整版入门到精通
     《Python极客项目编程》中文PDF完整版免费下载地址内容简介  · · · · · · Python是一种强大的编程语言,容易学习而且充满乐趣。但掌握了基本知识后,......
  • MybatisPlus拦截器打印完整SQL、分页、自动填充处理
    MybatisPlus拦截器打印完整SQLMybatisPlus虽然也自带了一个打印SQL的配置,但是不方便查看,也没有时间统计mybatis-plus:configuration:log-impl:org.apache.ib......
  • Google Chrome谷歌浏览器离完整离线安装包下载地址整理总汇
    每次重装系统,都要为安装Chrome而烦恼。虽然现在可以直接从谷歌浏览器官网下载在线安装包进行安装,但是在线安装包安装的版本不可控,大概率是x86版本,而且在断网状态下也......
  • 数据工程师的原子性
    数据工程师的原子性Photoby诺伯特·科瓦尔奇克on不飞溅原子性,在程序或系统中,是将多个操作的执行视为单个操作执行的概念。组合是构建软件系统的主要概念,即服务......