首页 > 其他分享 >ADF - [01] 概述

ADF - [01] 概述

时间:2024-11-29 17:44:11浏览次数:10  
标签:01 ADF 管道 概述 Activity Azure 数据 连接

Azure Data Factory (ADF) 是微软 Azure 云平台的ETL可视化产品。

 

 

001 || 简介

  Azure Data Factory (ADF) 是微软 Azure 云平台提供的一种数据集成服务,它允许用户创建、安排和管理数据管道,以实现从不同来源抽取数据、转换数据并加载到目标存储的过程。这个过程通常被称为 ETL(Extract, Transform, Load)。

 

 

002 || 适用场景

【1】数据迁移:将数据从一个系统迁移到另一个系统,例如从本地数据库迁移到云端。

【2】数据整合:聚合来自多个异构数据源的数据,为分析或报告准备统一的数据集。

【3】实时处理:虽然ADF主要用于批处理,但也可以与Azure Stream Analytics等服务结合适用来处理近实时数据流。

【4】机器学习工作流:通过与Azure Machine Learning集成,可以构建包含训练模型步骤的数据管道。

【5】企业级BI解决方案:支持复杂的企业级商业智能(BI)应用,如数据仓库填充、报表生成等。

 

 

 

003 || 作用

使用ADF可以:

【1】创建管道(Pipeline),从不同的数据存储(Azure Storage,File,SQL DataBase、Azure Data Lake等)中提取数据。

【2】处理和转换原始数据,获得一个结构化的数据。

【3】把处理之后的数据发布到数据存储(Azure Synapse Analytics),供商业智能(BI)应用程序使用。

 

 

004 || 关键组件

 

管道(Pipeline)

  数据工厂包含一个或多个Pipeline,管道是Activity的逻辑分组,一个管道作为一个工作单元,管道中的Activity作为一个整体来执行任务。管道中的Activity对数据执行动作。管道使用户可以把多个Activity作为一个整体进行管理,而不必单独管理每个Activity,管道中的Activity可以连接在一起按照顺序串联执行,也可以单独以并发方式执行。

 

 

活动(Activity)

支持三种类型的活动:数据移动活动、数据转换活动和控制流活动。

  • 数据移动活动:用于把数据从源数据存储赋值到接收数据存储,来自任何源的数据都可以写入到任何接收器。
  • 数据转换活动:用户对数据进行转换处理
  • 控制流活动:控制流负责对管道活动进行控制,包含按照顺序连接活动、在管道级别定义参数、进行循环控制等。

 

 

数据集(Datasets)

  数据集代码数据中的数据结构,这些结构指向或引用在活动中使用的数据(输入或输出),也就是说,一个活动使用零个或多个数据集作为输入,使用一个或多个数据集作为输出。数据集(Dataset)类似于数据的视图,只是简单地指向或引用在活动中用于输入地数据源或者用于输出地数据目标。在创建Dataset之前,必须创建Linked Service,把数据连接到数据工厂。Linked Service就像连接字符串,定义数据工厂如何和外部资源进行连接。而Dataset代表的是数据的结构(Schema),而Linked Service定义如何连接到数据。

 

连接(Connection)

  连接有两种类型:Linked Services 和Integration runtimes,Linked Services是基于Integration runtimes的链接服务。

  Integration runtime(IR)是Azure数据工厂在不同的网络环境中进行数据集成的组件,连接服务(Linked Service)类似于连接字符串,用于定义ADF连接到外部资源时所需要的连接信息,连接服务定义如何连接到外部数据源,而数据集代表外部源数据的结构。

 

 

 

 

标签:01,ADF,管道,概述,Activity,Azure,数据,连接
From: https://www.cnblogs.com/houhuilinblogs/p/18577240

相关文章

  • Task01&Task02
    Task01Installation安装python3.X版本创建并激活conda环境这是一个管理python环境的工具,他可以创建一个虚拟环境在TUNA开源镜像站中找到Anaconda并下载安装包完成Anaconda的安装配置condaactivate安装vsc在官网下载vsc并完成配置下载语言插件下载与python相关插件Tas......
  • 电势模拟|01 电势模型
    本文摘要(由AI生成):本文介绍了Fluent中的电势模型,该模型可用于模拟涉及电势场分布的问题,如电镀、腐蚀和流体电池等。电势模型通过求解电势方程来处理直流问题,并可与电化学反应模型结合模拟电化学反应过程。文章还讨论了电势方程的求解过程,包括电势和电流边界条件的指定,以及焦耳......
  • Y20030012基于php+mysql的药店药品信息管理系统的设计与实现 源码 配置 文档
    库存管理系统1.摘要2.系统功能3.功能结构图4.界面展示5.源码获取1.摘要21世纪是信息的时代,信息技术发展突飞猛进。各种信息化管理系统如雨后春笋一样出现。Internet的迅猛发展使其成为全球信息传递与共享的巨大的资源库。越来越多的网络环境下的Web应用系统被建立起......
  • Taks01&Task02&Taks03
    安装注意安装的时候出现了意外,重装的时候会出现错误,查阅资料后找到解决办法,就是把报错的地方,找到报错的文件全部删除,应该是重装的时候第一次的残余,然后没有清理干净导致。python使用如何运行python程序可以使用win+r直接调用终端进行,一开始是命令行模式,然后输入python可以进......
  • Task01&Task02学习笔记
    Task01:安装Python编程环境Python解释器安装:进入官网下载搭建集成开发环境:下载pycharm:进入官网下载下载免费专业版教程可观看B站视频教程下面为视频链接(【全网最快速破解pycharm全程无废话!高效!】https://www.bilibili.com/video/BV1wJ4m1b7XZ/?share_source=copy_w......
  • P2801 教主的魔法 ——分块
    教主的魔法题目描述教主最近学会了一种神奇的魔法,能够使人长高。于是他准备演示给XMYZ信息组每个英雄看。于是\(N\)个英雄们又一次聚集在了一起,这次他们排成了一列,被编号为\(1,2,\ldots,N\)。每个人的身高一开始都是不超过\(1000\)的正整数。教主的魔法每次可以把闭......
  • P2597 [ZJOI2012] 灾难 —— LCA 拓扑排序
    [ZJOI2012]灾难题目背景阿米巴是小强的好朋友。阿米巴和小强在草原上捉蚂蚱。小强突然想,如果蚂蚱被他们捉灭绝了,那么吃蚂蚱的小鸟就会饿死,而捕食小鸟的猛禽也会跟着灭绝,从而引发一系列的生态灾难。学过生物的阿米巴告诉小强,草原是一个极其稳定的生态系统。如果蚂蚱灭绝了,小鸟......
  • 1403 [CF 701C] They Are Everywhere
    双指针记录范围内字段的字母哈希次数得到最小范围包含所有字母//1403[CF701C]TheyAreEverywhere.cpp:此文件包含"main"函数。程序执行将在此处开始并结束。///*http://oj.daimayuan.top/course/22/problem/1092给你一个长度为n的字符串,字符串由大小写英文字......
  • 20222301 2021-2022-2 《网络与系统攻防技术》实验七实验报告
    一、实验内容本实践的目标理解常用网络欺诈背后的原理,以提高防范意识,并提出具体防范方法。具体实践有:简单应用SET工具建立冒名网站ettercapDNSspoof结合应用两种技术,用DNSspoof引导特定访问到冒名网站。二、实验过程(一)简单应用SET工具建立冒名网站使用set工具setoolkit......
  • P3224 [HNOI2012] 永无乡
    [HNOI2012]永无乡题目描述永无乡包含\(n\)座岛,编号从\(1\)到\(n\),每座岛都有自己的独一无二的重要度,按照重要度可以将这\(n\)座岛排名,名次用\(1\)到\(n\)来表示。某些岛之间由巨大的桥连接,通过桥可以从一个岛到达另一个岛。如果从岛\(a\)出发经过若干座(含\(0\)......