首页 > 其他分享 >ETLCloud的应用策略——实时数据处理是关键

ETLCloud的应用策略——实时数据处理是关键

时间:2023-12-12 17:04:26浏览次数:27  
标签:数据源 配置 实时 ETLCloud 监听器 数据处理 数据

一、ETLCloud是什么?

ETLCloud的应用策略——实时数据处理是关键_ETL

ETLCloud又称数据集成(DataOps),是RestCloud旗下的一款数据仓库管理工具,通过自动化数据转换和集成来实现企业内部和外部数据的无缝对接,从而帮助企业快速获取准确的数据信息,进而作出正确的业务决策。

ETLCloud的功能分为离线数据集成、实时数据集成、数据源管理、监控中心、数据服务开发、用户权限管理等多模块,具有设计高效、开发成本低、数据支持性强、实时数据毫秒级同步、运行监控齐全等特点。

其中,实时数据处理是ETLCloud的关键应用策略之一,可以实现如下功能:

1.实时毫秒级同步:通过数据库日志捕获技术可以实现不同异构数据源之间的毫秒级实时同步。

2.构建实时数仓:通过实时同步技术可以帮助企业快速构建实时数仓。

3.实时报表:通过实时数据同步可以让BI的数据更快的展现、实时展示业务运作情况。

4.多种数据源支持:支持MySql、Oracle、Sql Server、PostgreSQL、MQ等的实时数据同步。

ETLCloud的应用策略——实时数据处理是关键_ETL_02

二、实践操作

直接展示监听Mysql数据库实时同步到Oracle数据库,中途进行数据映射等处理。

在数据库监听器类别中,ETLCloud可以实现四种监听方式,分别是直接传输、通过ETL流程、传输到Kafka、不处理。

直接传输方式,在配置方面是最简单的,适用于单纯监听同步源数据库表数据到目标库的情景,性能比较高效;

通过ETL方式,通过绑定设计离线流程,以达到对数据进行清洗转换等操作后,再同步到库表中,适用于监听源表数据后还需要对数据进行相关操作的情景,功能性比较强;

传输到Kafka方式,可以选择将数据传输到Kafka中,提供了多种选择;

不处理,可以捕获监听数据,但是不对数据进行后续操作,适用于测试监听器的配置效果便于调整监听器配置以及定位存在问题;

使用实时数据集成模块之前,我们需要在数据源中配置对应的数据源。

ETLCloud的应用策略——实时数据处理是关键_ETL_03

(配置好的数据源)

展示一下提前创建好的库表。

ETLCloud的应用策略——实时数据处理是关键_数据源_04


ETLCloud的应用策略——实时数据处理是关键_实时数据处理_05

(源表和目标表)

进入实时数据集成模块,新建一个监听器。数据传输模式先选择不处理测试监听效果;采集模式全量+增量数据;其他的按照提示选取即可。

ETLCloud的应用策略——实时数据处理是关键_实时数据处理_06

(监听器配置)

ETLCloud的应用策略——实时数据处理是关键_数据_07

(接收端配置)

启动监听器,可以看到监听器可以正常监听信息,说明源表可以进行监听,可以在此基础上更改其他数据传输模式;

ETLCloud的应用策略——实时数据处理是关键_数据_08

(启动监听器)

直接到库方式

我们这里新建一个监听器,数据传输模式选择直接到目标库的方式。

ETLCloud的应用策略——实时数据处理是关键_实时数据处理_09

(接收端配置)

ETLCloud的应用策略——实时数据处理是关键_ETL_10

(表映射)

启动监听器之后,我们对源表进行修改,模拟数据变化时的监听效果。

ETLCloud的应用策略——实时数据处理是关键_实时数据处理_11

(启动监听器)

ETLCloud的应用策略——实时数据处理是关键_数据_12

(目标表数据)

这样,就成功实现了源表和目标表的实时同步需求。

传输给ETL的流程

首先需要设计输出数据的ETL离线流程,只要配置一个库表输出组件即可。

ETLCloud的应用策略——实时数据处理是关键_数据_13

(流程设计)

在基本属性中,我们选取好目标数据库表,这个就是我们提前在数据源管理模块中配置好的数据源。

ETLCloud的应用策略——实时数据处理是关键_数据_14

(基本属性配置)

下一步,输出字段配置,选取数据表后,平台会自动载入字段信息,我们这里直接对数据进行操作即可,对NAME字段绑定一个姓名脱敏的转换规则。平台自带多种数据规则,支持自主定义开发规则,也有大量的数据处理组件可以直接使用,按照自己的需求设计即可。

ETLCloud的应用策略——实时数据处理是关键_实时数据处理_15

(输出字段配置)

ETLCloud的应用策略——实时数据处理是关键_监听器_16

(平台自带规则)

输出选项,可以选择配置数据输出的各种选项;高级配置可以对数据库的事务等以及流程的结果断言进行配置,我们这里直接使用默认的配置。

ETLCloud的应用策略——实时数据处理是关键_实时数据处理_17

(输出选项配置)

ETLCloud的应用策略——实时数据处理是关键_数据源_18

(高级配置)

保存后,我们前往实时数据集成模块新建一个监听器,数据传输模式选择传输给的ETL流程。这里指定的就是刚刚设计好的ETL流程。

ETLCloud的应用策略——实时数据处理是关键_数据源_19

(监听器配置)

ETLCloud的应用策略——实时数据处理是关键_监听器_20

(接收端配置)

启动监听器,然后去目标数据库查看同步效果。

ETLCloud的应用策略——实时数据处理是关键_监听器_21

(启动监听器)

ETLCloud的应用策略——实时数据处理是关键_监听器_22

(目标表效果)

传输给Kafka

同理选取源数据库表以及目标数据源。

ETLCloud的应用策略——实时数据处理是关键_数据源_23

(监听器配置)

ETLCloud的应用策略——实时数据处理是关键_数据源_24

(接收端配置,选择生产者数据源)

保存后启动监听器,手动修改源数据表,查看数据统计以及kafka接收到的数据。

ETLCloud的应用策略——实时数据处理是关键_监听器_25

(启动监听器)

ETLCloud的应用策略——实时数据处理是关键_实时数据处理_26

(Kafka数据)

可以看到,通过ETLCloud平台的这些功能,对实时数据进行处理是非常简单而且高效的。

三、总结

通过ETLCloud的实时数据处理功能,企业可以快速地获取最新的数据信息,及时了解市场变化、产品销售情况等重要信息。此外,ETLCloud还提供了多种数据处理策略和工具,可以根据不同的业务需求和数据特征,定制不同的数据处理方案,从而更好地满足企业的数据管理需求。

标签:数据源,配置,实时,ETLCloud,监听器,数据处理,数据
From: https://blog.51cto.com/u_16263190/8789347

相关文章

  • ETLCloud的应用策略——实时数据处理是关键
    一、ETLCloud是什么? ETLCloud又称数据集成(DataOps),是RestCloud旗下的一款数据仓库管理工具,通过自动化数据转换和集成来实现企业内部和外部数据的无缝对接,从而帮助企业快速获取准确的数据信息,进而作出正确的业务决策。ETLCloud的功能分为离线数据集成、实时数据集成、数据源管......
  • websocket使用方法|vue实时推送
    WebSocket实时推送创建一个WebSocket对象:准备变量mounted(){//初始化consturi=window.location.href;//获取网页urlconstprotocol=uri.split("/")[0];//https:确定当前传输协议constdomain=uri.split("/")[2];//Iip:portconstwsPr......
  • GridView的复制粘贴和Excel数据处理
    首先开启GridView的属性:view.OptionsClipboard.AllowCopy=DefaultBoolean.True;//允许复制view.OptionsClipboard.CopyColumnHeaders=DefaultBoolean.False;//是否复制表头view.OptionsClipboard.PasteMode=DevExpress.Export.PasteMode.Append;//粘贴模式view.Optio......
  • 实时组调度 【ChatGPT】
    https://www.kernel.org/doc/html/v6.6/scheduler/sched-rt-group.html实时组调度0.警告调整这些设置可能导致系统不稳定,这些旋钮只有root用户才能操作,并且假设root用户知道自己在做什么。最值得注意的是:在sched_rt_period_us中使用非常小的值可能导致系统不稳定,......
  • 1688商品详情接口在电商行业中的重要性及实时数据获取实现
    一、引言随着电子商务的快速发展,电商平台之间的竞争日益激烈。对于电商企业来说,快速、准确地获取商品信息变得至关重要。万邦获得1688商品详情接口作为中国最大的B2B电商平台之一,提供了丰富的商品信息和实时数据。通过该接口,电商企业可以快速获取商品详情信息,提高销售效率和客户满......
  • 实时3D渲染它是如何工作的?可以在哪些行业应用?
    随着新兴技术——3D渲染的发展,交互应用的质量有了极大的提高。用实时三维渲染软件创建的沉浸式数字体验,几乎与现实没有区别了。随着技术的逐步改进,在价格较低的个人工作站上渲染3D图像变得更加容易,设计师的投入也逐渐变少。什么是实时3D渲染?它是如何工作的简单地说,实时三维渲染......
  • 3DCAT+上汽奥迪:打造新零售汽车配置器实时云渲染解决方案
    在5G、云计算等技术飞速发展的加持下,云渲染技术迎来了突飞猛进的发展。在这样的背景下,3DCAT应运而生,成为了业内知名的实时云渲染服务商之一。交互式3D实时云看车作为云渲染技术的一种使用场景,也逐步成为一种新的看车方式,利用云端计算资源,通过超高清、全实时、可交互、沉浸式的......
  • Qt/C++音视频开发58-逐帧播放/上一帧下一帧/切换播放进度/实时解码
    一、前言逐帧播放是近期增加的功能,之前也一直思考过这个功能该如何实现,对于mdk/qtav等内核组件,可以直接用该组件提供的接口实现即可,而对于ffmpeg,需要自己处理,如果有缓存的数据的话,可以通过在缓存中的数据往前移动往后移动即可。这样就要求做一个比较大的缓存队列,占用一定的内存是......
  • 构建用于复杂数据处理的高效UDP服务器和客户端
    title:构建用于复杂数据处理的高效UDP服务器和客户端banner_img:https://cdn.studyinglover.com/pic/2023/12/334c0c129076533308cbc7e03f8c55be.pngdate:2023-12-723:03:00tags:-踩坑构建用于复杂数据处理的高效UDP服务器和客户端引言在当今快速发展的网络通信世界......
  • 淘宝详情API接口在电商行业中的重要性及实时数据获取实现
    一、引言随着电子商务的快速发展,电商平台上的商品数量呈现爆炸性增长。为了满足用户的需求,提供丰富、多样的商品信息,淘宝等电商平台推出了详情API接口。本文旨在探讨淘宝详情API接口在电商行业中的重要性,以及如何实现实时数据获取。二、淘宝详情API接口的重要性商品信息丰富化:通过......