首页 > 其他分享 >ETL实现实时文件监听

ETL实现实时文件监听

时间:2023-10-23 17:03:28浏览次数:35  
标签:文件 配置 实时 文件夹 使用 监听 ETL

一、实时文件监听的作用及应用场景

实时文件监听是一种监测指定目录下的文件变化的技术,当产生新文件或者文件被修改时,可实时提醒用户并进行相应处理。这种技术广泛应用于数据备份、日志管理、文件同步和版本控制等场景,它可以帮助用户及时发现和解决问题,提高工作效率。

应用场景包括但不限于:

网络存储设备监控:监控网络存储设备上的所有文件,发现文件被修改或新增时能够自动发送警报或执行其他操作。

安全监听:对文件进行实时监控,发现新的版本变化时能够自动发送警报或执行其他操作。

自动化任务:可以根据文件的变化触发自动化任务,例如当某个文件被修改时自动执行相关操作。

版本记录:可以记录文件每次修改时产生的变化,生成多个文件,记录不同时间段的文件内容,以达到版本记录效果

二、实现实时文件监听方式

实时文件监听可以使用许多编程语言和工具来实现,这里大致说一下现在常用的各种方式:

  • 使用第三方库或API,如Python的watchdog库、Java的Apache Commons-IO等。

这种方式往往需要在引用JDK的基础上,再通过代码方式进行配置、开启等,需要有一定的专业基础知识。专业能力较好的情况下可以自行开发或者在已有基础上二次开发,可以实现定制化的监听效果。当然现在网络上也有很多相关的资源可以直接使用,在一定程度上降低了使用难度。

  • 使用操作系统提供的监听工具,如Windows系统中的Windows Filtering Platform(WFP),Linux系统中的sighup、signal等,或Mac系统中的WatchKit、Foundation等。

这种方式也需要调用相关的编程语言进行编写代码,在监听文件系统的变化事件,并处理相应的文件操作事件等情况都需要用代码方式去处理,使用起来比较不友好。

  • 使用现成的文件监听工具或附带有文件监听功能的产品。

这种方式往往使用上比较简单,相比手动编写代码实现文件监听,使用现成的工具可以更快速、更方便地完成文件监听的配置和运行,运维人员使用起来也会更加的方便和高效。缺点是现成工具可能会占用相对更多的性能开销,或者功能上无法满足某些较为特殊的场景业务需求。

总的来说,使用现成的文件监听工具或附带有文件监听功能的产品可以提高文件监听的效率和便利性,但也需要根据自己的需求和情况选择最适合的工具和方案。

三、如何通过ETLCloud实现实时文件监听

首先明确我想实现的监听功能,我想监听某个文件目录下的json文件,并监听到数据变化后将当前json文件内容输出一份到另外一个文件夹,记录每个时间段json文件内容、并且每次监听到变化后都要发送邮件提醒我。本次使用ETLCloud进行演示下载地址

1.新建流程

首先在平台中新建应用,进入后再创建一个数据流程,先不用进行设计;然后在文件管理中配置需要监听的文件夹和处理监听结果的ETL流程。

ETL实现实时文件监听_文件读取

(监听文件夹配置)

提交后我们先不急着启动文件监听,而是前往设计刚刚创建的数据流程。

ETL实现实时文件监听_文件读取_02

(点击进入设计流程)

ETL实现实时文件监听_发送邮件_03

(流程组成)

2.配置流程

配置文本文件读取组件,配置好文件来源方式、读取后操作以及文件内容即可。

ETL实现实时文件监听_文件读取_04

(文本文件读取组件--基本属性配置)

ETL实现实时文件监听_编写代码_05

(文本文件读取组件--文件内容配置)

其中JSON路径取决于文件实际情况,比如这里我要监听的文件格式:

ETL实现实时文件监听_发送邮件_06

(JSON文件内容格式)

输入字段配置快速从配置中导入,

ETL实现实时文件监听_编写代码_07

接下来配置输出到文件组件。

ETL实现实时文件监听_发送邮件_08

(输出到文件--基本属性配置)

ETL实现实时文件监听_数据实时监听_09

(输出到文件--输出字段)

字段内容可以直接从文件读取组件中导入。当然,如果想实现细致化的数据同步操作,就可以自定义输入、输出的字段。

3.发送邮件提醒(发送邮件结点配置)

ETL实现实时文件监听_数据实时监听_10

(邮箱发送方配置)

ETL实现实时文件监听_编写代码_11

(发送邮件配置)

最后点击保存即可,我们回到文件管理处,启动文件监听器。

ETL实现实时文件监听_发送邮件_12

(启动文件监听器)

4.测试

然后我们这边将json文件放入监听文件夹,然后查看日志运行情况以及目标文件夹。

ETL实现实时文件监听_数据实时监听_13

(运行日志信息)

ETL实现实时文件监听_发送邮件_14

(目标文件夹内容)

ETL实现实时文件监听_发送邮件_15


ETL实现实时文件监听_编写代码_16

(邮箱邮件接收以及内容)

对监听文件进行修改保存后(或者直接同名文件覆盖):

ETL实现实时文件监听_数据实时监听_17

(监听文件内容产生变化)

ETL实现实时文件监听_文件读取_18

ETL实现实时文件监听_编写代码_19


ETL实现实时文件监听_编写代码_20

(后续效果)


整体流程设计下来,基本没有用到专业知识,也没有自定义编写代码,整体是非常简单实用的。

想要实现实时文件监听有很多种方法,手动编写代码方式灵活性高,但需要较多的时间和精力;使用系统API方式对系统依赖较高,需要深入理解API的使用方法;或通过使用ETL工具操作,是一种快速且简单的方式,能够通过图形化界面进行配置,省去了编写代码的过程。最终还是要找到适合自己的方式,这样才能较好的实现实时文件监听需求。

标签:文件,配置,实时,文件夹,使用,监听,ETL
From: https://blog.51cto.com/u_16263190/7988755

相关文章

  • 视频监控LiteCVR如何通过API接口获取国标GB28181协议接入的实时录像?
    以人工智能为代表的新兴技术,不断驱动着安防等各领域业务层面的创新,同时AI技术的深度应用将成为安防等各领域有效的视频监控解决方案。安防监控视频国标GB28181平台LiteCVR基于云边端一体化架构,具有强大的数据接入、处理及分发能力,可提供视频监控直播、云端录像、云存储、录像检......
  • Windows11 实时字幕如何实现实时翻译?
    Windows11实时字幕如何实现实时翻译?引言 2023年6月27日Windows11更新新增实用功能!此更新添加了以下语言的实时字幕:中文(简体和繁体)法语(法国、加拿大)German意大利语日语葡萄牙语(巴西、葡萄牙)Spanish丹麦语英语(爱尔兰,其他英语方言)韩......
  • 什么是美颜SDK?深入了解直播实时美颜SDK
    美颜已经成为了现代社交媒体和直播应用中的重要元素,它使用户能够在拍摄自拍照片或进行直播时改善其外貌特征。美颜技术的普及离不开美颜SDK(软件开发工具包),特别是在直播应用中,直播实时美颜SDK正变得越来越流行。在本文中,我们将深入了解美颜SDK是什么,以及为什么它在直播领域如此重要......
  • js_doucment.styleSheets获取StyleSheetList接口
    通过document.styleSheets可以获取到一个StyleSheetList接口constaStyleList=document.styleSheetsconsole.log(aStyleList.constructor.name)//StyleSheetListconsole.log(Object.prototype.toString.call(aStyleList))//[objectStyleSheetList]console.log(Arra......
  • 监听redis过期的key
       packagecom.ccxgf.configuration;importcom.fasterxml.jackson.annotation.JsonAutoDetect;importcom.fasterxml.jackson.annotation.PropertyAccessor;importcom.fasterxml.jackson.databind.ObjectMapper;importlombok.RequiredArgsConstructor;importorg.sprin......
  • Spring Boot中的过滤器、拦截器、监听器技巧汇总:让你快速成为大神
    环境说明:Windows10+Idea2021.3.2+Jdk1.8+SpringBoot2.3.1.RELEASE前言在Web应用程序中,我们经常需要处理请求和响应。有时,我们需要应用于所有请求和响应的通用逻辑。这就是过滤器、拦截器和监听器的用武之地。它们可以帮助我们在请求和响应被处理之前或之后执行一些通用逻......
  • Spring Boot中的过滤器、拦截器、监听器技巧汇总:让你快速成为大神
    环境说明:Windows10+Idea2021.3.2+Jdk1.8+SpringBoot2.3.1.RELEASE前言在Web应用程序中,我们经常需要处理请求和响应。有时,我们需要应用于所有请求和响应的通用逻辑。这就是过滤器、拦截器和监听器的用武之地。它们可以帮助我们在请求和响应被处理之前或之后执行一些通用逻......
  • java项目实践-jsp-finter-监听器-day19
    目录1.jsp2.过滤器3.listener监听器1.jspservle逻辑处理方便html页面表现麻烦jsp页面表现方便但是逻辑处理麻烦JSP是一种页面技术JSP本质上是servlet类通过JSP引擎翻译成servletjsp约等于java+html注意:jsp不是访问静态的html文件index.jsp修改成如下代码:<%-......
  • 3DCAT实时云渲染赋能聚好看科技,打造3D沉浸式互动视频云平台
    随着5G、云计算、XR等技术的发展,3D沉浸式互动视频已经成为了新一代的数字媒体形式,为各行各业带来了新的创新机遇和价值。然而,要实现高效、高质、高效率的3D沉浸式互动视频生产和传播,还需要强大的技术支撑和平台服务。作为海信旗下互联网科技公司,聚好看科技自研的企业级3D互动视......
  • 什么是美颜sdk?直播实时美颜sdk的工作流程和架构分析
    在现代社交媒体和娱乐行业中,直播已经成为了一种受欢迎的娱乐形式,同时实时美颜也变得越来越重要。直播实时美颜SDK的工作流程和架构在这一领域起到了关键作用。本文将深入探讨这些SDK的内部机制,从而理解它们如何为用户提供出色的美颜效果。一、什么是美颜sdk?实时美颜是指在直播过程......