首页 > 其他分享 >快速上手 | Datavines 两表值比对规则用法

快速上手 | Datavines 两表值比对规则用法

时间:2023-07-16 13:23:45浏览次数:47  
标签:社区 用法 datavane 开源 两表值 数据量 Datavines 数据

Datavines 是一站式开源数据可观测性平台,提供元数据管理、数据概览报告、数据质量管理,数据分布查询、数据趋势洞察等核心能力,致力于帮助用户全面地了解和掌管数据,让您做到心中有数。


场景

比较某张表(有时间分区列)今天的数据量和昨天的数据量,如果今天的数据量小于昨天的数据量就需要告警。

思路

使用两表值比对规则配合内置时间参数。

使用两表值比对的规则,通过编写 SQL 语句来统计今天和昨天的数据量,然后比较两个值,如果今天的值大于昨天的值则为真,否则为假。

步骤

  • 选择数据比对作业中的两表值比对规则
  • 选择对应的数据库和表,并编写计算实际值 SQL 语句。
    • 语句里面用到了$[today]时间变量,系统会自动替换成今天的日期,格式为yyyy-MM-dd,也可以自己配置格式 $[today(yyyyMMdd)]
    • 注意 as 后面的别名一定要是 actual_value,否则统计会出错。
    • 表名可以用${table},系统会自动替换,也可以直接写正确的表名。
select count(1) as actual_value from ${table} where data_date='$[today]'
  • 选择对应的数据库和表,并编写计算期望值 SQL 语句
    • 语句里面用到了$[yesterday]时间变量,系统会自动替换成昨天的日期,格式为yyyy-MM-dd,也可以自己配置格式 $[yesterday(yyyyMMdd)]
    • 注意 as 后面的别名一定要是 expected_value,否则统计会出错。
    • 表名可以用${table2},系统会自动替换,也可以直接写正确的表名。
select count(1) as expected_value from ${table2} where data_date='$[yesterday]'
  • 配置结果判断公式
    • 结果公式选择:实际值-期望值
    • 比较符选择:>=
    • 阈值:0

如果公式实际值-期望值 >= 0的结果为真, 那么就证明今天的表行数大于昨天的表行数,否则就证明今天的表行数小于昨天的表行数,结果是异常的,需要告警。

视频操作演示

视频演示

加入我们

Datavines 的目标是成为更好的数据可观测性领域的开源项目,为更多的用户去解决元数据管理和数据质量管理中遇到的问题。在此我们真诚欢迎更多的贡献者参与到社区建设中来,和我们一起成长,携手共建更好的社区。

关于Datavane

Datavane 是一个专注于大数据领域的开源组织(社区),由一群大数据领域优秀的开源项目作者共同创建,旨在帮助开源项目作者更好的建设项目、为大众提供高质量的开源软件,宗旨是:只为做一个好软件。目前已经聚集了一批优质的开源项目,涉及到数据集成、大数据组件管理、数据质量等。

Datavane 社区中,所有的项目都是开源开放的,代码质量和架构设计优质的潜力项目。社区保持开放中立、协作创造、坚持精品,鼓励所有的开发者、用户和贡献者积极参与我们的社区、共同合作,创新创造,建设一个更加强大的开源社区。

标签:社区,用法,datavane,开源,两表值,数据量,Datavines,数据
From: https://www.cnblogs.com/simple-focus/p/17557734.html

相关文章

  • JSON.stringify的其他用法
    1.过滤属性,只将name和age转为字符串,其他的属性不要JSON.stringify(person,['name','age'])2.特定属性,返回特定值或不返回值//指定gender不返回内容JSON.stringify(person,(key,val)=>{if(key=='gender'){//返回undefined,将会过滤掉gender属性,同1......
  • mysql begin end 用法
    MySQL中begin...end的用法在MySQL中,begin...end是一种用于定义事务(transaction)的语法结构。事务是数据库操作的逻辑单元,可以将多个操作当作一个原子操作来执行,即要么全部成功,要么全部失败回滚。1.事务的概念事务是数据库操作的最小逻辑单位,它是由一系列的SQL语句组成的逻辑操作......
  • 关于 Observable 对象调用 subscribe 方法时不传递任何参数值的用法讨论
    在RxJS中,subscribe方法是用于订阅Observable对象并接收数据的关键方法。通过subscribe方法,我们可以注册观察者(Observer)来处理Observable发出的数据、错误和完成信号。该方法接收三个可选的回调函数作为参数:next、error和complete。下面是subscribe方法的作用和示例......
  • FFmpeg中overlay滤镜用法-水印及画中画
    1.overlay技术简介overlay技术又称视频叠加技术。overlay视频技术使用非常广泛,常见的例子有,电视屏幕右上角显示的电视台台标,以及画中画功能。画中画是指在一个大的视频播放窗口中还存在一个小播放窗口,两个窗口不同的视频内容同时播放。overlay技术中涉及两个窗口,通常把较......
  • scrapy-redis 用法举例 解析
     scrapy-redis是一个用于将Scrapy分布式爬虫与Redis数据库相结合的库,可以使得多个Scrapy爬虫实例共享爬取任务队列和爬取结果数据等信息。下面是scrapy-redis的用法举例:安装scrapy-redis:pipinstallscrapy-redis 假设我们要爬取豆瓣电影TOP250的电影信息,......
  • dede织梦标签,dede:arclist用法与详解
    标签名称:arclist标记简介:织梦常用标记,也称为自由列表标记,其中imglist、imginfolist、specart、coolart、autolist都是由该标记所定义的不同属性延伸出来的别名标记。功能说明:获取指定文档列表适用范围:全局使用基本语法:{dede:arclist?flag='h'typeid=''row=''col=''titlelen=......
  • scrapy用法举例 (Scrapy爬取豆瓣电影Top250)
    Scrapy是一个Python的爬虫框架,用于快速开发和部署Web爬虫。它提供了一套完整的爬虫工具,包括爬虫的调度、数据下载、数据处理和存储等功能,同时也支持多线程、分布式和异步IO等高级特性。以下是Scrapy的用法介绍:1.安装ScrapyScrapy可以通过pip安装,命令如下:pipinstal......
  • nginx的一点小用法-代理国外s3对象存储加速
    缘由:有一套环境部署在aws新加坡区,资源使用s3对象存储,也用了cloudfront加速,但是but国内访问最近抽筋,也特意看了一下解析的地址IP....加速的地址在usa.....资源加速太慢了就想到了用nginx缓存加速一下!当然了还可以用国内腾讯云cosor阿里云oss同步到国内?但是生命周期,同步成本估计......
  • Find命令的7种用法
    可以很肯定地说,find命令是Linux后台开发人员必须熟知的操作之一,除非您使用的是WindowsServer。对于技术面试,它也是一个热门话题。让我们看一道真题:如果你的Linux服务器上有一个名为logs的目录,如何删除该目录下最后一次访问时间超过一年的日志文件呢?这种情况很常见,但令......
  • Java5泛型的用法,T.class的获取和为擦拭法站台
    Java5的泛型语法已经有太多书讲了,这里不再打字贴书。GP一定有用,不然Java和C#不会约好了似的同时开始支持GP。但大家也清楚,GP和Ruby式的动态OO语言属于不同的意识形态,如果是一人一票,我想大部分的平民程序员更热衷动态OO语言的平白自然。但如果不准备跳槽到支......