首页 > 其他分享 >​离线数仓数据源变更及应对方案

​离线数仓数据源变更及应对方案

时间:2023-08-17 17:22:55浏览次数:36  
标签:数仓 针对 数据源 离线 业务 报错 监控 变更

离线数仓数据源的变化对数仓的影响是巨大的,所以我们不但要做好事后监控,也要做好事前的各种流程制度规范,比如所有业务的升库语句需要DBA对其进行管控,只能由DBA进行升库处理,并且做好处理记录,同时把相关变更通知到数据部门。为了防止有导致异常的致命性错误,最好能把binlog监控的就监控起来,这样数据部门才能更好的管控数据,这里我们只罗列相关的变更场景及事后的应对方案。

变更场景:

1.业务方的相关业务下线,表数据一直未更新。

2.业务逻辑变化,某些字段暂停使用。

3.业务新增字段。

4.业务删除字段。

5.业务新增业务,新建表。

6.业务删除表。

应对方案:

    针对第1点,源头表未使用这种场景不会导致数仓任务报错,但是比较致命和浪费集群资源,可以在表入仓时,标记好相关表的更新频率,在线业务表,变更会比较频繁,字典表、码表之类的变更没那么频繁,可以针对在线业务表进行binlog监控,如果30天甚至更久都没有变化,可以发一个告警通知给相关方,并且创建需求备忘录,如果没有影响,则由项目负责人进行关闭。

    针对第2点,某些字段暂停使用的情况,这种场景下只有通过监控字段的空值率来判断,关键字段空值率高了就告警。

    针对第3点,新增字段对于数仓现有业务影响不大的,可暂时忽略,只需通知出来即可,但是数仓为了任务不报错,在开发数据同步任务时需要指定同步的字段。

    针对第4点,删除字段这种情况数仓如果未提前做处理,必然会导致数仓报错,可在同步系统添加一个源表字段和数仓表字段的映射关系校验,发现源头没有的字段,数仓有的进行紧急告警。

    针对第5点,新建表这种数仓不会有任何报错,可以在binlog监控到这种情况后,提示通知数据分析人员,可能有新增业务。

    针对第6点,业务删除表,如果数仓正在用这个表,任务未提前下线,数仓任务会报错,这种场景可以在拉数据前,先判断一下表是否存在。

    总之源头表变化对数仓的应用有影响的,需要把从源头表开始下游的所有表梳理出来,并提示可能受影响的数据应用负责人。

 

标签:数仓,针对,数据源,离线,业务,报错,监控,变更
From: https://www.cnblogs.com/beststrive/p/17638221.html

相关文章

  • seata学习-数据源代理
    代理的动机AT模式下执行undo-log回滚日志代理的是DateSource这个类手动代理即手动注入一个DataSourceProxy,如下@BeanpublicDataSourcedruidDataSource(){returnnewDruidDataSource()}//这里会返回名字为"dataSource"的Bean,这里@Primary@Bean(......
  • 视频集中存储/云存储/磁盘阵列EasyCVR平台接入RTSP设备出现离线情况的排查
    安防视频监控/视频集中存储/云存储/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等,以及支持厂家私有协议与SDK接入,包括海康Ehome、海大宇等设备的SDK等。平台既具备传统安防视频监控的能力,也具备接入AI智能分析的......
  • centos7离线安装postgres
    官网下载源码包https://www.postgresql.org/ftp/source/v12.10/postgresql-12.10.tar.gz 上传到/usr/local目录tar-zxvfpostgresql-12.10.tar.gz 解压文件cdpostgresql-12.10依次执行如下命令 ./configure makesudomakeinstall如果执行中报如下错误则需要安装......
  • centos7离线安装docker
    1.下载docker安装包: https://download.docker.com/linux/static/stable/x86_64/2.解压文件docker-20.10.9.tgz 3.复制到/usr/bin文件夹下cpwork/docker/*/usr/bin/4.注册Docker为服务,进入 /etc/systemd/system/ 目录,并创建 docker.service 文件。vi/etc/sys......
  • 安防监控视频云存储平台EasyNVR通道频繁离线的原因排查与解决
    安防视频监控汇聚EasyNVR视频集中存储平台,是基于RTSP/Onvif协议的安防视频平台,可支持将接入的视频流进行全平台、全终端分发,分发的视频流包括RTSP、RTMP、HTTP-FLV、WS-FLV、HLS、WebRTC等格式。为了满足用户的集成与二次开发需求,我们也提供了丰富的API接口供用户调用。有需要的用......
  • [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序
    1.今天开发了一套服务程序,使用的是Odbc连接momhistory.在我本机用VS打开程序时,访问一切正常,当发布出来装在电脑上,连接momhistory时提示:[Microsoft][ODBC驱动程序管理器]未发现数据源名称并且未指定默认驱动程序 2.检查ODBC数据源配置时感觉也没啥问题。3.发现“要用......
  • 安防监控视频云存储平台EasyNVR通道频繁离线的原因排查与解决
    安防视频监控汇聚EasyNVR视频集中存储平台,是基于RTSP/Onvif协议的安防视频平台,可支持将接入的视频流进行全平台、全终端分发,分发的视频流包括RTSP、RTMP、HTTP-FLV、WS-FLV、HLS、WebRTC等格式。为了满足用户的集成与二次开发需求,我们也提供了丰富的API接口供用户调用。有需要的用......
  • 数仓备份经验分享丨详解roach备份原理及问题处理套路
    本文分享自华为云社区《GaussDB(DWS)备份问题定位思路》,作者:yd_216390446。前言在数据库系统中,故障分为事务内部故障、系统故障、介质(磁盘)故障。对于事务内部故障和系统故障,使用日志自动恢复,不需要人工参与。但对于介质故障,需事先备份数据。那么对于DWS来说是如何进行备份的呢?......
  • 数仓备份经验分享丨详解roach备份原理及问题处理套路
    本文分享自华为云社区《GaussDB(DWS)备份问题定位思路》,作者:yd_216390446。前言在数据库系统中,故障分为事务内部故障、系统故障、介质(磁盘)故障。对于事务内部故障和系统故障,使用日志自动恢复,不需要人工参与。但对于介质故障,需事先备份数据。那么对于DWS来说是如何进行备份的呢?以及备......
  • Centos-国内常用源和离线环境的下载安装方法
    开始之前简单讲下源和包管理器的概念,个人理解如下:源就是平时我们win电脑上的360软件管家、腾讯软件管家、微软商店这个意思,提供下载各类软件包、安装包的平台;包管理器就是win电脑上各类软件的安装包,例如qq.exe、360.msi等,需要下载后用指定的命令可以进行安装、协助等操作,跟源配......