首页 > 其他分享 >dremio 的自服务语义层创建简单说明

dremio 的自服务语义层创建简单说明

时间:2023-10-31 14:34:30浏览次数:74  
标签:dremio 创建 可以 语义 此层 应该 数据

内容来自官方文档,介绍了一些关于dremio 的数据语义层的玩法

原则

  • 分层 
    通过分层可以确保安全,性能以及可用性,dremio 提供了一个对于语义层的最佳实践
  • 数据集的注释增强发现以及可理解性 
    可以通过tag 以及文档(wiki)进行数据的描述

最佳实践

  • 使用1:1 的预处理层 
    此层的数据接近原始数据源,可以用来对于按需数据的组织,而不是所有的数据,这一层那个view 会映射到原始数据源中的数据 
    同时没有join 操作其他view
  • 使用业务层进行数据集的逻辑join 
    这层的数据的做法
  1. 查询预处理层的资源,应该选择所有预处理层的列数据,典型是一个1:1 的映射
  2. 查询其他同一业务层的资源,当查询的时候应该以来业务层的数据,而不是预处理层的,这样可以缺少数据join 可以进行方便的传播 
    应该使用通用的术语进行业务实体的描述,同时也可以在此层中创建子层,那个包含特定主题数据,这些是可复用的,应该在业务线中是可复用的组件 
    典型的不应该在此层进行filter (包含行以及列数据),应该推迟到应用层 
    此层可以提升产品以及分析的主动权,最大化的减少重复,可以对于数据工程师提供自服务模型,可以方便的在数据消费者中进行共享,减少数据到业务线的服务交付
  • 使用业务层对于数据消费进行组织 
    应该层view 主要是为了数据洗消费者进行组织,典型的场景包括数据分析,数据科学,如果应该层要提供一个dremio 语义服务的自服务访问,应该使用最小原则 
    如果此层不做为自服务提供,但是是对于特定应用的,此层应该依赖在应用层中的其他自服务视图,同时添加特定的应用业务逻辑,应该层可以基于应用进行row 的过滤 
    同时列的数据也可以进行减少
  • 利用tag 进行可搜索性的增强 
    比如对于不同的业务组,同时也可以进行多个tag 的添加
  • 使用wiki 内容进行数据集的装饰 
    wiki 可以方便人员对于数据的理解
  • 使用数据血缘理解对象的关系 
    此功能实际上属于企业版的,可以方便知道数据的资源关系

说明

同时官方还有一个独立的关于语义层的最佳实践说明,很值得看看

参考资料

https://docs.dremio.com/current/help-support/lakehouse-arch/semantic
https://docs.dremio.com/current/help-support/best-practices/semantic_layer

标签:dremio,创建,可以,语义,此层,应该,数据
From: https://www.cnblogs.com/rongfengliang/p/17800170.html

相关文章

  • 1. 创建纯净版DRF项目
    目录DjangoRest-Framework创建纯净版项目1.创建项目1.1创建PurePythonProjectDjangoRest-Framework创建纯净版项目1.创建项目1.1创建PurePythonProject......
  • 线程创建方式
    1.Thread通过继承Thread的方式,可以创建一个线程,需要重写其中的run方法,启动线程时,通过调用start方法启动。形如:2.Runnable通过实现Runnable接口的方式,可以创建一个线程,需要重写其中的run方法,启动线程时,将自定义类的实例作为一个参数,调用Thread的构造方法,得到一个线程实例,再......
  • dremio 的Well-Architected Framework
    内容来自官方文档,可以很好的了解dremio的架构设计参考图 说明以上文档,相对简单,但是可以很好的说明dremio包含的能力以及如何进行dremio服务的部署参考资料https://docs.dremio.com/current/help-support/lakehouse-arch/......
  • Opencascad(C++)-建模-创建有界直线段
    文章目录1、前言2、用gp_Lin创建一条直线2.1gp_Lin类成员函数2.2创建一条直线2.3运行结果3、创建一条有界的直线段3.1功能说明3.2函数说明3.2创建直线段的代码3.3测试效果1、前言在Opencascad开发时,经常会遇到创建直线的情况,采用gp_Line创建的直线段是无界的,如果想创建......
  • 【ROS2机器人入门到实战】动手创建一个移动机器人
    8.3动手创建一个移动机器人写在前面当前平台文章汇总地址:ROS2机器人从入门到实战获取完整教程及配套资料代码,请关注公众号<鱼香ROS>获取教程配套机器人开发平台:两驱版|四驱版为方便交流,搭建了机器人技术问答社区:地址fishros.org.cn大家好,我是小鱼,本节课我们来一起动手创建一个两......
  • LINUX下ORACLE表空间及用户创建
    LINUX下ORACLE表空间及用户创建 记录详细过程以备使用 ConnectedtoOracleDatabase11gEnterpriseEditionRelease11.2.0.1.0Connectedassys@ip:port/sid ASSYSDBA 管理员用户登录oracle数据库 1、创建临时表空间selectnamefromv$tempfile;查出当前数......
  • Unity 创建自定义渲染管线
    可以看官方的https://docs.unity3d.com/Manual/srp-custom-getting-started.html或者这位大佬的https://zhuanlan.zhihu.com/p/378828898......
  • 设计模式—创建型模式之工厂模式
    设计模式—创建型模式之工厂模式工厂模式(FactoryPattern)提供了一种创建对象的最佳方式。我们不必关心对象的创建细节,只需要根据不同情况获取不同产品即可。简单工厂模式比如我们有造车的工厂,来生产车,我们先定义一个抽象车产品://抽象车产品类publicabstractclassAbstract......
  • 【Tomcat】解决tomcat创建文件和目录没有others权限问题
    最近公司有一个新的需求,就是用Java使用apachecommonexec执行ffmpeg进行ts文件切片。但是产生的切片文件总是没有others权限,导致无法使用http远程访问(做了反向代理)解决方案:在tomcat/bin目录下编辑catalina.sh文件查找umask=“0027”更改为umask=“0022”此时新生成的文件权限......
  • 如何使用VSCode创建编辑Markdown文件
    断更了这么久,我回来啦!!!目录如何使用VSCode创建编辑Markdown文件一、安装VSCode软件二、VSCode安装Markdown相关插件1、VSCode安装插件的步骤2、VSCode中与Markdown有关的插件3、插件安装完成后的效果图三、VSCode操作Markdown文件1、VSCode新建Markdown文件2、VSCode编辑Markdow......