首页 > 其他分享 >Apache Drill 教程

Apache Drill 教程

时间:2023-09-02 14:01:02浏览次数:40  
标签:教程 Drill drill apache https SQL Apache

Apache Drill

https://github.com/apache/drill

前言

这里更偏向于应用,而不是将官方文档翻译给你。

Apache Drill 是阿帕奇的顶级项目,但是它的中文文档很少,这篇文档将帮你了解如何使用 Apache Drill。并且会在文末整理一些专业的文档供你参考学习。

当然如果你是官网爱好者,那么你可以直接访问官网:https://drill.apache.org/。

适合人群

  1. 初学者
  2. 临时使用者
  3. 想了解 Apache Drill 的人

1. 概述

如果你看到这篇文章,相信你对 Drill 已经有所了解,如果你还不了解 Drill,请看下面的简要介绍。

Apache Drill是一款开源的数据探索工具,一个分布式SQL查询和分析引擎。它包含了很多专有的设计,来进行高性能分析,支持半结构化数据源(JSON、XML和日志等)和基于应用不断创新的数据格式。在此基础上,Drill不仅支持行业标准的 ANSI SQL,做到开箱即用和快速上手,还支持大数据生态的集成,如 Apache Hive 和 Apache Hbase 等存储系统,即插即用的部署方式。

Apache Drill 关键特性

  • 低延迟的SQL查询。
  • 直接对自描述数据进行动态查询而无需提前定义Schema,如 JSON、Parquet、TEXT 和 Hbase等。
  • 行业标准的查询语法,ANSI SQL。
  • 支持嵌套数据结构。
  • 支持集成Hive。能够查询Hive表和视图,支持所有的Hive数据格式和UDFs。
  • 支持标准的JDBC和ODBC驱动连接BI工具。

看到这里你应该对 Drill 有了一个初步了解了吧。

2. 安装

前置条件:

你已经安装了 JDK 8,安装教程一大把,如果不会可以访问 javapub.net.cn

2.1 下载

注意: 这里下载的是 Apache Drill 1.18.0 版本,下载地址:https://drill.apache.org/download/

2.2 解压

推荐阅读

  1. 部分中文教程 https://drill.apache.org/zh/docs/drill-introduction/
  2. https://github.com/apache/drill
  3. https://drill.apache.org/

标签:教程,Drill,drill,apache,https,SQL,Apache
From: https://blog.51cto.com/wangshiyu/7332531

相关文章

  • 无涯教程-Flutter - 代码测试
    测试是应用程序开发生命周期中非常重要的阶段,它确保了应用程序的高质量,测试需要仔细的计划和执行,这也是开发中最耗时的阶段。Dart语言和Flutter框架为应用程序的自动化测试提供了广泛的支持。通常,可以使用三种类型的测试过程来完全测试应用程序。它们如下-单元测试单元测试是......
  • 无涯教程-Flutter - 国际化
    为了使应用程序能够以不同的语言运行,它首先应找到运行该应用程序的系统语言,然后需要在该特定语言环境中显示其内容,此过程称为"本地化"。Flutter框架提供了三个用于本地化的基类和从基类派生的广泛的实用程序类,以对应用程序进行本地化。基类如下-Locale-语言环境是用于识别用......
  • Flink 1.17教程:任务槽Task Slots和并行度的关系
    任务槽TaskSlots在ApacheFlink中,任务槽(TaskSlots)是指可用于执行并行任务的资源单元。每个任务槽可以看作是一个可用的执行线程或处理单元,用于并行执行作业的不同部分。通俗来说,可以将任务槽想象成一个工作台,而每个工作台上都可以同时进行一项任务。任务槽的数量决定了同时可以......
  • Flink 1.17教程:Standalone会话模式运行时架构及并行度
    运行时架构——Standalone会话模式为例并行度并行度是指在计算过程中同时执行多个任务或操作的能力。在ApacheFlink中,并行度是指同时执行作业中的多个任务或算子的能力。并行度的引入是为了解决以下问题:提高计算速度:通过将任务拆分成多个子任务,并行执行它们,可以大大提高计算速度......
  • Flink 1.17教程:历史服务器History Server
    K8S运行模式容器化部署是如今业界流行的一项技术,基于Docker镜像运行能够让用户更加方便地对应用进行管理和运维。容器管理工具中最为流行的就是Kubernetes(k8s),而Flink也在最近的版本中支持了k8s部署模式。基本原理与YARN是类似的,具体配置可以参见官网说明,这里我们就不做过多讲解了......
  • Flink 1.17教程:并行度设置&优先级
    并行度设置&优先级并行度(Parallelism)并行度的设置在Flink中,可以用不同的方法来设置并行度,它们的有效范围和优先级别也是不同的。代码中设置我们在代码中,可以很简单地在算子后跟着调用setParallelism()方法,来设置当前算子的并行度:stream.map(word->Tuple2.of(word,1L)).setParall......
  • Flink 1.17教程:算子链Operator Chain
    算子链OperatorChain在ApacheFlink中,算子链(OperatorChaining)是将多个操作符(算子)连接在一起形成一个链式结构的优化技术。算子链的作用是将多个操作符合并为一个单一的任务单元,以减少通信开销、提高执行效率和减少资源占用。通俗来说,算子链的作用可以比喻为将多个操作合并成一......
  • Flink 1.17教程:Hadoop yarn会话运行模式
    YARN运行模式_环境准备YARN上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager,Yarn的ResourceManager会向Yarn的NodeManager申请容器。在这些容器上,Flink会部署JobManager和TaskManager的实例,从而启动集群。Flink会根据运行在JobManger上的作业所需要的Slot数量动态分配T......
  • Flink 1.17教程:部署模式介绍及Standalone运行模式
    部署模式介绍在一些应用场景中,对于集群资源分配和占用的方式,可能会有特定的需求。Flink为各种场景提供了不同的部署模式,主要有以下三种:会话模式(SessionMode)、单作业模式(Per-JobMode)、应用模式(ApplicationMode)。它们的区别主要在于:集群的生命周期以及资源的分配方式;以及应用的mai......
  • Flink 1.17教程:Hadoop yarn运行模式——单作业模式和应用模式
    YARN运行模式_单作业模式单作业模式部署(1)执行命令提交作业YARN运行模式_应用模式应用模式同样非常简单,与单作业模式类似,直接执行flinkrun-application命令即可。如:bin/flinkrun-application-tyarn-application-ccom.atguigu.wc.WordCountStreamUnboundedDemo./FlinkTutorial......