Apache Drill
https://github.com/apache/drill
前言
这里更偏向于应用,而不是将官方文档翻译给你。
Apache Drill 是阿帕奇的顶级项目,但是它的中文文档很少,这篇文档将帮你了解如何使用 Apache Drill。并且会在文末整理一些专业的文档供你参考学习。
当然如果你是官网爱好者,那么你可以直接访问官网:https://drill.apache.org/。
适合人群
- 初学者
- 临时使用者
- 想了解 Apache Drill 的人
1. 概述
如果你看到这篇文章,相信你对 Drill 已经有所了解,如果你还不了解 Drill,请看下面的简要介绍。
Apache Drill是一款开源的数据探索工具,一个分布式SQL查询和分析引擎。它包含了很多专有的设计,来进行高性能分析,支持半结构化数据源(JSON、XML和日志等)和基于应用不断创新的数据格式。在此基础上,Drill不仅支持行业标准的 ANSI SQL,做到开箱即用和快速上手,还支持大数据生态的集成,如 Apache Hive 和 Apache Hbase 等存储系统,即插即用的部署方式。
Apache Drill 关键特性
- 低延迟的SQL查询。
- 直接对自描述数据进行动态查询而无需提前定义Schema,如 JSON、Parquet、TEXT 和 Hbase等。
- 行业标准的查询语法,ANSI SQL。
- 支持嵌套数据结构。
- 支持集成Hive。能够查询Hive表和视图,支持所有的Hive数据格式和UDFs。
- 支持标准的JDBC和ODBC驱动连接BI工具。
看到这里你应该对 Drill 有了一个初步了解了吧。
2. 安装
前置条件:
你已经安装了 JDK 8,安装教程一大把,如果不会可以访问 javapub.net.cn
2.1 下载
注意: 这里下载的是 Apache Drill 1.18.0 版本,下载地址:https://drill.apache.org/download/
2.2 解压
推荐阅读
- 部分中文教程 https://drill.apache.org/zh/docs/drill-introduction/
- https://github.com/apache/drill
- https://drill.apache.org/