首页 > 数据库 >Apache Presto:一个统一多数据源的SQL查询引擎

Apache Presto:一个统一多数据源的SQL查询引擎

时间:2023-10-25 23:12:27浏览次数:52  
标签:Presto 数据源 查询 开源 SQL Apache

Apache Presto 是一个开源的分布式 SQL 查询引擎,它可以在大数据环境下进行交互式的数据分析。Presto 允许用户使用熟悉的 SQL 语法在不同的数据源上进行查询,比如 Hive、Cassandra、PostgreSQL、Kafka、MySQL、ElasticSearch 等,让用户可以在不同数据源上进行统一查询。

Presto标志

Presto 的架构由 Coordinator、Worker 和 Connector 三部分组成。Coordinator 接收来自客户端的查询,生成查询计划,并把计划分发给 Workers 执行;Workers 实际执行查询计划,并返回结果给 Coordinator;而 Connector 则允许 Presto 连接到各种不同的数据源,让用户可以在单个查询中结合来自多个数据源的数据。

Presto 的主要功能和优势有:

  1. 支持跨多数据源的查询:通过 Connector 接口可以支持许多不同数据源,让用户可以在单个查询中使用来自多个数据源的数据,提供一致的视图。

  2. 支持标准的 ANSI SQL 语法:在大数据环境下提供交互式的 SQL 查询能力,提供统一的 SQL 接口进行查询,允许用户使用熟悉的 SQL 语言进行复杂的数据查询和分析。

  3. 高度可扩展:采用计算分离架构,可以方便的增加 Worker 节点来扩展计算能力,避免单点故障,支持海量数据分析。

  4. 低延迟响应:通过内存中执行查询和高效矢量化执行引擎,支持近实时的交互分析。

  5. 开源免费:Presto 是由 Facebook 开源并捐赠给 Apache 软件基金会的开源项目,有活跃的社区支持和开发。

Presto 是一个非常优秀的大数据交互式分析工具。它的分布式架构、低成本、高扩展性和强大的 SQL 支持,使其可以支撑极大的数据量和复杂的分析场景。如果你正寻找一个实时并可横跨多数据源进行大数据分析的利器,Presto 无疑是一个不错的选择。

标签:Presto,数据源,查询,开源,SQL,Apache
From: https://www.cnblogs.com/iuiuu/p/presto-intro.html

相关文章

  • SQL Server中NULL的一个测试
    SQLServer中NULL的一个测试 我们都知道SQLServer中NULL是一个很特殊的存在,因为NULL不会等于任何值,且NULL也不会不等于任何值。对于NULL我们只能使用IS或ISNOT关键字来进行比较。 我们先来看看下面一个SQL查询,由于NULL不会等于任何值,所以毫无疑问下面的查询会返回0:SEL......
  • maven创建普通java项目访问mysql-仅jdbc
    已知:1、maven对普通Java项目的创建,参考 https://www.cnblogs.com/wanjinliu/p/17706089.html 。2、java常规访问mysql数据库,需要用到jdbc驱动。调用的jar包,最新为“mysql-connector-j”--这个名字可以不记得,看见能认识它就行。包、类入门用法,参考 https://www.cnblogs.com/......
  • mysql的regex匹配多个字符串且不包含子串
     mysql的regex匹配多个字符串且不包含子串,regex使用、mysqlregex使用、mysqlregex详解、regex的高级使用 camera_label字段是以逗号分割的字符串 1.查询包含 camera_2标签的数据select*fromdevice_info_datawherescope_type=2andcamera_labelREGEXP('came......
  • KubeSphere v3.4.0 创建Mysql 8.1.0 数据库主从记录
    主要讲下KubeSphere中创建【有状态】的【工作负载】需要注意的配置问题。这里的创建过程也不详细描述,网上简单找一找也有。重点在使用存储里面的配置字典:1、先创建一个配置字典,参考名:mysql-config2、创建一主一从的配置项,键(主库):master-1.cnf值(主库):[mysqld]port......
  • pyspark.sql处理多分隔符数据文件生成DF案例
    pyspark程序清洗多分隔符数据案例原始数据可以看到原始数据是以“|#$”多分隔符进行数据分割的POD9_6ec8794bd3297048d6ef7b6dff7b8be1|#$2023-10-24|#$0833|#$#|#$#|#$99999999999|#$#|#$12345678912POD9_352858578708f144bb166a77bad743f4|#$2023-10-24|#$0391|#$#|#$#|#$99......
  • windows安装MySQL8.0.20
    一、下载地址(zip版):https://downloads.mysql.com/archives/community/二、安装mysql8.0.201、解压缩至目录D:\software\mysql-8.0.20-winx642、新建my.ini文件在D:\software\mysql-8.0.20-winx64目录下新建my.ini文件注意:需要将配置文件中的basedir和datadir的值改成自己......
  • sql高级实践
    sql高级实践情景还原:在企业中心中,开通岗位风控的企业一共有13个,要在数据大屏中统计这13个企业的单元,事件,管控措施,任务数。难点解析:device表,risk_unit表,risk_event表,risk_measure只有device表有company_id。重点在于13个企业不是每个企业都有从装置往下的一个完整的数数据树的......
  • sql 审核工具 archery
    这里使用git下载gitclonehttps://gitee.com/rtttte/Archery.git使用docker-compose进行部署cdArchery/src/docker-compose执行部署命令docker-compose-fdocker-compose.ymlup-d初始化操作#表结构初始化dockerexec-tiarchery/bin/bashcd/opt/arche......
  • 多款国产操作系统安装数据库干货文档汇总(含Oracle/MySQL/国产数据库等)
    随着国产化的逐步推进,越来越多的企业选择将数据库安装在国产操作系统上。为帮助大家了解国产操作系统上的数据库成功搭建案例与搭建方式,本文整理了墨天轮数据技术社区上用户分享的实操文档,涵盖银河麒麟、中标麒麟、统信UOS、openEuler等常见的国产操作系统,数据库以Oracle为主,此外......
  • MySQL
    MySQL概述MySQL连接语法mysql -u用户名 -p密码[-h数据库服务器IP地址 -p端口号]关系型数据库:(RDBMS)建立在关系模型基础上,由多张相互连接的二维表组成的数据库特点:使用表存储数据,格式统一,便于维护使用SQL语言操作,标准统一,使用方便,可以用于复杂......