首页 > 其他分享 >Apache Kylin4 分布式的分析型数据仓库

Apache Kylin4 分布式的分析型数据仓库

时间:2023-11-17 15:25:18浏览次数:51  
标签:Kylin 4.0 数据仓库 Kylin4 版本 Apache Kylin4.0

https://kylin.apache.org/cn/docs/index.html

Apache Kylin4 概述

欢迎来到 Apache Kylin™

Analytical Data Warehouse for Big Data

Apache Kylin™是一个开源的、分布式的分析型数据仓库,提供 Hadoop 之上的 SQL 查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc.开发并贡献至开源社区。

查看其它版本文档:
v3.1 document
v2.4 document
归档

Apache Kylin4.0 是 Apache Kylin3.x 之后一次重大的版本更新,它采用了全新的 Spark 构建引擎和 Parquet 作为存储,同时使用 Spark 作为查询引擎。

Apache Kylin4.0 的第一个版本 kylin4.0.0-alpha 于 2020 年 7 月份发布,此后相继发布 kylin4.0.0-beta 以及正式版本。

为了方便用户对 Kylin4.x 有更全面更深层的了解,本篇文档会着重从 Kylin4.x 与之前版本有何异同的角度对 Kylin4.x 做全面概述。文章分为以下几个部分:

    • 为什么选择 Parquet 替换 HBase
    • 预计算结果在 Kylin4.0 中如何存储
    • Kylin 4.0 的构建引擎
    • Kylin 4.0 的查询引擎
    • Kylin4.0 与 Kylin3.1 功能对比
    • Kylin 4.0 性能表现
    • Kylin 4.0 查询和构建调优
    • Kylin 4.0 用户案例

标签:Kylin,4.0,数据仓库,Kylin4,版本,Apache,Kylin4.0
From: https://www.cnblogs.com/gaoyanbing/p/17838821.html

相关文章

  • 搭建apache服务
    一.web概述基于B/S(Browser/Server)架构的网页服务,服务端提供网页,浏览器下载并显示网页http协议:超文本传输协议Daemon(守护进程)实现Web服务的软件:httpd(Apache)、Nginx、tomcat等Hyper Text Markup Language,超文本标记语言Hyper Text Transfer Protocol,超文本......
  • java: Apache NetBeans IDE 19
     添加.jar文件/***encoding:utf-8*版权所有2023涂聚文有限公司*许可信息查看:*描述:*#Author:geovindu,GeovinDu涂聚文.*#IDE:ApacheNetBeansIDE19windows10Java17*#Datetime:2023-2023/11/16-12:29*#User:g......
  • 长安汽车基于 Apache Doris 的车联网数据分析平台建设实践
    导读:随着消费者更安全、更舒适、更便捷的驾驶体验需求不断增长,汽车智能化已成必然趋势。长安汽车智能化研究院作为长安汽车集团有限责任公司旗下的研发机构,专注于汽车智能化技术的创新与研究。为满足各业务部门的数据分析需求,长安汽车基于ApacheDoris升级了车联网数据分析平台,支......
  • Apache Kafka
    ApacheKafka®是 一个分布式流处理平台.这到底意味着什么呢?我们知道流处理平台有以下三种特性:可以让你发布和订阅流式的记录。这一方面与消息队列或者企业消息系统类似。可以储存流式的记录,并且有较好的容错性。可以在流式记录产生时就进行处理。Kafka适合什么样的场景?它可......
  • Databend 与海外某电信签约:共创海外电信数据仓库新纪元
    海外某电信,是某国的主要国有电信服务供应商,不仅致力于为民众和企业提供全面的电信服务,还肩负着推动国家通信基础设施和信息技术进步的重任。在数字化转型的关键时期,海外某电信选择与Databend携手合作,开启了数据驱动业务决策的新篇章。为什么选择Databend海外某电信面临的主要......
  • Databend 与海外某电信签约:共创海外电信数据仓库新纪元
    海外某电信,是某国的主要国有电信服务供应商,不仅致力于为民众和企业提供全面的电信服务,还肩负着推动国家通信基础设施和信息技术进步的重任。在数字化转型的关键时期,海外某电信选择与Databend携手合作,开启了数据驱动业务决策的新篇章。为什么选择Databend海外某电信面临的主......
  • kylin4.0.1部署过程
    部署环境hadoop3.0.0-cdh6.3.2hive3.1.2kylin4.0.1spark3.1.1一、准备工作1、下载apache-kylin-4.0.1-bin-spark3.tar.gz并解压到本地目录,将spark-3.1.1-bin-hadoop2.7.tgz下载解压后放在kylin目录下2、给解压后的kylin和spark文件夹改个名mvapache-kylin-4.0.1-bi......
  • Apache DolphinScheduler实战(07)-缓存机制
    1缓存目的由于M/S调度过程中,会产生大量数据库读操作,如tenant,user,processDefinition等:对DB产生很大读压力使整个核心调度流程变慢考虑这部分业务数据读多写少,引入缓存模块:减少DB读压力,加快核心调度流程。2缓存设置spring:cache:#defaultenablecache,youcand......
  • windows操作系统中如何将apache zookeeper安装为系统服务
    记录一下,网上有些资料是错的,prunsrv的参数要以--开头!一下载最新版的apachecommonsdaemonhttp://archive.apache.org/dist/commons/daemon/binaries/windows/commons-daemon-1.3.4-bin-windows.zip解压,复制两个exe文件到zk的bin目录下二编写服务停止脚本(启动脚本不用自己......
  • Apache Celeborn
    ApacheCeleborn的背景ApacheCeleborn——快ApacheCeleborn——稳ApacheCeleborn——弹Evaluation一、背景大数据引擎的中间数据有两个来源:Shuffle和Spill,其中最重要的是Shuffle,据统计有超过15%的资源消耗在Shuffle。1.1传统Shuffle的问题下图右侧结构图是传统......