02-Spark的应用及使用

时间：2022-08-14 21:47:22浏览次数：62

标签：02 数据源 Hive YARN 应用 SQL Spark 分布式

应用场景
- 离线场景：实现离线数据仓库中的数据清洗、数据分析、即席查询等应用
  - 比较成熟，工作中主要的应用场景
  - 使用Spark对各种数据源数据进行处理：Hive、RDBMS、文件
  - Hive数仓常见处理引擎：Spark、Impala、Presto
  - Impala：底层是C语言，性能最好，SQL开发，集成Hive或者Hbase，语法兼容性较差
  - Presto：底层基于JVM，性能其次，SQL开发，集合各种数据库数据源，纯内存，与Hive兼容性较差
  - Spark：底层基于JVM，支持读写各种大数据平台数据源数据，多种开发语言，与Hive语法完美兼容
- 实时场景：实现实时数据流数据处理，相对而言功能和性能不是特别的完善，工作中建议使用Flink替代
开发语言：Python、Scala、SQL、Java、R
运行模式
- 本地模式Local：程序运行在本地，不是分布式的，只启动1个进程运行所有Task任务，一般用于测试
- 集群模式Cluster
  - Standalone：Spark自带的一个分布式资源管理平台，可以将Spark直接运行在自带的平台中
  - YARN：Hadoop中的一个公共的分布式资源管理平台，可以将Spark程序提交到YARN中运行
  - Messos：类似于YARN，国外用的比较多
  - K8s：分布式资源容器平台

标签：02,数据源,Hive,YARN,应用,SQL,Spark,分布式
From： https://www.cnblogs.com/z-h-q/p/16586401.html

[官方 MVS(MSDN)][Windows 11 CO-21H2] 2022年7月映像更新 - 22000.795
简体中文-消费者版（2022年7月更新-22000.795）家庭版、家庭单语言版、教育版、专业版、专业教育版、专业工作站版(6)文件: zh-cn_windows_11_consumer_editions_......
03-Spark的计算流程设计
MR的计算流程设计step1：读取数据：Input功能一：实现分片，将读取到的数据进行划分，将不同的数据才能分给不同Task功能二：转换KVstep2：处理数据：Map、Shuffle、ReduceMap：负......
2022年谷歌Chrome等浏览器在线打开编辑保存微软Office/金山WPS的Word、Excel和PPT技术
一、行业背景长久以来，在IE、Chrome45及Firefox53以下版本的浏览器网页中，可直接或间接调用微软免费开源的ActiveX控件DsoFramer或参考DsoFramer实现的一些收费NPAPI办公......
【2022.8.12】MySQL数据库（1）
今日内容概要主体：数据库(入门核心)数据存取演变史数据库软件应用史数据库的本质数据库的分类MySQL数据库基本使用系统服务制作基本SQL语句今日内容详细数......
"蔚来杯"2022牛客暑期多校训练营7
比赛链接：https://ac.nowcoder.com/acm/contest/33192C.ConstructiveProblemsNeverDie题意：已知序列\(a\)，找出一个排列\(p\)使得\(a_i!=p_i(1<=i<=n)\)。......
CodeForces-1702G Passable Paths
PassablePathsLCA在树上找到形容一条链，只用找到链的两个端点即可，因此这题的初始想法就是找端点第一个端点：深度最深的地方第二个端点：离第一个端点最远的那个点找到两......
洛谷P6812「MCOI-02」Ancestor 先辈
洛谷P6812对于题目的区间加法明显可以用线段树或树状数组进行并且由题可得，先辈序列即为不下降序列，需满足ai<aj&&i<j判断一个序列是否为先辈我们比较的是一个元素和前一......
Java基础的简单应用
packagecom.zhou.partise;importjava.util.Scanner;publicclassTest01{publicstaticvoidmain(String[]args){//写一个计算器，要求实现加减乘除功能，并......
2022河南萌新联赛第（六）场：郑州大学（ACDFHKL）
https://ac.nowcoder.com/acm/contest/39114C盲打（模拟）大写的时候就多个shift键就......
C++ while/for循环的简单应用 1到100相加
1.while循环：#include<iostream>usingnamespacestd;intmain(){intb=1;intsum=0;while(b<101){sum+=b;b++;......

02-Spark的应用及使用

相关文章

赞助商

阅读排行