首页 > 其他分享 >SparkContext介绍

SparkContext介绍

时间:2023-02-21 22:33:49浏览次数:33  
标签:SparkContext PySpark 创建 介绍 集群 Spark 上下文

想要使用PySpark库完成数据处理,首先需要构建一个执行环境上下文对象,PySpark的执行环境上下文是SparkContext。SparkContext是Spark应用程序的主要入口,其代表与Spark集群的连接,能够用来在集群上创建RDD,创建共享变量,访问Spark服务。作业的提交,应用的注册,任务的分发都是在SparkContext中进行的。每个JVM里只能存在一个处于激活状态的SparkContext,在创建新的SparkContext之前,需要先关闭之前创建的SparkContext。

在spark-shell、pyspark、databricks等这种交互式的环境中,已经默认帮我们创建好了SparkContext,直接用sc可以得到SparkContext。对于我们开发的需要提交到集群运行的代码,则需要自己创建SparkContext。

标签:SparkContext,PySpark,创建,介绍,集群,Spark,上下文
From: https://blog.51cto.com/u_15943369/6077087

相关文章

  • Go 中的反射 reflect 介绍和基本使用
    一、什么是反射在计算机科学中,反射(英语:reflection)是指计算机程序在运行时(runtime)可以访问、检测和修改它本身状态或行为的一种能力。用比喻来说,反射就是程序在运行的时候......
  • 17、神经网络----线性层以及其他层的介绍
    1、正则化层  Normalization Layers对 输入 采用正则化的话,可以加快神经网络的训练速度  也就是通道数的大小2、RecurrentLayers****(特定网络使用)一般用......
  • 一、全国医保接口开发详解(整体介绍)
    一、开发过程1、需求分析第一、首先肯定要仔细阅读接口文档,设计接口系统整体架构,也就是接口系统、HIS系统、医保系统各自的职责。搞清楚文档接口要实现的技术,是调用程......
  • 云小课|MRS基础原理之Flink组件介绍
    阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击......
  • vue-cli创建项目、项目目录介绍、es6导入导出语法、小练习-登录功能、scoped
    目录1vue-cli创建项目2vue项目目录介绍3es6导入导出语法3.1App.vue,main.js,About.vue写了什么3.2导入导出语法3.2vue项目编写步骤4小练习-登录功能4.1App.vue动......
  • FFmpeg的overlay滤镜介绍
    前面介绍FFmpeg滤镜的文章,其实埋了一个坑,滤镜实例有输入跟输出。但是往buffer滤镜实例输入的AVFrame不是无限的,总会有读完文件的一刻。从buffersink滤镜实例输出的......
  • redis-数据结构介绍
    redis的数据结构介绍redis的数据结构redis存储的是:key,value格式的数据,其中key都是字符串,value有五种不同的数据结构value的数据结构:字符串类......
  • 03 Proxmox VE介绍
    突破困境!企业开源虚拟化管理平台使用ProxmoxVirtualEnvironment郑郁霖(JasonCheng)著版次:2021年12月初版03ProxmoxVE介绍3.1开发背景ProxmoxVE是由位在奥......
  • 瑞吉外卖项目介绍
    一、项目介绍本项目(瑞吉外卖)是专门为餐饮企业(餐厅、饭店)定制的一款软件产品,包括系统管理后台和移动端应用两部分。其中系统管理后台主要提供给餐饮企业内部员工使用,可......
  • 推荐系统[一]:超详细知识介绍,一份完整的入门指南,解答推荐系统相关算法流程、衡量指标和
    1.推荐算法的初步理解如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本......