首页 > 其他分享 >1/13 学习进度笔记

1/13 学习进度笔记

时间:2024-01-13 23:25:57浏览次数:27  
标签:类库 SparkContext 13 PySpark Python pyspark 笔记 进度 Spark

今日安装了PySpark库以及学习了如何在Windows系统中通过SSH远程连接Linux系统使用Python语言来开发Spark程序 什么是PySpark   我们前面使用过bin/pyspark 程序, 要注意, 这个只是一个应用程序, 提供一个Python解释器执行环境来运行Spark任务我们现在说的PySpark, 指的是Python的运行类库, 是可以在Python代码中:import pyspark PySpark 是Spark官方提供的一个Python类库, 内置了完全的Spark API, 可以通过PySpark类库来编写Spark应用程序,并将其提交到Spark集群中运行.

 

Python语言开发Spark程序步骤? 主要是获取SparkContext对象,基于SparkContext对象作为执行环境入口,下图是WordCount案例

 

 

如何提交Spark应用?   将程序代码上传到服务器上, 通过spark-submit客户端工具进行提交

 

标签:类库,SparkContext,13,PySpark,Python,pyspark,笔记,进度,Spark
From: https://www.cnblogs.com/yuncannotjava/p/17963181

相关文章

  • 1.13学习进度
       初始化DAGScheduler和TaskScheduler调度器,SparkDeploySchedulerBackend,以及在其内部启动DriverEndpoint和ClientEndpoint。   其中:       ClientEndpoint:用于向Master注册应用程序       DriverEndpoint:用于发送任务给work中的executor     ......
  • gin学习笔记(三)—— 会话管理
    会话管理HTTP会话管理HTTP协议的特点是一问一答(请求然后响应)。基本上,Web应用都实现了用户管理,因此当用户发送请求时,服务器要能识别出是哪个用户,最简单的方法就是客户端每次请求,都附上用户信息。这样既不安全也不高效,故提出会话(Session),会话一般存储用户信息。服务端会话(S......
  • 学习笔记4
    RDD操作对于RDD而言,每一次转换操作都会产生不同的RDD,供给下一个“转换”使用,转换得到的RDD是惰性求值的,也就是说,整个转换过程只是记录了转换的轨迹,并不会发生真正的计算,只有遇到行动操作时,才会发生真正的计算,开始从血缘关系源头开始,进行物理的转换操作;常用的RDD转换操作,总结如下......
  • 大三寒假学习进度笔记4
    今日学习时间两小时,开始学习RDD的内容,学习了RDD的创建和RDD算子的定义分类RDD学习:RDD五大特征:RDD是有分区的分区是RDD数据存储的最小单位计算方法会作用到每一个分区上RDD之间是由相互依赖的关系的KV型RDD可以有分区器KV型RDD:存储的数据是二元元组RDD分区数据的读取会尽......
  • CF-613-D
    613-D题目大意给定一颗\(n\)个节点的树。\(q\)组询问,每组询问给定\(k\)个点,问至少要删除树中多少个点才能使这\(k\)个点两两不连通,无解则输出\(-1\)。这里\(\sum{k_i}\)的规模大致和\(n\)相当。Solution虚树模板题。暴力的做法是每组询问都对整棵树进行遍树形DP,复杂度为\(......
  • 2024/1/13 算法笔记
    1.二分查找的原则当要查找的值target>mid就在mid和right中查找当要查找的值target<mid就在left和mid中查找对于边界条件的处理:while(l<r)mid的取值是[l,r)重点是下面部分,直接决定使用哪个二分模板。1.3中间值归属问题这个问题其实比较灵活,这里我只讨论3种情况,其余情况......
  • Python学习笔记
    Python学习因为我之前使用Python复现算法,所以环境早已经进行了配置要点简介脚本语言是一种介乎于HTML和诸如JAVA、VisualBasic、C++等编程语言之间的一种特殊的语言,尽管它更接近后者,但它却不具有编程语言复杂、严谨的语法和规则。有一些脚本语言已经发生了变化,如Py......
  • 闲话1.13
    为啥没有模拟赛的日子这么无聊啊......
  • 1.13寒假每日总结4
    今天,主要尝试了在java中调用已有的python脚本并输出相关信息。 参考:百度文心一言的回复。 packagetest0113;importjava.io.*;publicclasstest{publicstaticvoidmain(String[]args){try{//指定Python解释器的路径......
  • 每日总结2024/1/13(白盒技术)
    第一节:什么是白盒测试?白盒测试是软件测试技术,白盒测试也称结构测试或逻辑驱动测试,是针对被测单元内部是如何进行工作的测试。它根据程序的控制结构设计测试用例,主要用于软件程序验证。白盒测试中也称为透明盒测试、基于代码的测试和玻璃盒测试。它是BoxTesting软件测试方法之一......