首页 > 编程语言 >8 在IPython Notebook 运行Python Spark 程序

8 在IPython Notebook 运行Python Spark 程序

时间:2024-03-29 17:33:18浏览次数:28  
标签:PYSPARK Python DRIVER hadoop PYTHON Notebook IPython

8.1安装Anaconda

下载:wget https://mirrors.pku.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh

安装:bash Anaconda3-5.3.1-Linux-x86_64.sh -b

编辑~/.bashrc:sudo gedit ~/.bashrc

 source ~/.bashrc

查看python版本

 在data1,data2按同样的方法安装Anaconda

8.2在IPython Notebook使用Spark

创建工作目录:

mkdir -p ~/pythonwork/ipynotebook

cd ~/pythonwork/ipynotebook

输入:PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark,进入IPython Notebook界面

 新建一个ipython notebook,命名为test。

 测试(记得开hadoop集群):

 8.3使用IPython Notebook 在Hadoop YARN - client模式运行

 启动Hadoop集群:start-all.sh

关闭hadoop安全模式: bin/hadoop dfsadmin -safemode leave

输入:PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop MASTER=yarn-client pyspark

重新运行test文件

 8.4.使用IPython Notebook在Spark Stand Alone模式运行

启动spark: /usr/local/spark/sbin/start-all.sh

输入命令:PYSPARK_DRIVER_PYTHON=ipython PYSPARK_DRIVER_PYTHON_OPTS="notebook" MASTER=spark://master:8081 pyspark --num-executors 1 --total-executor-cores 2 --executor-memory 512m

运行test:

进入master:8080 可以看到正在运行的PysparkShell

 

标签:PYSPARK,Python,DRIVER,hadoop,PYTHON,Notebook,IPython
From: https://www.cnblogs.com/leexiao/p/18103598

相关文章

  • 强烈建议 | 想转行Python最好看一下这篇文章
    python现在非常火,语法简单而且功能强大,很多同学都想学Python!最近陆陆续续有很多小伙伴问我,学Python到底应该做什么,从事哪种岗位。下面是我们工作圈里面一些同学的苦恼:一、转行要趁早上面类似的问题还有很多,我请了一些不同岗位的嘉宾来给大家分享经验,下面谈谈我的感悟:......
  • Python工具箱系列(五十一)
    九宫格与词云对图片进行九宫格切割,并且放到微信朋友圈曾经风靡一时。对于python来说,这个也非常简单。fromPILimportImageimportmathdefninerectanglegrid(inputfilename):"""实现九宫格切割Args:inputfilename(string):输入文件名称""......
  • Visual Studio Code & Python教程1简介
    1简介VisualStudioCode是一款开源代码编辑器,可免费使用,完全支持Python编程语言的开发。它具有一些有用的功能,例如与世界各地的其他程序员进行实时协作。本章旨在介绍VSCode,帮助您了解其开发过程及其不同组件。我们将讨论为什么它可能是最受欢迎的代码编辑器,了解它的功能,并讨......
  • python根据达芬奇场景分析保存的edl文件,智能裁切输出4K视频画面(不带声音)-自动找到MP
    使用前先将mp4对应的EDL文件命名为相同的名字,如:春天.mp4,春天.edl只处理持续时间大于5帧的画面importcv2importosimporttimeimportdatetimeimportshutilfrommoviepy.editorimportVideoFileClip#读取切分文件defreadQiFenWenJian(filename):withopen(......
  • 【python】深入探讨flask是如何预防CSRF攻击的
    ✨✨欢迎大家来到景天科技苑✨✨......
  • python项目练习——8.图像处理应用程序
    项目功能分析:这个项目可以让用户上传图片,并对图片进行基本的处理,比如调整大小、应用滤镜、添加水印等。这个项目涉及到图像处理、文件上传、用户界面设计等方面的技术。代码示例:fromflaskimportFlask,render_template,requestfromPILimportImage#初始化Flask......
  • python 列表、元组、字典、集合的区别
    目录列表(List)元组(Tuple)字典(Dictionary)集合(Set)列表(List)有序:列表中的元素是有序的,可以通过索引访问。可变:你可以修改列表,比如添加、删除或改变元素。可重复:列表可以包含重复的元素。语法:使用方括号 [] 定义,元素用逗号分隔。应用场景:当你有一个元素......
  • 肖sir__ python自动化之selenium9.1
    python+seleniumselenium是一个第三方库,python有很多库;1、什么是ui自动化?通过模拟手工操作用户ui页面的方式,用代码去实现自动化操作和验证的行为。2、ui自动化的有点?(1)解决重复性的功能测试和验证(2)减少测试人员在回归测试时用例漏测和验证点的漏测(3)减少冒烟测试,回归测试的......
  • Python学习的十个阶段:学完即可神功大成,看看你在哪个阶段
    今天给大家整理了Python学习的十个阶段内容,看看你现在正处于哪个阶段,想学习的朋友也可以根据这个阶段规划学习。阶段一:Python基础【初入江湖】Linux基础目标:1、熟练使用Linux系统进行开发活动2、掌握Linux下编辑器的使用内容:Python开发环境搭建和学习方法介绍认识......
  • Python装饰器实战:实现优雅的重试机制
    重试机制在编程中是比较常见的场景,主要被用于处理那些可能由于临时性故障或网络波动等原因而失败的操作。本文介绍如何通过Python装饰器来实现重试机制,从而能够在尽量少修改现有代码的基础上,给其中某些函数加上重试机制。1.概要关于Python的装饰器,只是一个语法糖,原理也比较简......