大数据分析———（2）准备工作

时间：2023-02-18 22:13:26浏览次数：50

标签：数据分析 Scala 启动 bashrc 工作 3.2 准备 Spark 目录

3.2.1 环境安装

本次项目使用Spark进行数据清洗，首先需要安装Scala环境。下载解压后，修改 ~/.bashrc文件，把Scala添加到系统环境变量中。

3.2.2 环境运行

在启动Spark之前，首先要启动Hadoop。进入Hadoop目录后，在sbin下运行./~bashrc启动

然后启动Spark，进入Spark目录，在sbin下运行./~bashrc启动

再进入Spark的bin目录，运行 ./spark-shell ，进入Spark的shell模式。至此，spark已正常启动.

3.2.3 Spark在Eclipse中的运行

在shell界面虽然也可完成数据清洗，但代码的修改和排错较为麻烦。所以把Spark环境添加到Eclipse上，可较为方便的实现代码的修改、排错与重现。

第一步，打开Eclipse界面后，点击左上角的File==>New==>Scala Project，新建Scala项目

第二步，为项目添加构建路径，在项目名上右键==>Build Path==>Configure Build Path…

点击进入构建路径设置界面后，点击Libraries==>Add Extemal JARs…，找到spark目录下的jars目录，全选目录下的jar包，点击确定后完成设置。

标签：数据分析,Scala,启动,bashrc,工作,3.2,准备,Spark,目录
From： https://www.cnblogs.com/yenaibo/p/17133762.html

大数据分析———（1）数据导入
本次数据分析在Hadoop大数据平台的基础上，导入外部数据，使用Spark进行数据清洗，使用Hive进行数据存储，同时使用Tableau进行可视化展示。本次使用数据为《NBA2011-2012季后赛球......
分布式云计算的搭建———（1）前期准备
云计算是硬件资源的虚拟化，相当于我们的计算机和操作系统，将大量的硬件资源虚拟化后再进行分配使用。云计算作为计算资源的底层，支撑着上层的大数据处理，而大数据的发展趋......
关于 Fiori 应用里 SAP UI5 前端开发和 SEGW 后台 OData 服务开发的工作量比值问题
我的知识星球有朋友向我提问：Jerry您好！请问一个中等复杂度的FioriUI5应用，前端代码用freestyle方式纯自己写，后端用SEGW开发Odata服务，前后端的工作量的比值大概是......
RabbitMQ工作原理及应用
工作模式https://www.rabbitmq.com/getstarted.html上图，列出了RabbitMQ的使用模式，学习上面的模式，对理解所有消息队列都很重要。名词解释名词说明server服务......
PBR工作流实现与对比
工作流实现工作流中的核心内容便是贴图，不论是UE4还是Unity都支持将PBR的参数以贴图的形式传入引擎，我们可以根据一个物体同一mesh或不同mesh的不同区域的属性差异来控制贴......
取消EXCEL工作表保护的代码
开始---excel选项----信任中心，启用所有宏点视图里面----宏，录制宏，起好名字，关闭。再点查看宏，编辑宏，把代码贴进去，关闭。再执行宏，等跳出来，你的密码是某某某，工作表保护就解除......
【视频】CNN（卷积神经网络）模型以及R语言实现回归数据分析|附代码数据
全文链接：http://tecdat.cn/?p=18149最近我们被客户要求撰写关于CNN（卷积神经网络）的研究报告，包括一些图形和统计输出。无人驾驶汽车最早可以追溯到1989年。神经网络已经存......
线程池的回调工作函数为什么必须设置成static，类内静态成员函数？
线程池的回调工作函数为什么必须设置成static，类内静态成员函数？pthread_create(pthread_t*thread_tid,constpthread_attr_t*attr,void*(*start_routine)(void*),......
嵌入式ARM设计编程(三) 处理器工作模式
文章和代码已归档至【Github仓库：hardware-tutorial】，需要的朋友们自取。或者关注公众号【AIShareLab】，回复嵌入式也可获取。一、实验目的（1）通过实验掌握学会使用m......
udhcp源码剖析（一）——DHCP服务器和客户端的工作流程
DHCP服务器的工作流程udhcpd，即dhcp服务器，在路由器等网关设备中，DHCP服务器启动后用于给LAN侧和无线终端分配IP、租约和其他网络配置。根据RFC2131文档规范，一个标准的DHCP服......

大数据分析———（2）准备工作

3.2.1 环境安装

3.2.2 环境运行

3.2.3 Spark在Eclipse中的运行

相关文章

赞助商

阅读排行