spark springboot 实例WordCount.scala20221021

时间：2022-10-21 18:13:08浏览次数：51

标签：netty springboot val WordCount sc spark SparkConf

spark解析aa.txt

1、aa.txt

2、pom.xml
　　<dependency>
　　　　<groupId>org.apache.spark</groupId>
　　　　<artifactId>spark-core_2.11</artifactId>
　　　　<version>2.1.1</version>
　　　　<exclusions>
　　　　　　<exclusion>
　　　　　　<groupId>io.netty</groupId>
　　　　　　<artifactId>netty-all</artifactId>
　　　　　　</exclusion>
　　　　</exclusions>
　　</dependency>
　　<dependency>
　　　　<groupId>io.netty</groupId>
　　　　<artifactId>netty-all</artifactId>
　　　　<version>4.1.17.Final</version>
　　</dependency>
　　<dependency>
　　　　<groupId>org.apache.hadoop</groupId>
　　　　<artifactId>hadoop-client</artifactId>
　　　　<version>2.6.2</version>
　　</dependency>

3、添加scala SDK

4、WordCount.scala

import org.apache.spark.{SparkConf, SparkContext}

object WordCount {
　　def main(args: Array[String]): Unit = {

　　// 1. 创建 SparkConf对象, 并设置 App名字, 并设置为 local 模式
　　val conf: SparkConf = new SparkConf().setAppName("WordCount").setMaster("local[*]")

　　// 2. 创建SparkContext对象
　　val sc = new SparkContext(conf)

　　// 3. 使用sc创建RDD并执行相应的transformation和action
　　val lineRDD = sc.textFile(args(0))
　　val wordCount: Array[(String, Int)] =lineRDD.flatMap(_.split(" "))
　　.map((_, 1))
　　.reduceByKey(_ + _)
　　.collect()
　　wordCount.foreach(println)

　　// 4. 关闭连接
　　sc.stop()
　　}
}

5、调试配置

6、输出结果

参考 https://cloud.tencent.com/developer/article/1733758

标签：netty,springboot,val,WordCount,sc,spark,SparkConf
From： https://www.cnblogs.com/smallfa/p/16814399.html

SpringBoot整合ES+Kibana
前言：最近在写一个HTTP代理服务器，记录日志使用的是ES，所以涉及到SpringBoot和ES的整合，整合完毕后又涉及到数据可视化分析，所以使用了Kibana进行管理，有些坑，需要记录一下Spri......
SpringBoot集成MQTT的步骤和注意事项
最近项目用到了mqtt，所以记录下SpringBoot集成MQTT的步骤和注意事项，整理一下知识，方便自己和他人。一、pom文件里引入maven依赖jar包<dependency><groupId>org.sprin......
SpringBoot集成Bootstrap-Swagger-ui，现在叫knife4j，功能更强大
离线文档格式很全面集成方式1、添加maven<dependency><groupId>com.github.xiaoymin</groupId><artifactId>knife4j-spring-boot-starter</artifactI......
spark scala 安装 window20221021
1、spark安装http://archive.apache.org/dist/spark/spark-2.2.0/spark-2.2.0-bin-hadoop2.7.tgz 环境变量：创建SPARK_HOME：D:\spark-2.2.0-bin-hadoop2.7Path......
SpringBoot 使用枚举接受参数
原文: https://www.zhangshengrong.com/p/2Y1kzqzgXZ/ 接口开发过程中不免有表示类型的参数，比如0表示未知，1表示男，2表示女。通常有两种做法，一种是用数字表示，另一......
微信小程序基于vant和springboot实现附件上传和预览
前言图片上传和预览在移动端应用非常广泛和频繁，vant组件库van-uploader组件已经帮我们实现了大部分功能，但是在系统中频繁使用还是有点麻烦，我们根据自身的业务系统重新封装了......
springboot项目引入自己开发的jar包的处理方法
在开发过程中自己创建了一个jar包，调试没有问题，但是build的时候提示找不到jar包。这是因为在maven仓库中找不到自定义的jar包。解决办法：一种是将jar包安装到本地maven仓......
Springboot 项目普通类调用 Mapper 接口使用 MybatisPlus 报错：空指针异常(NullPointer
Springboot项目普通类调用Mapper接口使用MybatisPlus报错：空指针异常(NullPointerException)报错开发时，在普通类调用Mapper接口使用MabatisPlus功能时会报出......
基于springboot高考填报志愿综合参考系统设计与实现-计算机毕业设计源码+LW文档
摘要：高考填报志愿综合参考系统是针对目前高考填报志愿管理的实际需求，从实际工作出发，对过去的高考填报志愿综合参考系统存在的问题进行分析，完善用户的使用体会。采用计算机系......
SpringBoot+MybatisPlus--文件上传和下载实例
文件上传时，file是一个临时文件，需要转存到指定位置，否则本次请求完成后临时文件就被删除Controller后台代码：packagecom.itheima.reggie.controller;importcom.itheima......

spark springboot 实例WordCount.scala20221021

相关文章

赞助商

阅读排行