首页 > 其他分享 >每日总结-23.10.30

每日总结-23.10.30

时间:2023-10-31 18:55:48浏览次数:33  
标签:总结 23.10 String SimpleApp 30 import new spark public

今天完成关于hadoop中spark的安装和使用

教程地址:https://dblab.xmu.edu.cn/blog/4322/

https://blog.csdn.net/qq_53336526/article/details/131717423

由于之前安装的hadoop版本为2.7.5,因此spark版本改用2.4.5,maven版本依旧可以使用教程中的3.9.2

另外教程中的所有路径都需要修改成自己一致的

/*** SimpleApp.java ***/
import org.apache.spark.api.java.*;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.SparkConf;
 
public class SimpleApp {
   public static void main(String[] args) {
       String logFile = "file:///usr/local/spark/README.md"; // Should be some file on your system
       SparkConf conf=new SparkConf().setMaster("local").setAppName("SimpleApp");
       JavaSparkContext sc=new JavaSparkContext(conf);
       JavaRDD<String> logData = sc.textFile(logFile).cache();
       long numAs = logData.filter(new Function<String, Boolean>() {
           public Boolean call(String s) { return s.contains("a"); }
       }).count();
       long numBs = logData.filter(new Function<String, Boolean>() {
           public Boolean call(String s) { return s.contains("b"); }
       }).count();
       System.out.println("Lines with a: " + numAs + ", lines with b: " + numBs);
   }
}

 

标签:总结,23.10,String,SimpleApp,30,import,new,spark,public
From: https://www.cnblogs.com/laobing6214/p/17801003.html

相关文章

  • 2023.10.31
    运行超市抹零结账行为代码如下:1print("3107")2money=39.87+24.47+78.07#计算总金额3money_str=str(money)4print("商品总金额:"+money_str)5print("实收金额:{:.0f}".format(money))#进行抹零行为结果如下:计算学生成绩的分差和平均分代码如下:......
  • CSP-S 2022 游记&总结
    智慧神说要写总结,所以就叫总结啦Day-1上午收拾了下行李,中午出发坐高铁去九江了,高铁上本来想临时学一下class的用法的(说不定用得上),结果看着CSDN竟然睡着了......下午四点左右到了,九江在下小雨(话说赣州好久没下雨了QWQ),忘记带伞了,最后还是蹭cjc的伞去的宾馆。晚上收手机前打......
  • 初学C时的变量存储类型总结
    从初学时的C语言,到后面的Java,C++,Python等各种高级程序设计语言,汇编语言等低层语言,变量存储类型都是语言学习很重要的基础。本次以C语言为例,如下图。首先,有多种分类:局部变量和外部变量;动态存储变量和静态存储变量……如典型的static变量有局外部之分,但一定是静态变量。我们常用......
  • Docker导出镜像的总结
    Docker导出镜像的总结安装Dockermkdir-p/etc/dockercat>/etc/docker/daemon.josn<<EOF{"bip":"10.233.0.1/16"}EOFyuminstalldocker-ysystemctlenable--nowdocker下载部分镜像dockerpullredis:7.2dockerpullnginx:1.24docker......
  • 「Log」2023.10.30 小记
    序幕\(\text{6:50}\):昏暗到校,写CF杂题。经过两个小时的思考终于看懂了题解。\(\color{blueviolet}{CF1530F}\)此题是神秘题。考虑反着做,将至少有一行或一列或一条对角线全为\(1\)概率转换为所有行列对角线都至少有一个\(0\)。先不考虑行与对角线,只考虑满足所有列都至少......
  • Kafka-生产者、broker、消费者的调优参数总结
     生产环境下,为了尽可能提升Kafka的整体吞吐量,可以对Kafka的相关配置参数进行调整,以达到提升整体性能的目的。本文主要从Kafka的不同组件出发,讲解各组件涉及的配置参数和参数含义。一、生产者(producer.properties或者代码中)1、acks:Producer需要Leader确认的Producer请求的应答......
  • 亚信科技AntDB数据库通过GB 18030-2022最高实现级别认证,荣膺首批通过该认证的产品之列
    近日,亚信科技AntDB数据库通过GB18030-2022《信息技术中文编码字符集》最高实现级别(级别3)检测认证,成为首批通过该认证的数据库产品之一。图1:AntDB通过GB18030-2022最高实现级别认证GB18030《信息技术中文编码字符集》是我国自主研制的以汉字为主、包含10种我国少数民族文字的超......
  • 大连旅游注意事项 —— 大连千万级博主总结的大连旅游注意事项,看这一个就足够足够了
    在大连生活多年,发现这个视频说的还挺好,很有用:https://haokan.baidu.com/v?vid=12187364321776210763&collection_id=    -------------------------------------------------------------         ......
  • 每日总结
    今天namenode突然无法启动了,查了半天资料和日志发现时namenode没有格式化,但是当我使用hadoopnamenode-format却提示错误,发现是没有权限,最后使用root用户对hadoop用户授权后,成功格式化,但是datanode启动失败。查询资料后发现时因为之前格式化次数太多,导致datanode的ID错误导致的,我......
  • 2023.10.30
    运行超市抹零结账行为代码如下:1print("3107")2money=39.87+24.47+78.07#计算总金额3money_str=str(money)4print("商品总金额:"+money_str)5print("实收金额:{:.0f}".format(money))#进行抹零行为结果如下:计算学生成绩的分差和平均分代码如下:......