首页 > 其他分享 >11.28日记

11.28日记

时间:2023-11-28 20:02:50浏览次数:30  
标签:SparkContext 11.28 String SparkSession RDD Emp 日记

SQL方式操作

1.实例化SparkContext和SparkSession对象

2.创建case class Emp样例类,用于定义数据的结构信息

3.通过SparkContext对象读取文件,生成RDD[String]

4.将RDD[String]转换成RDD[Emp]

5.引入spark隐式转换函数(必须引入)

6.将RDD[Emp]转换成DataFrame

7.将DataFrame注册成一张视图或者临时表

8.通过调用SparkSession对象的sql函数,编写sql语句

9.停止资源

标签:SparkContext,11.28,String,SparkSession,RDD,Emp,日记
From: https://www.cnblogs.com/zhangmingmkzj/p/17862849.html

相关文章

  • 11.28每日总结
    今天首先完成了大型数据库的第四次实验,这一次实验是比较系统的对比了mysql,hbase,redis和mongoDB这几个数据库,其中包括关系型也包括非关系型。然后进一步完善了人机交互的实验和,大作业,并将其打包成册。最后作为企业文化课的组长,给我的组员安排了我们大作的分工。......
  • 11.28
    [实验任务一]:旅行方式的选择旅游的出行方式有乘坐飞机旅行、乘火车旅行和自行车游,不同的旅游方式有不同的实现过程,客户可以根据自己的需要选择一种合适的旅行方式。  JAVApackagerjsj.no23; publicclassBicycleStrategyimplementsTravelStrategy{   @Override......
  • 2023.11.26 日记
    啦啦啦,啦啦啦,我是爆int的小行家!不看DataConstraint就开int,一边写,一边叫:今天的题目真正好!七道题目都~要~A~K~了~……事情是,昨天abcf题我愣是没想出哪里出了问题。今天我开始肉眼查bug。我看到二分,心底突然涌起一种无法言表的感觉,愈看愈怪。intans,L=0,R=1e9;whi......
  • 2023.11.25 日记 OI·与否
    我揉了揉疲劳的脖子。白天是照常的模拟赛,题目简单但我的分数并不如意。晚上回来做AtCoderabc。打得也不好,C题太着急了,思路乱了十几分钟。F题现在还没调过。赛前定了切G的目标,但好像实力未到。全榜居然只有3个人切。我大概已经有了一个较为放松的OI心态了。我深知......
  • 11.25日记
    Flume是一种可靠、高可用的分布式系统,用于在数据源和目的地之间可靠地收集、聚合和移动大量数据。Flume是Apache软件基金会下的开源软件,最初由Cloudera公司开发。它主要用于将数据从不同来源收集到Hadoop分布式存储系统中,以便进行大数据分析。Flume基于流式数据流模型,它将数据源分......
  • 2023.11.24 日记 夜浓浓
    轻闲的一天。夜浓浓地笼罩在窗外,远远地依稀见到明暗的城市灯火。白日久违地听孙佳讲课,内容是没细听了,只是边学着英语的《语法通霸》边挂着一只耳朵听讲(纪中的英语老师笑着对我们仨说,挂着一只耳朵听课。她没有解释下去,我约摸是边做自己的事边听课,偶尔会被课堂吸引。不知这样是否是......
  • 11.23日记
    MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义:(1)MapReduce是一个基于集群的高性能并行计算平台(ClusterInfrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。(2)MapReduce是一个并行计算与运行软件......
  • 11.24日记
    前面有提到MapReduce框架采用非循环式的数据流模型,把中间结果写入到HDFS中,带来了大量的数据复制、磁盘IO和序列化开销。且这些框架只能支持一些特定的计算模式(map/reduce),并没有提供一种通用的数据抽象。因此出现了RDD这个概念。RDD(ResilientDistributedDataset)叫做弹性......
  • 11.22日记
    可以看到,主要就是json格式的参数这一块怎么写。后面会说,先说说前置工作。html里的代码也要做些修改。原来你的代码是这样写的:<div>sos</div>假如这个内容是数据库中id为3的记录字段名为name的内容,现在我们想双击这个DIV可以修改,修改完后再提交到后端。我们要这样来修改: <divmodi......
  • 2023.11.22 日记g
    今天又来机房了。本来最近没啥训练的心情的,奈不过sx热情万分。噢噢,下午和同学打球去了又没有洗澡,吃完饭回教室已经有点晚迟到了,然后lsx提议直接来机房,我曰:“善!”然后改了上一场arc的b、c、d。感觉大脑出现了一些问题。不过最终还是完成了任务。然后今天whk还是一如既往......