学习进度笔记6

学习进度笔记6

时间：2024-01-17 23:14:42浏览次数：37

Spark SQL 基本操作将下列 JSON 格式数据复制到 Linux 系统中，并保存命名为 employee.json。 { "id":1 , "name":" Ella" , "age":36 } { "id":2, "name":"Bob","age":29 } { "id":3 , "name":"Jack","age":29 } { "id":4 , "name":"Jim","age":28 } { "id":4 , "name":"Jim","age":28 } { "id":5 , "name":"Damon" } { "id":5 , "name":"Damon" } 为 employee.json 创建 DataFrame，并写出 Scala 语句完成下列操作： (1) 查询所有数据 (2) 查询所有数据，并去除重复的数据； (3) 查询所有数据，打印时去除 id 字段； (4) 筛选出 age>30 的记录； (5) 将数据按 age 分组； (6) 将数据按 name 升序排列； (7) 取出前 3 行数据； (8) 查询所有记录的 name 列，并为其取别名为 username； (9) 查询年龄 age 的平均值； (10) 查询年龄 age 的最小值。

标签：name,age,Jim,笔记,查询,学习,进度,数据,id
From： https://www.cnblogs.com/jm56/p/17971413

RabbitMQ学习四 java客户端连接RabbitMQ
RabbitMQ的工作模式，可以参考官网：https://www.rabbitmq.com/getstarted.html一、简单方式以下两种都是生产者直接发消息给队列，不通过交换机。且发送给队列的消息只能被消费一次。比如一个队列被C1和C2消费，在队列中的消息只会被一个消费者消费。生产者代码逻辑图代码如下：p......
算法笔记之图论
打开转盘锁你有一个带有四个圆形拨轮的转盘锁。每个拨轮都有10个数字：'0','1','2','3','4','5','6','7','8','9'。每个拨轮可以自由旋转：例如把'9'变为'0'，'0'变为......
人工智能第三版阅读笔记：第一章
人工智能：第一章本章展示了人工智能的概貌，包括人工智能的定义、分类、发展、学科、应用以及方法。使读者了解了人工智能领域的一些基本概念，并对该学科的内容有了大致的了解。人工智能概述人工：非自然形成的、人造的。智能：R.斯腾伯格的定义--智能是个体从经验中学习、正确推理、......
学习构建北京市政百姓信件分析实战案例
学习构建北京市政百姓信件分析实战案例是一个综合性的任务，需要使用多种技术和工具。以下是每个步骤的简要说明：1.采集北京市政百姓信件内容：在这一步，你需要建立一个系统来收集北京市政百姓的信件内容。可以使用网络爬虫技术，访问相关政府网站或公共平台，从中抓取信件数据。确保你的数......
gateway笔记
自定义断言新增一个Bean标记为@Component、继承AbstractRoutePredicateFactory类命名需要以RoutePredicateFactory结尾声明一个静态内部类来接受配置文件中的信息重写shortcutFieldOrder来映射配置文件中的参数重写apply方法下面是一个根据请求头和时间来决定......
搜索学习笔记+杂题（进阶二 dfs/bfs的进阶）
前言：由于搜索的题还是做的太少了，所以以后有可能会不定期更新。四、还是进阶的dfs/bfs相关题单：戳我1、dfs（1）meetinthemiddleP2962[USACO09NOV]LightsG颠覆了我对折半搜索的认知，果然，只要满足了折半搜索的几个性质，基本上都可以使用折半搜索来处理。首先我们拿到的是一张......
算法笔记
1.回溯法(Backtracking)应用：组合、排列、子集等组合型问题，0/1背包问题、图的着色问题等。时空复杂度：时空复杂度较高，指数级别。时间复杂度：O(2^n)或更高，其中n是问题规模。空间复杂度：O(n)或更高，取决于递归深度。特性：通过深度优先搜索遍历解空间。需要撤销选择，回溯到上一步......
学习笔记——ST算法
ST算法ST算法是一种运用倍增来解决RMQ问题也就是区间最值问题的算法。给定一个长度为\(N\)的序列\(A\)，ST算法能在\(\mathcalO(NlogN)\)的时间预处理后，以\(\mathcalO(1)\)的时间在线回答区间最值问题。设\(F_{i,j}\)表示序列\(A\)中下标在子区间\(\left[i,......
寒假学习day2
下载 spark 安装包选择自己Hadoop对应的版本，不然会不兼容spark下载链接2.解压tar-zvxfspark.2.3 3.删除安装包，修改解压后的文件名字rm-rf安装包名mvspark-2.3.4-bin-hadoop2.7spark 4.配置文件进入到spark目录下cdconf (1).修改配置文件名字：mv......
学习笔记——线段树
线段树（SegmentTree）1.建树首先我们要明白线段树中的每个节点都代表一个区间，而对于线段树中的每个内部节点\(\left[l,r\right]\)，它的左子节点是\(\left[l,mid\right]\)，右子节点是\(\left[mid+1,r\right]\)，其中\(mid=(l+r)/2\)（向下取整）。然后我们可以让根节点的编号为\(......

相关文章

赞助商

阅读排行