首页 > 其他分享 >2023.7.31-2023.8.6暑假第四周博客

2023.7.31-2023.8.6暑假第四周博客

时间:2023-08-05 11:44:47浏览次数:31  
标签:31 HADOOP yarn MapReduce 2023.7 SQL HOME 2023.8

 2023.7.31

一键启动脚本
启动:
$HADOOP_HOME/sbin/start-yarn.sh
• 从 yarn-site.xml 中读取配置,确定 ResourceManager 所在机器,并启动它
• 读取 workers 文件,确定机器,启动全部的 NodeManager
• 在当前机器启动 ProxyServer (代理服务器)
关闭
$HADOOP_HOME/sbin/stop-yarn.sh     单进程启停
除了一键启停外,也可以单独控制进程的启停。
• $HADOOP_HOME/bin/yarn ,此程序也可以用以单独控制所在机器的进程的启停
用法: yarn --daemon (start|stop) (resourcemanager|nodemanager|proxyserver)
• $HADOOP_HOME/bin/mapred ,此程序也可以用以单独控制所在机器的历史服务器的启停
用法: mapred --daemon (start|stop) historyserver    1. 一键启停脚本可用
• $HADOOP_HOME/sbin/start-yarn.sh
• $HADOOP_HOME/sbin/stop-yarn.sh
2. 独立进程启停可用
• $HADOOP_HOME/bin/yarn --daemon
控制 resourcemanager 、 nodemanager 、 proxyserver
• $HADOOP_HOME/bin/mapred --daemon
控制 historyserver   2023.8.1 今天联系了提交MapReduce任务到YARN运行

 运行了统计文件单词数的应用程序,成功输出了结果,另外计算了圆周率

2023.8.2

对数据进行统计分析, SQL 是目前最为方便的编程工具。
大数据体系中充斥着非常多的统计分析场景
所以,使用 SQL 去处理数据,在大数据中也是有极大的需求
的。 MapReduce 支持程序开发( Java 、 Python
等)
但不支持 SQL 开发  布式 SQL 计算 - Hive
Apache Hive 是一款分布式 SQL 计算的工具, 其主要功能是:
• 将 SQL 语句 翻译成 MapReduce 程序运行
基于 Hive 为用户提供了分布式 SQL 计算的能力
写的是 SQL 、执行的是 MapReduce    2023.8.3 如果让您设计 Hive 这款软件,要求能够实现
• 用户只编写 sql 语句
• Hive 自动将 sql 转换 MapReduce 程序并提交运行
• 处理位于 HDFS 上的结构化数据。
如何实现?  假设要执行: SELECT city, COUNT(*) FROM t_user GROUP BY city;   元数据管理
针对 SQL : SELECT city, COUNT(*) FROM t_user GROUP BY city;
若翻译成 MapReduce 程序,有如下问题:
• 数据文件在哪里?
• 使用什么符号作为列的分隔符?
• 哪些列可以作为 city 使用?
• city 列是什么类型的数据?   元数据管理
所以,我们可以总结出来第一个点, 即构建分布式 SQL 计算, 需要拥有:
• 元数据管理功能,即:
• 数据位置
• 数据结构
• 等对数据进行描述
进行记录
分布式 SQL 计算
元数据管理 ?    我们称呼它为: SQL 解析器,期待它能做到:
• SQL 分析
• SQL 到 MapReduce 程序的转换
• 提交 MapReduce 程序运行并收集执行结果  2023.8.4 今天主要部署了一下hive 首先是安装了mysql,这里出现了一个问题,就是当我按照命令安装的时候出现了问题 mysql的网页无法访问  

 因此又进行了一些操作 总之是安装并设置好了密码

另外要说的是 linux的操作是真的难用.....

之后就是修改了一下hadoop,需要让hadoop能够代理其他用户和网络用户

具体就是修改了core-site.xml这个文件

然后对hive进行下载和解压,这里我一开始从官网下,但是他的速度实在是太慢了

因此从清华大学的镜像网站下的

之后解压并设置了一个软连接 这些操作和之前部署其他内容都是一样的

之后就是配置mysql

export HADOOP_HOME=/export/server/hadoop
export HIVE_CONF_DIR=/export/server/hive/conf
export HIVE_AUX_JARS_PATH=/export/server/hive/lib

 然后对mysql进行了初始化 最后成功启动了hive   2023.8.5 今天主要是做了一下爬虫,爬取到了相关内容

 

 

标签:31,HADOOP,yarn,MapReduce,2023.7,SQL,HOME,2023.8
From: https://www.cnblogs.com/Arkiya/p/17591192.html

相关文章

  • openGauss学习笔记-31 openGauss 高级数据管理-索引
    openGauss学习笔记-31openGauss高级数据管理-索引索引是一个指向表中数据的指针。一个数据库中的索引与一本书的索引目录是非常相似的。索引可以用来提高数据库查询性能,但是不恰当的使用将导致数据库性能下降。建议仅在匹配如下某条原则时创建索引:经常执行查询的字段。在连......
  • 《安富莱嵌入式周报》第319期:声音编程器,开源激光雕刻机,自制600W海尔贝克无刷电机,车用
    周报汇总地址:http://www.armbbs.cn/forum.php?mod=forumdisplay&fid=12&filter=typeid&typeid=104 更新视频教程:更新第7期ThreadX视频教程:如何实现RTOS高效的任务管理,抢占式调度,时间片调度和零中断延迟(2023-07-31)https://www.armbbs.cn/forum.php?mod=viewthread&tid......
  • 2023.8.4
    学习java中的类面向对象与面向过程面向过程:强调的是功能行为,以函数为最小单位,考虑怎么做。面向对象:强调具备了功能的对象,以类/对象为最小单位类与对象的关系类:对一类事物的描述,是抽象的、概念上的定义对象:是实际存在的该类事物的每个个体,因而也称为实例(instance)面向对象......
  • 2023.8.5
    学习java中的类面向对象与面向过程面向过程:强调的是功能行为,以函数为最小单位,考虑怎么做。面向对象:强调具备了功能的对象,以类/对象为最小单位类与对象的关系类:对一类事物的描述,是抽象的、概念上的定义对象:是实际存在的该类事物的每个个体,因而也称为实例(instance)面向对象......
  • 9月8日还可抽8月31日已经结束的奖
    支付宝缺陷,运动服务-运动大富翁哈马大富翁幸运转盘,201909089月8日还可抽8月31日已经结束的奖 ......
  • KubeSphere 社区双周报 | 本周六上海站 Meetup 准时开启 | 2023.7.21-08.03
    KubeSphere社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过commit的贡献者,并对近期重要的PR进行解析,同时还包含了线上/线下活动和布道推广等一系列社区动态。本次双周报涵盖时间为:2023.07.21-2023.08.04。贡献者名单新晋KubeSphereCon......
  • 2023.8.4 杂题
    1.P5344【XR-1】逛森林先用并查集维护连通性。考虑如何建立传送门:如果使用树剖,强行线段树优化建图,那么空间开销过大,已经有2只\(\log\)。考虑使用倍增优化建图,对于一个点向上\(2^k\)的祖先的形成链都建一个点,模仿LCA的过程建边,空间是1只\(\log\).如果我们模仿ST......
  • 暑假集训D11 2023.8.4 补题
    题意给定一个数组\(a\).询问区间\([l,r]\)是否可以分成\(k\)段,每一段的和都是\(2\)的倍数(偶数)考虑前缀和\(sum\),如果\(sum[i]-sum[j-1]\)是偶数,那么\([j,i]\)一定是\(1\)个合法的区间.因此对于询问\(l,r\),可以统计前缀和的值为偶数的个数,......
  • 2023.8.2
    考完科三临时决定去海边啦十二点半睡四点半起来!!但是居然起得来在学校上课肯定是起不来的但是为了玩是肯定起得来的哈哈哈准备玩两天,第一天先去了白沙湾赶海,但是只抓住了很多寄居蟹和小螃蟹晚上的日落很好看!......
  • 2023.8.4 周五:MySQL相关命令
    1#展示数据库2showdatabases;34#创建数据库5creatdatabase+db1(数据库名称);67#如果创建同样名字的数据库,会报错,可以选择另一条判断语句;8creatdatabaseifnotexistsdb1;910#删除数据库11dropdatabasedb1(数据库名称);1213#如果删......